信息检索术入门介绍——21世界高效法宝

2025-11-21 08:36:32

1、信息检索方法:

2、布尔逻辑检索:

        AND或*、OR或+、NOT或AND NOT或-(排除后面一个,要 A不要B),注意:布尔运算符有运算优先顺序的,如果多个连接词出现,则按照 优先级的顺序运算,但是可以用括号来达到先运算的目的,顺序是:NOT_AND_OR(用NOT排除,用AND添加一些)

信息检索术入门介绍——21世界高效法宝

3、邻近搜索:(又被称为位置限制检索,不同的数据库的检索连接词不同,

4、要求:

        第一种用法:1.PRE/0或者P/0顺序不可颠倒;2.这两个单词之间不可 插入其他的单词例如Wuhan P/0 University(但是可以插入 符号,例如查找之后的结果有Wuhan University(中间有空格的 );Wuhan-University(中间有-的)

5、       第二种用法:PRE/#或P/#,要求:1.与第一个一样;2.允许两个单词中间 插入一定数量的单词,就是‘#’这个地方的数子有几个,就可以插入几个单词, 不能超过#所指的上限,也可以少于或一个也不插入。例如:Wuhan P/1 University(允许插入一个单词)

6、第三种:NEAR/0或N/0,在这里不要求顺序

7、第四种:NEAR/#或N/#,顺序可以颠倒,第二,它们中间最多可以插入‘#’号个单词

8、短语检索:(精确检索:就是检索出来的,必须和我输入的一模一样,不能有任何 的差别)方法就是在输入的关键词两边加双引号,否则默认单词之间的连接运算符 为AND

以下几种情况需要:机构的名称、地名、专有名称等。

9、截词检索:截词符:*和?代替不同的部分,类似变量的感觉,(宽容检索:允许检 索出来的有一定的不同),用处:例如:找都以‘-ology’结尾的单词

方法:*加相同的部分,位置不定,要到在线词典去检索,例如:One-Look中

分为三种情况:

前截词:*ology

中间截词:一般中间截词用得更多的是问号,一个问号代表一个字 符,而*,通常代表0到无数个字符 ,例:wom?n

后截词:econom*

截词符也可以在单词的前后出现:*toxic* ;有时候,有的数据库和我们的表达刚好相反,*代表一个字符,?代表无数个字符

,所以我们在使用之前需要了解一下每一个符号代表的意义

10、

字段限制检索:

网址构成规律:例:

http://www.sim.whu.edu.cn/的数量越多,说明网页的层次越深,对网址的理解,要从右往

左去理解,也就是说右边的级别是最高的。第一个部分:cn代表国家和地区,这个

指的是中国大陆,中国香港用hk等;第二个部分:edu代表机构的类型,这里指的是

教育机构,.org指非盈利机构,gov指政府机构,.com指的是商业型机构;再往前面

:whu指机构名称;sim指的是武大学的一个子机构;整个来说就是:中国的教育

机构武汉大学的下面的信息管理学院。

网址学名:统一资源定位符

检索式:url:gov.cn(检索有多少个政府网站,gov表政府)

限制后面的检索词必须出现在题名字段当中:

title(ti):Wuhan University

py>=2010(找2010以来,出版的著作或者发表的论文)

la=english(指限定找英文的语种)

link:whitehouse.gov(用来查找链接到某一个网站的所有的网页)

11、还可以把字段检索和关键词进行逻辑‘与’组配:

admission AND site:www.harvard.edu(检索结果要限制在后面的这个网

址当中,也就是说,只能从这个网站去找资料,把前面的关键字和后面的结合在一起

,就是要求在哈佛大学的官网中找入学资料)

还可以吧多个字段进行组配,例如:把机构字段和人名字段组合在一起:

au=Wang li AND (CS=auhan Univ.)

前面就是au=xx,把它限定在作者字段当中,后面CS表机构来源

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢