文档库 最新最全的文档下载
当前位置:文档库 › 网络信息检索技术

网络信息检索技术

网络信息检索技术
网络信息检索技术

网络信息检索技术

网络信息检索中,基本的检索技术有布尔逻辑检索、截词检索、位置检索、限制检索等。

一、布尔逻辑检索

逻辑检索是一种开发较早、比较成熟、在信息检索系统中广泛应用的技术。布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法,目前最常用的布尔逻辑运算符主要包括逻辑“与”(AND)、逻辑“或”(OR)、逻辑“非”(NOT)。

(一)逻辑“与”

逻辑“与”,也称为逻辑乘,用AND表示,是用来组配不同含义检索词之间的限定关系。检索词A、B以AND(或“*”)相连,即A AND B(或A*B),表示同时包含A、B两词的文献才是命中记录,因而逻辑“与”运算用于对检索词进行限定,从而缩小检索范围,提高检索结果的查准率。

例如,要查找children education(儿童教育)方面的文献,检索逻辑式可表示为“children * education”或者“children AND education”。运算的结果是同时含有检索词children和检索词education的文献才被检索出来。

(二)逻辑“或”

逻辑“或”,也称为逻辑加,用OR或者“+”表示,是用来组配同义或者同族检索词之间的并列关系。检索词A、B若以OR或“+”相连,即A OR B(或A+B),表示只要含有A、B之一或者同时包含A、B的文献都是命中记录。因而逻辑“或”运算可用于扩大检索范围。

例如,要查找“汽车”方面的文献,因为汽车在英语中可以用car或者automobile表示,所以为了将有关汽车的文献全部检出,避免漏检,检索逻辑式就可表示为“car OR automobile”或者“car + automobile”。运算的结果是含有car或者automobile任意一个或者同时两个的文献均被检索出来。

(三)逻辑“非”

逻辑“非”用NOT或者“-”来表示,是用来组配概念的包含关系,可以从原检索范围中排除一部分,因而使用逻辑“非”运算可以缩小检索范围。检索词A、B 若以NOT(或“-”)相连,即A NOT B(或A-B),表示只含有检索词A而不含有B的文献才是命中记录。逻辑“非”可用于缩小检索范围,但是不一定能提高文献命中的准确率。在使用时要注意,避免将相关的有用文献排除在外。

例如,要查找有关“energy(能源)”,但又不涉及“nuclear(核能)”方面的文献,检索逻辑式可表示为“energy NOT nuclear”“energy-nuclear”。运算的结果是含有energy,但不含有nuclear的文献将被检索出来。

这三种逻辑式的文氏图如下:

图3-1布尔逻辑文氏图

上面三种检索逻辑式是最为简单的布尔逻辑运算。在检索实践中,可以根据实际需要,组合使用多个布尔运算符,以准确表达检索主题。

布尔逻辑检索与人们的思维习惯一致,表达清晰,方便用户进行扩检和缩检,而且易于计算机实现,因此,在计算机信息检索系统中得到广泛使用。但是它无法反映检索词对于检索的重要性,无法反映概念之间内在的语义联系,因而检索结果不能按照用户定义的重要性排序输出。

使用布尔逻辑运算符的注意事项:

布尔逻辑检索在联机检索、光盘检索和网络检索中都有广泛的应用,但是不同的检索工具的布尔逻辑检索技术存在一定的差异,因此,使用布尔逻辑检索需要注意以下问题:

1、布尔逻辑检索的执行顺序。三种布尔逻辑检索运算符之间的运算顺序为NOT、AND、OR。有括号时,先执行括号内的逻辑运算。

2、不同检索工具的布尔逻辑检索有不同的表现形式和使用规则。首先,不同检索工具表示布尔逻辑关系的符号不同,有的用“+”、“-”表示AND、NOT,

有的用ANDNOT代替NOT(如Excite搜索引擎),有的要求运算符必须大写,有的则要求为小写形式;其次,不同检索工具的检索词之间的默认布尔逻辑关系不同,有的检索工具检索词之间的默认关系是AND,有的检索工具的检索词之

间的默认关系是OR;此外,不同检索工具支持布尔逻辑的方式不同,有的检索工具使用符号来实现布尔逻辑关系,一些检索工具则完全省略了任何符号,直接用文字和表格来体现不同的逻辑关系,如用All of These Words表示AND,用Any of These Words表示OR,用None of These Words表示NOT。

二、截词检索

截词检索是指在检索式中使用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化,用检索词的词干或不完整的词形查找信息的一种检索方法。并认为凡满足这个词局部中的所有字符的文献,都为命中的文献。在实际检索的

过程中,为了减少检索词的输入量,同时又扩大检索范围,保证查全率,可以使用截词检索。

截词的方式有多种。按截断的位置来分,可分为后截断、中截断和前截断;按截断的字符数量来分,可分为有限截断和无限截断。有限截断是指说明具体截去字符的数量,通常用“?”表示;而无限截断是指不说明具体截去字符的数量,通常

用“x”表示。

(一)后截断

后截断是最常用的截词检索技术,是将截词符号放置在一个字符串右方,以表示其右的有限或无限个字符将不影响该字符串的检索,是一种前方一致的检索。这种方法可以省略输入各种词尾有变化的检索词的麻烦,有助于提高查全率。

例如,输入“inform x”,则前6个字符为inform的所有词均满足条件,因而能检索出含有informant、informal、information、informative、informed、informer 等词的文献。而输入“inform??”,可检索出含有inform、informal、informed、informer 的文献。

(二)前截断

前截断是将截词符号放置在一个字符串左方,以表示其左方的有限或无限个字符不影响该字符串检索,是一种后方一致的检索。这种检索方法在各种词头有变化的复合词的检索中应用比较多,有助于提高查全率。

例如,输入“x magnetic”,可以检索出含magnetic、electro-magnetic等词的

文献。

(三)中截断

中截断是把截断符号放置在一个检索词的中间。一般地,中截断只允许有限截断。中截断主要解决一些英文单词拼写不同,单复数形式不同的词的输入。

例如,输入“c?t”,可以检索出含有词cat、cut的文献;输入“mod?????ation”可以检索出含有词moderation、modernization、modification的文献。

利用截词检索技术可以减少检索词的输入量,简化检索,扩大检索范围,提高查全率。但是,不同的检索工具有不同的截词规则,使用的截词符号也没有统一的标准,如Dialog系统用“?”,BRS系统用“$”,ORBIT系统用“#”等。

三、位置检索

位置检索,也称临近检索,主要是通过位置运算符来规定和限制检索词之间的相对位置或者检索词在记录中的特定位置来实施检索的技术。这里我们只介绍位置检索中的词位置检索。

词位置检索主要是利用位置逻辑算符限定检索词之间的位置,来反映要检索的信息概念。常用的词位置算符有(W)与(nW)、(N)与(nN)以及(X)与(nX)三类。

(一)(W)算符与(nW)算符

(W)算符是Word和With的缩写,它表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或字母,且词序不能颠倒。(nW)算符的含义是允许在连接的两个词之间最多夹入n个其他单元词。

例如,“VISUAL(W)FOXPRO”可以检出VISUALFOXPRO 或VISUAL FOXPRO;“control(1W) system”可以检出含有contro1 system、control of system 和contro1 in system的文献。

(二) (N)算符与(nN)算符

(N)算符是Near的缩写,它表示在此算符两侧的检索词必须紧密相连,所连接的检索词之间不允许插入任何其他单词或字母,但词序可以颠倒。(nN)算符表示在两个检索词之间最多可以插入n个单词,且这两个检索词的词序任意。

例如,“control(1N)system”不仅可以检出含有control system、control of systcm 和control in system 的文献,还可以检出含有system of control、system without control等的文献。

(三)(X)算符与(nX)算符

(X)算符要求其两侧的检索词完全一致,并以指定的顺序相邻,且中间不允许插入任何其他单词或字母。它常用来限定两个相同且必须相邻的词。(nX)算符的含义是要求其两侧的检索词完全一致,并以指定的顺序相邻,两个检索词之间最多可以插入n个单元词。

例如,“side (1X)side”可以检索到含有side by side的文献。

四、限制检索

限制检索是通过限制检索范围,从而达到约束和优化检索结果的一种方法。限制检索的方式有多种,常用的有字段限制检索和限制符限制检索。

(一)字段检索

数据库记录是由若干个字段组成的,字段检索是把检索词限定在数据库记录的特定字段中的检索方法,如果记录的相应字段中含有输入的检索词则为命中记录。字段限制检索可以缩小检索范围,提高查准率。

数据库中提供的可供检索的字段通常分为基本索引字段和辅助索引字段两大类。基本索引字段表示文献的内容特征,有TI(篇名、题目)、AB(摘要)、DE(叙词)、ID(自由标引词)等;辅助索引字段表示文献的外部特征,有AU (作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等。在检索提问式中,可以利用后缀符“/”对基本索引字段进行限制,利用前缀符“=”对辅助索引字段加以限制。

例如,“(information retrieval/TI OR digital library/DE)AND PY=2006”所表达的检索要求是,查找2006年出版的关于信息检索或数字图书馆方面的文献,并要求information retrieval一词在命中文献的TI(篇名)字段中出现,digital library一词在DE(叙词)字段中出现。

(二) 限制检索

限制符检索是使用AU(作者)、CS(作者单位)、JN(刊物名称)、PY (出版年份)、LA(语言)等限制符号从文献的外部特征方面限制检索范围和检索结果的一种方法。限制符的用法与后缀符相同,而它的作用则与前缀符相同。

例如,“aircraft/TI,PAT”表示检索结果只包含aircraft这一主题的专利文献。

限制符还可以与前、后缀符同时使用,这时字段代码与限制符之间的关系是逻辑“与”,即最终的检索结果应同时满足字段检索和限制符检索两方面的要求。

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

网络信息检索期末作业

期末作业 一、读书心得 1、结合《世界是平的》、《理解媒介》,谈谈有关网络新时代特征的看法。 小谈网络新时代特征 今时不同往日,今天的世界是以往的人类所不能想象的,就像我们不能够想象到几百年后这个世界是怎么样的一样。不过,有一点是可以肯定的,那就是这个世界会变得越来越小,因为这是一种趋势------全球化的趋势。 托马斯·弗里德曼在《世界是平的》一书中谈到,由于市场的全球化,特别是资本市场的全球化,整个世界经济呈现出两个特点:一是各国经济发展趋势的一体化,即世界各国的经济联系越来越紧密,千丝万缕,越来越荣辱与共,就像“蝴蝶效应”和“卡特尼娜”飓风;二是全球经济的敏感度更快更迅猛了,经济危机的负面作用将比流感来的还快,比禽流感的传播还要迅猛。确实,如今的世界各国经济联系越来越千丝万缕,越来越荣辱与共。 就以08年美国次贷危机为例,由于全球资本市场的一体化,美国这个全球最大经济体的一次感冒引发了整个世界经济的巨大震动。给他国经济造成了难以估量的巨大经济损失,甚至导致诸如冰岛一样的国家破产发生。在这样的一个世界中生活着,或许某一天你仰天长叹一口气,就引起了“卡特尼娜”飓风。你跺一跺脚,就引发了“东南亚海啸”。 在书中,弗雷德曼把这个世界描述为平的,称我们现在正处于为“全球化3.0”时代。“托马斯弗里德曼以他独特的视角讲述了世界正在变平的过程,他在书中援引了很多热点话题,介绍了诸多令人瞩目的市场和炙手可热的行业。开发源代码、外包、离岸生产、供应联合搜索技术等被描述成为铲平世界的10 大动力,而中国、印度等国家和一些站在全球顶尖位置的公司和机构,则被描述成为变平的世界中举足轻重的角色。他把所有的这一切编织在一起的时候,却揭示了一个正在发生的深刻而又令人激动的变化——全球化的趋势。它正随着那些动力,在地球各处勇往直前、势不可挡,世界也因此从一个球体变得平坦。” 从球体世界到平坦的世界的过程,我们周围的一切都在发生着天翻覆地的变化。在这个所谓的平坦的世界中,人与人,人与社会,人与自然之间的联系更加紧密不可分。人们常认为一个人死了对于这个世界是没有关系的,地球照样绕太阳转。但如若死一个爱因斯坦,那么虽然我们的地球还是会照样绕太阳转,但是我们的生活环境的改善工程就得往后给推迟个几十年,甚至是几百年。于是我们可以得出,人才是让世界变得平坦的一个重要因素之一。 全球化是资本、技术和信息超越国界的结合,这种结合创造了一个单一的全球化市场。国与国,企业与企业之间的竞争愈演愈烈。科学技术的进步和企业管理理念的转变,为我们提供了先进的经营(运营)手段和难得的机遇。随着互联网技术愈来愈渗透到社会发展的各个方面,数字的、移动的、个人的和虚拟的电子网络技术在经济全球化、企业经营从命令和控制向合作和联系转变过程中发挥着愈来愈重要的作用。在此过程中各种技术和工具共同创造了一个全新的平台,伴随着这个新平台的建立,商家和个人开始接受新的习惯、技术和流程,从一个垂直的命令和控制的价值创造模式转换到更

网络信息检索及其检索工具

摘要 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键字:网络信息检索;检索工具;因特网;web资源检索

目录 摘要 .......................................................................................................................................... I 1 信息检索的定义. (1) 2网络信息检索简介 (1) 2.1网络信息检索定义 (1) 2.2 网络信息检索的原理 (1) 2.3网络信息检索与传统信息检索的区别 (2) 2.4网络信息检索技巧 (2) 3网络信息检索工具类型 (3) 3.1非web资源检索工具 (3) 3.2web资源检索工具 (3) 4网络信息检索工具的功能 (4) 5网络信息检索展望 (5) 5.1网络信息检索的展望 (5) 5.2网络信息检索工具展望 (5) 参考文献 (6)

浅谈网络信息检索及其检索工具 1 信息检索的定义 什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 (1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询

网络信息检索与利用参考试题与答案

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借 助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。www:信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一 种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的 比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定 主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。 All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类 型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。联 合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单 位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工 作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1. 网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP(2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一

高中信息技术基础作业

高中信息技术基础作业 信息与信息技术-1 课程内容:教科版第1.1节和1.2节 教学目标: 1.通过列举身边的各种信息,感受信息的丰富性,形成对信息的感性认识。 2.结合具体例子描述信息的外在的重要特征,如价值性、时效性、可伪性、共享性、依附性等。 3.了解信息技术的发展历史,能描述几个重要阶段的基本特征。 4.结合信息技术的应用实例描述信息技术的发展趋势。 教学重点:理解信息的基本特征,了解信息技术的历史和发展趋势。 课标条目:描述信息的基本特征,列举信息技术的应用实例,了解信息技术的历史和发展趋势。 基础要求:能举例说明信息的特征,能结合实例描述信息技术的发展趋势。 条件要求:计算机教室、教室 1. 天气预报、市场信息都会随时间的推移而变化,这体现了信息的() A.载体依附性 B.共享性 C.时效性 D.必要性 答案:C 2. 信息不能独立存在,需要通过载体来呈现,这说明信息具有( ) A.载体依附性 B.传递性 C.时效性 D.真伪性 答案:A 3. 到目前为止,人类一共经历了( )信息技术革命,其中语言的使用是从猿进化到人的重要标志。 A.三次 B.四次 C.五次 D.六次 答案:C 4. 信息技术有着悠久的历史,它将向( )方向进一步发展。 A.商业化 B.大众化 C.人性化 D.人性化和大众化 答案:D 5. 下列关于信息技术的认识,错误的是( )。 A.信息技术是一把双刃剑,对社会既有积极的一面,还有消极的一面 B.青少年不用学习信息技术,只要一心读书就行 C.青少年不能过度崇拜信息技术,也不能盲目排斥信息技术 D.青少年学生应合理利用信息技术来做更多有意义的事情 答案:B 网络信息检索-3 课程内容:教科版的2.2和2.4 教学目标: 1.学会正确使用关键词搜索信息。 2.描述“全文搜索”、“目录索引搜索”和“在线数据库检索”的区别。 3.知道几种常见的搜索引擎的功能区别。 4.能够下载网页上的文字、图片、动画等信息。 教学重点:学会使用关键字搜索需要的信息,并且掌握一定的搜索技巧 课标条目:掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。 基础要求:能够熟练使用浏览器,对于信息有一定的基础认识,知道如何从要搜素的信息

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

网络信息检索方法与应用

网络信息检索方法与应用 摘要 随着Internet在全世界范围内迅猛发展,使人们获得有用信息越来越困难,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 关键词检索方法工具重要性 翻译summary With the rapid development of Internet in the world, to make people more and more difficult to obtain useful information, online information and huge numbers of people to obtain information contradiction between the increasingly prominent.Therefore, the retrieval of information technology and its development trends of the network to explore and research, is both urgent and practical issues.In this paper, the basic principle of network information retrieval techniques and tools of network information retrieval, information retrieval network status and other aspects of analysis, and the development trend of network information retrieval predicted, the network aims to find ways to improve information retrieval by means of and effective way to approach, and ultimately improve the effect of network information retrieval, making the network information resources can be fully effective use. Keyword Retrieval means Importance 一信息检索技术 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。 1 信息检索的广义含义

网络信息检索与利用考察题

陕西师范大学网络教育学院 考查题 题目网络信息检索与利用 姓名 学号 专业 批次/层次 指导教师 学习中心

作业一: 一、说明信息检索的步骤 答:(1)确定检索方向.这是使检索获得满意结果的先决条件,为此必须弄清所需信息的诸特征,如学科归属、主题概念、时间界限、文献类型、国别和语种等. (2)确定检索方法.一般有三种方法: a.正文法——从主题、分类、作者等途径查找. b.引文法:又叫追溯法,即着眼于文献所附的参考或引用文献目录.(SCI) c.交替法:正文法和引文法交替使用. (3)确定检索工具.根据学科专业、语 种等,选择一种或多种检索工具或检索引擎. (4)确定检索途径.主题、分类或作者 (5)实施检索.注意检出一批结果后,应浏览题目和文摘,判断是否满足要求,并加以筛选,若感到不满意,应及时修改检索策略,加以调整,再行检索,直到满意为止. (6)索取原始文献.检出结果通常是文献线索,还不是原始文献.为了索取原始文献,还须进行两项工作: a.辩识文献款目,包括文献类型、来源出版物名称等; b.查找原始文献的收藏单位,先从本单位、本地区入手,利用馆藏目录和联合目录(联网目录),找到原始文献收藏单位,即可通过借阅、复制或网上传送、馆际互借等途径获得文献.

二.简述信息检索的原理 答:1.信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻 2.信息检索是指从信息资源的集合中查找所需文献或查找所需文献中包含的信息内容的过程。 3.信息检索原理:信息的存储是实现信息检索的基础。这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等,首先要将这些原始信息进行计算机语言的转换,并将其存储在数据库中,否则无法进行机器识别。待用户根据意图输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与查询相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。 三、说明一次文献,二次文献和三次文献的特点和工用。 答:一次文献,就是人们通常所说的原始文献。属于这一类文献的有科技论文、会议文献,学位论文、研究报告、专利说明书、产品样本、技术标准等等。一次文献又称一级文献,区别于经过加工整理、重新组织的二、三次文献。一次文献大多发表在科技期刊上。哪些期刊主要刊登一次文献呢?一般说来,中文科技期刊凡是以?学报?命名的如《物理学报》、《数学学报》等,都主要刊登一次文献。同时,一次文献常常以图书形式出版。确定一篇文献是否为一次文献,主要是根

《网络信息检索与优化技术》课程大纲

《网络信息检索与优化技术》教学大纲 一、课程基本信息 1.课程名称:网络信息检索与优化技术(Network Information Retrieval and SEO Optimizing Techniques) 2.课程管理:信息科学学院 3.教学对象:计算机科学与技术专业 4.教学时数:总时数36学时,其中理论教学18学时,实验实训18学时。 5.课程学分:2 6.课程性质:专业必修 7.课程衔接: 1)先修课程一:计算机网络技术 重要知识点:计算机组成原理,TCP/IP协议,路由和交换设备,网络编程技术,计算机网络操作系统,信息系统安全评估 2)先修课程二:软件工程 重要知识点:网络编程,面向对象程序设计与开发,数据库技术 3)后续课程:综合实训、社会实践、顶岗实习 二、课程简介 《大数据舆情分析技术》课程是计算机网络专业学生的专业必修课,也是学生将来从事舆情分析专业工作的必修课程。在大数据时代,网络已成为政府和企事业单位了解民意的重要渠道,网络舆情作为当今民情民意反映的晴雨表,其巨大的影响力不但能够左右社会上重大事件的发展走向,也能影响社会公共管理的决策。事实上,网络舆情已经成为政府决策的重要参考依据之一。 《大数据舆情分析技术》课程涵盖的知识领域广阔,包括:新闻学、媒体传播学、公共管理学、舆情管理。本课程突出案例教学特点,将多学科知识融会贯通到一起,将创新的授课内容传授给学生,学生不仅仅是一个学习者,也是一个创新思考者,更是项目的主导者。有鉴于此,本课程将围绕以下5方面内容开展教学: 1)舆情研究的历史和发展趋势; 2)网络舆情传播规律; 3)舆情管控和舆论引导; 4)舆情检测平台应用。 5)电子政务与社会化媒体的管理 网络信息检索与应用课程是计算机网络技术专业学生必修的一门重要专业课。该课程内容包括信息检索的基础知识,互联网信息检索方法和技巧、发布信息优化技巧等。学生通过本课程的学习,能够快速、准确、有效地获取网络信息资源,掌握互联网发布信息的优化技巧。这对学生积累专业知识,提高自学能力,更加高效的利用互联网资源提供了有力保障

《网络信息检索》教案

“网上资源检索”的教学设计 温州市龙湾区永强中学陈占泽 一、教学设计背景信息 1.模块:高中信息技术基础 2.年级:高中一年级 3.所用教材版本:浙江教育出版社 4.学时数:1学时 二、教材分析 本课的课程标准内容: (一)信息获取 (2)知道信息来源的多样性及其实际意义;学会根据问题确定信息需求和信息来源,并选择适当的方法获取信息。 (3)掌握网络信息检索的几种主要策略与技巧,能够合法地获取网上信息。 (4)掌握信息价值判断的基本方法,学会鉴别与评价信息。 本课的《学科教学指导意见》内容:第2.3 网上资源检索 基本要求:1.掌握通过搜索引擎检索网络信息的方法。 2.掌握通过主题目录检索网络信息的方法。 发展要求:掌握网络搜索的技巧。 教材内容分析: 本课内容是在学生已经学习了浙江教育出版社《信息技术基础》教材第二章“信息的来源和获取”第1、2节内容基础上开展的网络资料检索教学,是学习信息组织和信息处理的基础,也是学生信息素养的一项基本技能。本课确定以“中秋节”为主题,用不同的搜索方法来获取

所需信息,同时渗透获取有效信息的思想方法。 三、学情分析 我们是普通高中学校,高一年级的学生对网络已经不再陌生,大部分学生已经具备了使用网络的感性经验,也知道用百度、谷歌搜索引擎查找信息。但在获取信息的过程中会遇到搜索结果多,筛选困难、搜索技巧单一等问题。因此教师要在学生原有的认知基础上,提升对搜索结果进行适当的鉴别能力。同时考虑到学生信息技能参差不齐,引导学生进行自主学习和小组协作学习。 四、教学目标 1、知识与技能: 1)掌握搜索引擎获取信息的一般方法; 2)了解评价因特网信息资源的三种主要方式。 3)能区别主题目录和搜索引擎的不同特点。 2、过程与方法: 1)通过搜索“中秋节”的相关信息,提高自主学习、解决问题的能 力; 2)通过对搜索结果的筛选,培养学生信息评价的能力。 3、情感态度与价值观: 1)通过搜索中国的不同传统节日信息,增进对传统文化的了解和认 同。 2)能负责任地、健康地使用信息,形成良好的信息技术使用习惯。 五、重点难点 1、教学重点:掌握搜索引擎获取信息的一般方法,掌握搜索引擎的使用技巧。

网络信息检索期末考试试卷及答案

绵阳师范学院历史文化与旅游管理学院 第一部分(基础知识部分,共三大题,共60) 一、填空题(每空1分,共30分) 1 ?信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2. 知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3. 情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4. 文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5 ?会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6 ?学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8 ?数据检索是指特定的数值型数据为对象的检索。 9. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10. Internet 是基于TCP/IP协议的网络。 11. 二级域名https://www.wendangku.net/doc/9d11792406.html,是指教育机构。 12. 目前WW环境中使用较多的网页浏览器有Microsoft公司的IE浏览器和360公司的360安全浏览器。 13. 每种网络信息检索工具一般由信息米集子系统、数据库和检索代理软件三部分组成。 14. 大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的: “ +”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中 不能包含的词汇。 15. 一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如, 用site表示搜索结果局限于某个网站。比如,用in title 表示到某个URL地址指定的网页标题内进行检索。比如,用UnJ表示到某个URL地址指定的地址内进行检索。 16. 搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.wendangku.net/doc/9d11792406.html,/ 17. CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh 需要下载安装CAJViewer全文浏览器软件或亚全文浏览器软件才能阅读这些资源。 18 .维普资讯网的高级检索中,查询语句“ K= (CAD+CAM*R=a械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM勺文献或文摘 19. OPAC中文或者英文的解释是联机图书馆公共检索目录 20. 国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi数字图书馆、中国数字图书馆等。 二「单项选择题(每题1分,共20 分) 1. 下面哪项不是情报构成的三 要素之一( D ) B .经过传递 D.通过购买获取 B?最主要的信息资源 D.按知识门类或专题组织、浓缩而 A ) o A. 期刊文献 B.科技报告 C?专利文献 D.学位论文 4. 报纸区别于其它文献的特征是( B )o A. 创新性 B.及时性 C.学术性 D.全面性 5. 有法律约束力和一定的时效性,经权威机构批准的规章性文献是 (A )o A.标准文献 B.学位论文 C?档案文献 D.科技报告 6. 一般存在相应二次文献的是( A ) A.期刊 B.产品样本 A.本质是知识 C?经过用户使用产生效益 2. —次文献是(A )0 A.最原始的信息资源 C.对文献的集中提炼和有序化 成 3. 下面哪一项是白色文献(

关于网络信息检索论文

关于网络信息检索论文 信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面我为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。 浅谈网络信息检索的现状及其发展趋势 【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。 【关键词】网络信息检索;现状;发展趋势 1、信息检索概述 信息检索(InformationRetrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。 随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 2、网络信息检索的现状 对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,

不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。 3、网络信息检索的现行模式 3.1网络全文数据库检索 网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。 3.2网络搜索引擎检索 搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查

网络信息检索听课记录

班级(学校)授课 教师教时1个课时 听课 时间 2012.9.18 下 午第二节课 科目信息技术基础课题 教学过程听课意见一、回顾旧知 ①、确定信息需求,需要确定信息的内容和信息的类型。 ②、确定信息的来源。信息的来源有: Ⅰ、纸质媒介;Ⅱ、电子媒介;Ⅲ、人;Ⅳ、事物。 在回顾的该知识点的时候,教师提供多个情景,让学生进行判断,所提供情景的信息来源分别为什么; (1)、去动物园拍照:信息的来源为事物; (2)、去三坊七巷:信息的来源为事物; (3)、去听讲座:信息的来源为人; (4)、去网络上的查找:信息的来源为媒介。 二、引入新课,新课教授 ①、常见的信息获取方法 讲解常见的信息获取的方法,说明信息来源的多样性决定了信息获取方法的多样性。常见的信息获取方法有: Ⅰ、阅读法:通过阅读报纸、杂志、图书资料获取信息 Ⅱ、观察法:从事物的属性和特征获取信息 Ⅲ、问卷法:发放问卷获取信息 Ⅳ、访谈法:与他人沟通获取信息 Ⅴ、电子检索系统:通过计算机网络获取信息 在众多的信息获取方法中,重点讲解了网络信息获取的方法。 常见的网络信息获取方法包括搜索引擎。 ②、搜索引擎的讲解 Ⅰ、什么是搜索引擎? 搜索引擎是指自动从因特网上搜集并保存信息,按照一定的规则进行编排后,提供给用户进行查询的系统。 Ⅱ、常见的搜索引擎有哪些? 百度,谷歌,搜狗,雅虎,新浪爱问等等。 Ⅲ、使用搜索引擎进行搜索的两种方式 (1)、目录检索 在课堂刚开始,课堂秩序良好,学生跟随老师的思路,回顾旧知,认真听讲,并回答教师提出的问题。 学生认真听讲,根据课本内容,思考回答教师在授课过程中抛出的问题。 学生踊跃回答生活中常用的搜索引擎,如百度,谷歌,雅虎等等。 网络信息检索听课记录表

网络信息检索期末考试试卷及答案

第1页,共6页 第2页,共6页 学校 院系 学号 姓名 ……答……○……题……○……不……○……得……○……超……○……过……○……此……○……密……○……封……○……线…○… 绵阳师范学院历史文化与旅游管理学院 一、填空题(每空1分,共30分) 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10.Internet 是基于TCP/IP 协议的网络。 11.二级域名https://www.wendangku.net/doc/9d11792406.html, 是指教育机构。 12.目前WWW 环境中使用较多的网页浏览器有Microsoft 公司的IE 浏览器和360公司的360安全浏览器。 13.每种网络信息检索工具一般由信息采集子系统、数据库和检索代理软件三部分组成。 14.大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的:“+”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中不能包含的词汇。 15.一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如,用site 表示搜索结果局限于某个网站。比如,用intitle 表示到某个URL 地址指定的网页标题内进行检索。比如,用link 表示到某个URL 地 址指定的地址内进行检索。 16.搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.wendangku.net/doc/9d11792406.html,/ 17.CNKI 数据库下载的全文格式很多,如:caj ,pdf ,nh ,caa ,kdh 需要下载安装CAJViewer 全文浏览器软件或Vip 全文浏览器软件才能阅读这些资源。 18.维普资讯网的高级检索中,查询语句“K=(CAD+CAM )*R=机械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD 或CAM 的文献或文摘 19.OPAC 中文或者英文的解释是联机图书馆公共检索目录 20.国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi 数字图书馆、中国数字图书馆等。 二、单项选择题(每题1分,共20分) 1.下面哪项不是情报构成的三要素之一( D )。 A .本质是知识 B .经过传递 C .经过用户使用产生效益 D .通过购买获取 2.一次文献是( A )。 A .最原始的信息资源 B .最主要的信息资源 C .对文献的集中提炼和有序化 D .按知识门类或专题组织、浓缩而成 3.下面哪一项是白色文献( A )。 A .期刊文献 B .科技报告 C .专利文献 D .学位论文 4.报纸区别于其它文献的特征是( B )。 A .创新性 B .及时性 C .学术性 D .全面性 5.有法律约束力和一定的时效性,经权威机构批准的规章性文献是(A )。 A .标准文献 B .学位论文 C .档案文献 D .科技报告 6.一般存在相应二次文献的是( A )。 A .期刊 B .产品样本 C .档案 D .报纸 7.常见的事实和数据检索工具书不包括( D )。 A .百科全书 B .年鉴 C .机构指南 D .杂志 8.在信息检索语言的分类语言中,国际上使用较多的分类表是( D )。

网络信息检索的工具

致力于打造高品质文档 网络信息检索的工具 [摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。[关键词] 信息检索中文搜索引擎存在的问题发展方向 随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型 搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。 目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。 1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。 2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。 机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。 3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。 二、现阶段中文搜索引擎存在的主要问题 1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。 2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

相关文档
相关文档 最新文档