文档库 最新最全的文档下载
当前位置:文档库 › 信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理
信息检索原理与技术考试大纲重点整理

《信息检索原理与技术》

第1章信息检索概论

(1)一次文献信息:是指作者以自己的研究成果为基础创作或撰写的、未经过加工的原始文献,如期刊论文、研究报告、学位论文等。

(2)二次文献信息:是指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书目信息,具有汇集性、工具性、综合性、系统性的特点。

(3)三次文献信息:是对一、二次信息综合、分析等深加工的产物,如评论、进展报告、百科全书、期刊书目等。(4)文献:记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。

(5)构成文献的要素:构成文献内核的知识信息、负载知识信息的物质载体、记录知识信息的符号和技术。

(6)文献的特征:知识性(文献的本质,离开知识信息,文献信息便不复存在);传递性(帮助人们克服时间与空间上的障碍,在时空中传递人类已有的知识,使人类的知识得以流传和发展);动态性(其所蕴含的知识随着人类社会和科技的发展在不断地、有规律地运动着)

(7)信息、知识和文献的联系:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容,它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的;知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的;文献是知识的一部分,是进入人类社会交流系统的活动着的知识。(8)文献信息流有序化阶段的三个环节:

①替代。描述文献特征,对一次文献信息进行不同程度的提炼或压缩,形成目录、文摘、索引等二次文献信息。从文献信息流的运动角度看,“替代”是文献信息流的流量、流向得到测度并合理调节。

②改组。从一次文献信息中提取数据、事实和有关结论,按照易于查阅的提醒重新组合,其改组的结果,产生了手册、名录、辞典、目录等类型的文献信息。其目的是使一次文献信息更容易被理解和使用。

③综合。利用二次文献对一次文献所包含的知识加以综合并融入到现有知识体系中去,成为整个知识体系的有机组成部分,产生的主要成果是不断再版的百科全书、专著、教科书及综述、评论性文章。

文献信息流失一个以研究活动为起点。按顺时针的线性顺序移动,是一次、二次、三次文献信息的演变过程。对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。

(9)信息检索:广义理解分为信息的存储与检索。信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。狭义的信息检索仅指该过程的后一部分。存储是检索的基础、检索是存储的反过程。信息检索的本质是用户的信息需求和一定的信息集合的匹配。

(10)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。

(11)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。检索知识包括主题词、分类号、著者、标题、机构、代码等。

(12)信息检索的一般原理:P7

(13)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子系统、查询子系统、用户与系统交互子系统、匹配子系统)

(14)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。

(15)检索系统的功能:报道功能、存储功能、检索功能。

(16)信息检索理论:标引理论、检索模型、检索结果的可视化。

(17)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。

第2章信息检索模型

(1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。

(2)信息检索模型的类型:P18

(3)布尔检索模型:采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻

辑运算来检索文献。

(4)布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT)

(5)布尔运算的运算次序:P24

(6)传统布尔检索模型的优缺点:

优点:1)逻辑运算符较少,便于用户学习。2)模式较易构造,可以通过简单的关系来体现检索项的联系。

3)可以将复杂的检索过程以简单的检索式表达出来。4)检索提问式较灵活,方便修改。

缺点:1)布尔检索中的关键词没有权重区别。2)检索结果分输出没有重要性是排序。3)查全率很难控制。

4)布尔检索要求用户具有很高的素质和语义提取能力。

(7)向量空间模型:一种基于统计学方法的数学模型。

(8)向量空间模型的工作原理:P27

(9)向量空间模型的优缺点

优点:1)采用自动标引技术与文献提供标引词。

2)采用部分匹配策略,使得在算法层面上的基于多值相关性的判断处理得以实现。

3)改变了布尔检索只有两种情况0和1的简单判断,标引词和文献的相关程度可在0和1之间取值,使标引者和检索者都可以比较灵活地定义标引词与文献的关系深度,改变了布尔检索模型的僵化的缺点。

4)由于其相似的程度作为检索的标准,可从量的角度判断命中与否,从而使检索结果更趋合理。

5)检索结果可以按照与提问的相关度排序输出,便于用户通过相关反馈技术修正提问,控制检索量。

6)布尔模型的逻辑关系依然可以使用,保留了直观性和方便些。

7)向量空间模型的灵活性使它有很好的可扩展性和可改进性,为以后的更加完善奠定了基础。

缺点:1)检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系。

2)由于对于任何一个提问度需要计算全部文献库中的每一篇文献,因此,计算量大,算法复杂性较高。

3)由于标引加权和检索加权是分离的,因此,随意性较大,难以保证质量。

4)有很多是假定的,在实际工作中有时会不能解决。

(10)扩展布尔检索模型:P31

(11)扩展布尔检索模型的工作原理:P32

(12)扩展布尔检索模型的优缺点:

优点:拥有矢量处理的思想,体现了加权的特点;继续保留布尔检索的直观的操作符,具有很强的描述能力;对于输出结果可以很好的控制和排序;通过调整权重参数的取值,可以灵活选择并得到不同的检索结果;便于区分强制性短语和严格的同义解释与试探性短语和较不严格的同义关系;与传统倒排文档一致,更易接受。

缺点:扩展布尔模型由于是集成了两种经典模型的一种改进的“集成化模型”,所以它不可避免的存在着臃肿、不够自然简洁的缺点,而且不是很普及,目前在信息检索领域使用较少。

(13)概率模型:一种基于概率论原理的用以解决相对不确定性的信息检索的信息检索模型。

(14)贝叶斯定理:P37

(15)概率模型的优缺点:

优点:文档可以按照他们相关概率递减的顺序来计算秩,还可以通过反复反馈结果和用户需求,使结果得到很好的调整,相对合理得多。

缺点:索引词权值计算方法没有考虑到词频加权因素。沿用了索引词之间相互独立的基本假设。开始时需要猜想把文档分为相关和不相关的两个集合,过程比较烦琐。

(16)概率模型在处理实际问题时的困难:初始检索文件阀值比较大,由检索式检索的相关文件数量相对于精确估计的概率而言太小。

(17)古典逻辑模型的特点:1)逻辑模型不是一个经典模型。2)逻辑检索要借助外部信息进行评价。3)逻辑检索对关键词的语境更加重视。4)对信息的联想法控制。5)逻辑检索具有不确定性。6)对多词一义的把握。7)适应信息的不完全性。

(18)逻辑模型的优点:逻辑理论具有很强的推理能力,将检索过程逻辑化可以使人们能从新的角度认识检索,并在逻辑化的基础之上建立演绎信息检索系统。在演绎信息检索系统中,用户可以增减可用规则,可以扩充或者缩小知识库,可以憎加或减少检索目标项,从而实现扩检和缩检。同时,通过因入更多的谓词、丰富系统的知识库、允许查询目标语句中包含更多的谓词,演绎信息检索系统也容易被扩展为用途更广的专家系统,使得信息检索系统智能化程度更高,功能更强,换句话说,基于逻辑模型,我们可以建立智能化的、提供多种检索入口的、便于扩展的信息检索系统、

(19)逻辑模型的缺点:在逻辑模型中,信息的重要程度这一特征并不能很成功地被表达出来。基于实质蕴涵的情报检索古典逻辑模型自然也并不能完全表达出文献d与信息需求q之间的真实联系。它关注的仅是前后件之间在真假方面的逻辑关系,而并不关心前件和后件中所涉及的信息延展性问题。由于查询是依靠推理来获得相关性的文献,因此推理过程越是不确定,获得的相关性文献就越少,而这样的现象在传统的逻辑检索模型中屡有发生。

(20)限词检索模型:通过限制检索范围,达到优化检索结果的方法。

(21)字段检索:把检索词限定在某个或某些字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。

第3章自动索引和文档组织

1、索引:著录书刊中的题名、语词、主题、人名、地名、事件及其他事物名称,并把它们按照一定的方式编排起来,指明出处是一种检索工具。

2、索引的发展历程:人工索引阶段、机辅索引阶段、自动索引阶段

3、索引的功能:检索功能、分解功能、梳理功能、聚类功能、追踪功能、导航功能、预测功能

4、常见索引的类型:主题索引、著者索引、名称索引、地名索引、题名索引、数字或代码索引、分类索引

5、索引的过程:为了方便查询而对信息指定索引款目的过程。包括信息采集、信息标引、建立索引。

6、索引建立的步骤:选题,建立主索引文件;对主索引关键词进行抽词倒排,建立目标格式文件;排序与归并。

7、信息标引分为受控标引和自然语言标引。受控标引指采用受控语言中的标识表达主题概念的标引方式,主要有分类标引和主题标引;自然语言标引是指采用自然语言语词作为标识来表达主题概念的标引方式。

8、分类标引:依据一定的分类语言,对信息资源的内容特征进行分析、判断和选择,赋予分类标识的过程。

9、分类标引的要求:准确性、充分性、一致性、适用性。

10、分类标引规则:基本标引规则、一般标引规则、特殊标引规则。

11、主题标引:对信息内容进行主题分析、确定主题概念,然后按照一定的词汇控制方式,为标引对象赋予恰当的语词标识的过程。

12、标引方式:根据文献或信息特点和使用需要确定的标引和揭示主题的形成。包括整体标引、全面标引、对口标引、综合标引和分析标引等。

13、标引方法:标题法、元词法、叙词法。

14、标引规则:

(1)选用标引词的基本规则:正式词标引规则;相对专指标引规则;标引方案优先顺序规则;适度标引规则;一致标引规则

(2)叙词组配标引的基本规则:叙词组配必须是概念组配;组配结果要求所表达的概念清楚;叙词组配中要注意次序。

15、自然语言标引:是一种采用自然语言作为标识表达主题概念的标引方式。

16、汉语语词的切分方法:词典分词法、切分标记的分词法、基于语法语义理解的分词方法、基于神经网络的分词方法。

17、自动标引:指利用计算机从各种文献信息中自动提取有关标识的过程。

18、层次聚类法:依据一种事先决定的相似性或非相似性度量和类间距离,经过计算建立聚类图,在根据聚类图决定分类结果。

19、文献自动分类:指首先分析被分类对象中的特征,将其与各种类别中对象所具有的共同特征或一定的分类标准、分类参数进行比较,然后将被分类对象划归为特征最相近的一类,并赋予相应的分类好的过程。

20、自动分类的基本流程:文本的预处理、文本特征的选取、分类模型的构建等。

21、决策树:P82

22、顺排文档(主文档):按照某一属性(字段)的字符顺序存入了数据库的全部记录。

23、顺排文档的检索:将用户检索表达式与顺排文档中的文献记录依次比较,就可以判断是否有匹配的文献记录。检索可以使顺序检索,也可以使分块检索和折半检索。

24、顺排文档组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护。但在查询的时候需要对所有的文档进行扫描以确保没有遗漏,这样就使得检索时间大大延长,检索效率低下。

25、倒排文档:将主文档中的可检字段(如主题词、著者)抽出,按某种顺序重新排列起来所形成的一种索引文档。

26、倒排文档的建立:索引词选择;对抽出的内容进行排序,便于归并相同内容;对相同内容进行归并,把合并后的内容放入倒排文档的主键字段,统计每一数据的频次作为目长,把每一内容后的记录号顺序放于记录号集合字段。

27、倒排文档的更新:P86

第4章词汇控制

1、词汇控制:通过对词形、词义和词间关系等的控制,达到信息源语言、标引语言和检索语言三者之间的有效沟通,从而实现信息的有效组织以及用户对信息的有效检索和利用。

2、词汇控制的原则:正确性、单义性、简明性、兼容性、系统性、稳定性、族性

3、词汇控制的内容:

(1)词量控制:对词表所收词汇的数量的控制。

(2)词量控制的方法:词汇组配、词汇替代、语义分解法、词汇合理选择

(3)词类控制:对词表所收词汇的种类的控制。

(4)词类控制的方法:确定选词范围、设置停用词表

(5)词形控制:根据主题标引和检索的需要对字面形式不同,但含义相同的词汇加以控制使一个主题概念只具有一个语词形式。

(6)词形控制的方法:控制语词形体、控制外来语和数字的用法、控制外文的词形、控制词序、控制语词长度。(7)词义控制:对多义词或同形异义词加以控制,使其意义明确,含义单一。

(8)词义控制的方法:加限义词、加注释、加定义

(9)词间关系控制:对语词之间的等同关系、属分关系和相关关系等加以控制,以形成一个便于揭示词间关系的语义网络。

(10)先组度控制:对语词先组程度的控制。

(11)句法关系控制:按照事先确定的句法关系,把若干词汇组合起来表示某一特定的论题,以避免产生语义含混的现象。

(12)句法控制的方法:P94

4、词汇控制工具包括分类词表、主题词表、分类主题一体化词表。

(1)分类词表:《杜威十进分类法》、《国际十进分类法》、《冒号分类法》、《中国图书馆分类法》

(2)主题词表:《医学标题表》、《汉语主题词表》

(3)分类主题一体化词表:是指分类系统与主题系统实现完全兼容,既能充分发挥各自特有的功能,又能互相配合,发挥最佳的整体效应。

5、词表评价体系:P115

/6、受控词表的使用:P119

第5章自动文摘技术

(1)文摘:用浓缩、简明的短文,描述信息载体的主要内容和原始数据,向使用者报道、传递最新信息和信息查询线索的一种工具。

(2)自动文献:利用计算机自动地从原始文献中提取文摘。按照文本分析方法的不同,自动文摘分为基于统计分自动文摘、基于理解的自动文摘、基于结构的自动文摘、基于模板的自动文摘。

(3)自动文摘的处理过程:第一步是文本分析,这个阶段是自动文献的基础,主要是寻找最能代表原文内容的成分;第二步是转化过程,通过摘录或概括的方法压缩原文;第三步是重组原文内容,生成文摘。

(4)基于统计的自动文摘(摘录型文摘):根据统计学的方法将权重高的句子作为文摘句。不足:摘要内容不完整;摘要内容不简洁;语句不连贯。

(5)基于统计的自动文摘一般步骤:待摘文本信息录入;词频信息统计;计算句子权重;选取候选句子;加工生成摘要。

(6)基于理解的自动文摘:建立在人工智能、自然语言处理的基础上的,它利用语言学知识对文字进行复杂的语法分析,语义分析和语用分析,获取语言结构,还利用相关学科领域知识进行分析、推理和判断,最后生成文摘。优点:简洁精炼、全面准确、可读性强。不足:语料范围限制;框架的拟定。P136

(7)基于理解的自动文摘步骤:待摘文本信息录入;文本分析(语法分析、语义分析、运用分析和信息提取);文摘初稿形成。

(8)基于结构的自动文摘;:将文本信息视为句子的关联网络,选择与很多句子都有联系的中心句子即可侯成摘要。(9)基于结构的自动文摘不足:P140

(10)自动文献的评价P140

(11)自动文献技术的研究进展P147

第6章用户接口

(1)用户接口,全称是系统-用户接口,又称用户界面、人机界面或人机接口,是指用户使用计算机系统的综合操

作环境,它是由人、计算机硬件和软件三者结合而成,承担用户与系统之间的交流功能,是两者之间实现通信不可缺少的模块。

(2)用户接口模块流程:识别用户;接收提问;提问校验;转化问题;检索;输出结果。

(3)用户接口的特征:支持多种类型的用户;支持多种用户认证方式;支持灵活的机构管理;支持灵活的用户授权管理;支持灵活的用户信息管理;支持对收费用户的计费。

(4)用户接口的功能:自动登录功能;访问多个数据库的功能;数据库选择功能;帮助功能;检索式构造功能;查询功扩展;相关反馈功能;下载和上载功能;用户视图定义功能;后处理功能;自然语言处理功能。

(5)用户接口的组成:面向用户部分(负责直接与用户交互,也称外部界面)、面向系统部分(负责与系统内部各部分交互,也称内部界面)、转换部分(负责内部界面与外部界面之间的信息转换)

(6)用户接口的主要形式:命令语言形式、菜单选择方式、表格填充方式、直接操纵方式、自然语言的人机对话方式

(7)用户接口设计的原则:易用性、一致性、易学性、宽容性、有效性、美观性、针对性

(8)用户接口设计的内容:用户接口需求分析;用户接口使用的便利性;用户向系统提问的查询方式;查询中的交互性;用户查询接口的简易型和检索能力的矛盾;多媒体查询接口的特殊性。

第7章信息检索系统的评价

(1)信息检索的相关性:检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。(2)相关性的本质特征:关系;直觉的;多维的;动态的。

(3)相关性判断:指信息检索中判断者在某一时刻对某种相关性的一种赋值操作。

(4)相关性判断标准:二元的判断标准、多元的判断标准、多维的判断标准。

(5)相关性的影响因素:信息源、信息需求的表示、时间与环境、用户判断者的特性。

(6)信息需求的表示的四个层次:真正的信息需求、感觉到的信息需求、查询请求、查询表达。

(7)信息检索系统评价的步骤:确定系统评价对象及目的;选择系统评价方式;制定系统评价方案;实施系统评价方案;评价结果生成评价。

(8)检索试验评价法的实施过程:抽样;测试;评价数据的收集和记录;数据处理与分析。

(9)查全率:衡量系统在实现某一检索作业时检出相关文献能力的一种测量指标。

(10)查准率:衡量系统在实施某一检索作业时检索精确度的一种测度指标。

(11)影响查全率与查准率的因素:相对值的的影响;检索方式的影响;时限的影响;检索过程中的影响因素。(12)涵盖率:用户已知的相关文档集合中被检索出的相关文档所占比率。

(13)新颖率:用户检索出的相关文档集合与以前未知的相关文档所占比率。

(14)相对查全率:检索系统检出的相关文档数量和用户期望得到的相关文档数量的比率。

(15)查全效果:用户期望得到的相关文档数量与为了得到这些相关文档而在检索结果中审查文档数量的比率。(16)搜索引擎的性能评价指标:P203

(17)信息检索系统评价试验:P206

第8章联机信息检索

1、联机信息检索:指用户利用检索终端,使用一些特定的指令和检索语词,提供通信网络与存储大量信息的检索系统联机,以人机对话方式从检索系统的数据库中查找所需的特定信息的过程。

2、联机检索与其他计算机信息系统相比的特点:信息质量好;检索效率高;多、快、全的检索功能;检索功能强大;检索结果输出方式灵活多样;检索内容新、实时性强。

3、联机信息检索系统的构成:检索终端、通信网络、联机信息检索中心。P226

4、联机信息检索系统的服务范围:回溯检索;定题服务;联机订购原始文献;传递电子邮件。

5、DIALOG系统具有的显著优势:信息量大;数据库的质量比较高;检索迅速方便;具有较强的回溯检索功能。

6、DIALOG检索实例:P242

7、联机信息检索系统的新发展:联入Internet、推出光盘产品、调整收费制度、利用网改进用户界面。

8、未来的信息检索系统应具有的特征:系统模式客户机/服务器化;完善的网络通信平台;智能化人机接口;具有多媒体采集、存储、加工、检索、传递能力;具有较强的网络互联能力;提供多种信息服务功能。

第9章因特网信息检索

1、因特网信息资源:以数字化形式记录的,以多种媒体形式表达的,分布式存储在因特网不同主机上的,并通话计算机网络通信方式进行传递的信息资源的集合,是从计算机技术、通信技术、多媒体技术相互融合而形成的、在因特网上可查找、可利用的资源。

2、网络信息资源的种类:

(1)按人类信息交流方式分为非正式出版信息、半正式出版信息和正式出版信息。

(2)按时效性分为网上出版物、动态信息、联机馆藏书目数据库、国际联机数据库。

(3)按IDG Book Word Wide 1996年出版物的《WWW指南》

(4)日本的户田慎一把网络信息资源分为7类。

(5)按因特网信息资源的组织应用形式分为万维网(WWW)信息资源、电子邮件信息资源、FTP信息资源、Telnet 信息资源等

3、因特网信息系统的组织形式:P250优势和劣势

(1)文件方式:网上数字化信息资源的一种主要存储形式,以文件方式组织的网上数据化信息主要有文档文件、图像文件、音频文件与视频文件等四种类型。

(2)超媒体方式:超文本与多媒体技术的结合,它将文字、表格、声音、图像和视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库自动航行,找到所需要的任何媒体的信息。(3)数据库方式:就是将因特网信息资源以固定的记录格式存储,并提供一些检索入口。用户通过检索入口,就可以找到所需要的信息线索,并利用超级链接功能直接链接到相关站点或一次信息本身。

(4)搜索引擎方式:因特网上对网上二次信息进行组织的主要形式,其实质是一种报道、存储网上一次信息的检索工具,

(5)主题树方式:将所选定学科领域的所有已获得的信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历。直到找到所需要的信息线索,进而通过信息线索直接找到相应的网络信息资源。

(6)图书馆编目方式:图书馆人员搜索、识别和注释那些对读者有用的资源,再根据针对网上资源的选择政策进行选择,然后编目成基于MABC格式的记录,使之成为图书馆集成管理系统的一部分。

(7)数字图书馆方式:P253

(8)虚拟图书馆方式:P254

4、因特网信息资源的特点:信息存储与传递的数字化和网络化;数量巨大,增长迅速;内容丰富,形式多样;变化频繁,价值不一;结构复杂,分布广泛。

5、因特网信息检索工具的结构:自动索引程序;数据库;检索代理软件。

6、网络信息检索工具的原理:P257

7、因特网信息检索工具的类型:

(1)按网络信息资源类型划分:WWW检索工具、非WWW检索工具

(2)按检索机制划分:关键词检索工具、分类目录检索工具、混合型检索工具

(3)按包含检索工具数量划分:单一型检索工具;多元型检索工具

(4)按检索内容划分:综合型检索工具、专题型检索工具、特殊型信息检索工具

8、因特网信息检索工具的功能:

(1)基本检索功能:布尔检索、截词检索、邻近检索与短语检索、字段检索、区分大小写检索

(2)高级检索功能:加权检索、自然语言检索、相关信息反馈检索、模糊检索、概念检索、智能化检索

9、与检索相关的功能:检索提问的修改与限制;按相关度排列结果;检索与浏览相结合;检索结果的翻译和多语种检索。

10、因特网信息检索工具的局限性:搜索引擎对信息的标引深度不够;搜索引擎的信息占有量不足;;搜索引擎的查准率不高;搜索引擎自身的技术局限;检索功能单一、缺乏灵活性;索引数据库更新困难;大量挤占昂贵的网络宽带和CPU资源;搜索引擎的分工协作有待加强。

11、因特网信息资源检索工具的发展方向:WWW检索工具主流化;搜索引擎的集成化;服务区域的全球化;服务领域的两极化;检索语言的一体化;检索功能的多样化;检索内容的深入化;系统维护的动态化;检索技术的智能化;用户界面的友好化。

第10章数字图书馆的信息检索

1、跨库检索:也称联邦检索、数据库检索、集成检索,是以多个分布式异构数据源为对象的检索系统,这种系统向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式并发地检索本地和广域网上多个分布式异构数据源,并对检索结果进行整合,在经过去重和排序等操作后,以统一结果呈现给用户。

2、跨库检索的必要性:数字资源数量的增加,增加了读者选择和熟悉数据库的时间;数据库内容的交叉重复,增加了读者信息鉴别和去重的时间;数据库知识的关联度较低,增加读者知识衔接的负担。

3、跨库检索的技术模式与基本原理:运用元搜集引擎的基本原理,即利用数据库的Web客户端进行统一检索;通过数据库接口软件与不同的数据库直接连接,即通过数据库接口软件直接访问异构数据库;不同数据库间的格式转换,即将不同数据库导入一个新的集成数据库中并提供服务;建立索引库,即将多个数据库的索引数据整合到一个索引库中;利用SFX实现数据库的无缝链接。

4、跨库检索的相关技术:

(1)公共网关接口技术CGI(2)开放式数据库互联网技术ODBC(3)JA V A数据库互联技术JDBC

(4)ASP技术和JSP技术(5)CORBA技术(6)XML中间件技术

5、跨库检索的基本过程:

(1)用户构造并提交检索式;

(2)提问等待过程,即系统依据用户的检索式对各异构数据库进行查询的过程;

(3)返回结果的加工策略,首先去除表面相关而本质不相干或相关度不大的数据,以提高检索的精确度;其次去除重复信息;最后对返回的不同格式、结构的数据进行处理,并按照统一的、符合用户需求的方式呈现给用户。

6、跨库检索策略应注意的方面:分析检索目的;选择信息资源;确定检索词;构造检索表达式;检索策略的转换;个性化服务的功能。

7、跨库检索实例分析:P281

8、跨语言信息检索技术(CLIR):指用户以自己所掌握的某一种语言构造检索提问式,计算机根据用户的检索要求在其他不同语种的信息中进行自动搜索,得到的检索结果甚至可以翻译成用户指定的语种。

9、源语言:在跨语言信息检索中,用户用以表达自己的信息需求、构造检索提问式的语言。目标语言:被检索的信息资源所使用的语言。

10、跨语言信息检索的类型:双语言信息检索、多语言信息检索、特定领域的跨语言信息检索、跨语言的多媒体信息检索。

11、双语言信息检索:用户用某种语言从另外一种语言表达的文献集中检索出所需文献信息的方式。

12、多语言信息检索:用户用某种语言从另外多种语言表达的文献信息集中检索出所需文献信息的方式。

13、特定领域的跨语言信息检索:检索对象设定为某一学科或某一主题领域的跨语言信息检索。

14、跨语言的多媒体信息检索:如跨语言的语音信息检索,其内容不仅包括文献信息检索技术、跨语言翻译技术,还有语音识别技术等。

15、跨语言信息检索在数字图书馆应用的必要性:数字图书馆信息资源的多样性;信息形式的多样性;用户的广泛性;服务的便捷性。

16、跨语言信息检索的主要方法:同源匹配、提问式翻译、文献翻译、中间语言技术、不翻译。

17、同源匹配:根据两种语言的语词拼写形式或读音相似度来判断其中一种语言语词的语义,不进行任何翻译。

18、提问式翻译:将用户提交的查询请求翻译成系统支持的多种语言,然后对不同语言的信息集进行查询。

19、提问式翻译的模式:基于词典的模式;基于双语语料库模式;字典——语料库混合方法;提问式构造方法;提问词再赋权方法

20、跨语言信息检索存在的主要问题:原始询问的歧义性和目标询问的多义性;提问中词的切分;检索结果的合并;专有名词的解释;语言的识别;检索结果的充分显示。

21、数字图书馆中的跨语言检索系统模型包括6个模块:用户查询服务模块、资源调度模块、跨语言检索模块、信息资源数据库模块、信息数据加工模块、元数据库模块。

22、数字图书馆中的跨语言检索系统模型的特点:

(1)元数据库相对集中,提供数据标准协助各模块完成相应的功能。

(2)数据加工系统实现对原始图书文献资料的采集、整理、数字化、标准化,最后将标准化多种语种数字存储到信息资料数据库中,形成有序的组织。

(3)信息资料数据库中数据采用分布式存储,可以根据信息语种的不同将整个多语种信息数据库划分为下一层各语种信息库,各语种信息库可以根据学科或研究领域进一步划分形成更下一层信息库。

(4)用户查询服务系统则根据用户提交的检索请求或服务请求,实现数字化信息资料的分布和利用。

(5)资源调度系统则实现网络环境下用户提问式和数据库中信息资料数据的识别统一调度。

(6)跨语言信息检索系统通过资源调度系统得到源自用户查询服务系统的提问检索式,首先实现提问式源语种的辨析,并选择合理的翻译器将提问语种检索式转化成信息语种提问式,然后在资源调度系统的调度下根据信息搜索引擎从多种语种信息数据库中得到符合要求的结果提交给用户,最后根据用户的反馈进一步提

高翻译的准确性和完整性,进而得到更有效、更能满足用户需求的结果数字化信息资料。

23、基于内容的检索技术:利用媒体对象的语义、媒体的视觉特征进行检索,它利用图像处理、模式识别、计算机视觉和图像理解等学科中的一些方法作为部分基础技术,直接对图像、音频和视频内容进行分析,抽取特征和语义,利用这些内容特征建立索引并进行检索是,多种技术的合成,具有广发的应用前景。

24、基于内容的图像检索原理:基于内容的检索系统一般由数据库生成子系统和查询子系统构成,每个子系统由相应的功能模块和部件组成,主要包括:图像的预处理、特征的提取、数据库系统、查询和浏览界面、匹配引擎、索引过滤器。

25、基于内容的检索的主要特点:利用媒体的内容特征进行检索;相似度检索,根据库中各个被检索单元(图像、镜头、旋律等)与检索要求的相似程度而返回检索结果;采用以示例查询的提问方式。

(1)直接从图像中提取语义线索和特征,并根据这些线索从大量存储在数据库的图像中查找、检索出具有相似特征的图像数据来,这突破了传统的基于字符表达式检索的局限。

(2)以相似比对取代吻合比对。

(3)采用直观是可视化提问方式。

(4)交互性强。

(5)能满足多层次的检索要求。

(6)检索效率高。

26、基于内容的静态图像检索技术:建立在特征分析和模式识别基础上的相似查询,所涉及的主要问题是对数据模式的描述和判别,查询过程是根据给定的模式对输入的模式进行匹配,判断的关键是相似度。

27、基于内容的图像检索方法:基于颜色的检索、基于形成的检索、纹理检索。

28、视频检索的主要技术:片段检测;图像拼接;主运动估计;层描述

29、知识检索:是综合应用信息管理科学、人工智能、认知科学以及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果。是针对信息检索中存在的语义性较差、智能性较低、知识性较弱等现状提出的一种基于语义和知识关联,运用知识处理技术和知识组织技术,实现信息查询语义化,智能化的一种高级信息检索方式。

30、知识检索的优点:

1)实现信息服务向知识服务的转化,向用户提供潜在的内容知识,以及分析预测后超前性领域成果或知识。

2)提供主动服务方式,自动优化用户需求,主动提供个性化检索。

3)面向用户、依据用户的需求及其变化、能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。

4)综合应用各类知识和各种高效的智能技术,全面提高检索效率。

31、知识检索与信息检索的比较:P304

①检索语言②搜索方式③检索模型④信息资源组织方式⑤检索效率

32、知识检索模型P306

(1)分类检索模型

(2)多维认知检索模型

(3)分布式检索模型

(4)基于本体的知识检索模型

33、基于本体的知识检索模型的主要特点:

1)以知识本体作为组织领域知识的语义模型;2)以知识本体的概念集对资源进行语义标引;

3)以基于本体的知识语言标引检索领域知识;4)以自然语言实现概念查询。

34、知识检索的步骤:首先,利用知识站点搜索引擎找到知识站点库,其次,利用知识条搜索引擎,根据用户的需求,从站点中的知识库提取相关知识条。

35、知识检索的实现方法:首先利用“加权关键词匹配定位法”定位知识站点;然后在“动态约束性概念网络”的基础上,从所定位的站点中找到所需的具体知识。

2.4《网络大数据库的信息检索》教学设计课题

信息技术说课稿 说课题目:《网络数据库的信息检索》 年级:高一年级教科书:《信息技术基础》 说课老师:王琳蝉 工作单位:屯昌县红旗中学 一、说教材: 1、教材地位和作用 本节容是教育科学《信息技术基础》教材第二章第四节“网络数据库的信息检索”的容。本节教材分三部分构成,一是概述,教材通过一个简单的实例来体验从网络数据库获取信息的一般过程,目的是为学习网络数据库的基本知识做准备性的铺垫。二是多样化的网络数据库,教材对这部分容介绍比较多,意在让学生充分体验网络数据库的多样性和学会对各数据库信息的获取方法。三是网络数据库评价,在本章的最后重点安排了网络数据库的评价,目的是进一步提醒教师,在信息获取活动中,要培养学生及时、科学地评价信息的习惯,这是提高获取信息资源质量的关键,也是积累信息获取经验的关键一环。在本课教材访问丰富多彩的数据库这个模块中,应适当引导学生对资源进行点评,引导学生探索数据库这一现代信息管理手段的特点,为第七章中数据库知识的学习打下基础。 2、学生状况分析 ⑴虽然学生在初中有信息课,但是作为副科没有参加升学考试,所以学生在课堂上多数的时间是玩游戏、聊天,没有纠正学习这门课程的学习态度。初中学生上了高中后,其信息技术意识层次不齐,这就要教师有计划培养学生的信息技术意识。 ⑵经过半个学期的学习,高一学生自觉性有所提高一般具备了一定的网络操作技能,这样对于本节课的学习已经有了相关知识上的准备。 3、教学目标 (1)知识与技能目标: ①学生了解网络数据库 ②学会简单的信息检索 ③体会到网络数据库的重要作用 ④运用网络数据库检索获取需要的信息容

(2)能力目标: ①培养学生利用网络数据库提高信息获取的能力 ②引导学生着重从资源获取的角度来审视数据库的价值 (3) 情感与价值观目标: ①在同学的互助下交流合作中,培养合作意识和合作精神 ②培养学生遵守网络道德,规、合法地获取网络资源 4、教学重点与难点: 学习重点:网络数据库的理解、网络数据库的多样性、网络数据库信息的检索 学习难点:对网络数据库信息的检索、学生要用科学的评价方式判断所得信息的准确性 二、说教学 教学过程实质上是学生主动学习的过程,强调激发学生的兴趣,力求形成学生强烈的学习动机和乐学、善学的学习态度。本节是采用任务驱动法导入新课,采取合作探究法解决提出的任务,对于同学们的作答采取了赏识教育法树立大家的自信心。再利用提问启发法去发现新的问题,从而导入本节的容。在新课网络数据库简介中,我采用了列举法和图表法加深对网络数据库概念的理解。网络数据库信息检索的一般过程和数字城市的介绍上都分别用了演示学习法,演示具体的各个操作步骤。网络数据库信息检索的一般过程和教育资源库的使用,都采取小组分工制合作探究法解决提出的任务。 三、说学法 教学指导在于提高学生的个性发展和全面发展。通过本节教学,主要使学生掌握以下几种学习方法: ①培养学生利用教材、网络自主学习的能力 ②培养学生动手操作能力 四、教学过程 1、导入新课 首先复习旧知识,使用任务驱动法导入新课

文献检索课题报告

《文献检索与利用》 课程报告 姓名:学号: 院系:班级: 课题名称(中英文): 中文: 我国农村土地流转问题的探究 英文: China rural land circulation of inquiry

指导老师:日期: 一、课题分析 1.为什么选择上述课题 原因:从专业角度出发,我国农村集体土地流转中存在许多问题,如流转不规范等。所以想进一步了解,学习关于农村土地流转。 2.选题来源(项目或工作选题、学习选题、兴趣选题) 来源:学习选题 3.希望文献调研达到的目的:本领域研究的历史、现状和趋势 通过文献调研,了解我国农村集体土地流转中的问题,找到解决途径,进一步激活土地流转市场。 【摘要】农村土地问题历来是我国“三农”问题所关注的核心。随着我国经济体制改革的不断深化,以及城镇化和工业化的快速发展,造成了农村土地资源的严重浪费,农地非农化现象日益显著。我国农业生产的比较利益低下,导致很多地区的土地被大量抛荒,农民的生产积极性低下,难以实现土地规模化经营的目标。导致这些现象的主要原因在于我国现行农村土地流转模式难以满足农村地区土地交易主体对土地市场发展的需求,在一定程度上遏制了农民参与土地流转的热情。目前,土地的家庭分散经营已难以满足农业产业化发展要求,土地承包经营权流转成为农地改革的现实需求。土地是财富之母,如何顺应城镇化之势,革除农村土地分散经营之弊,寻求破解“三农”难题之道,成为我国当前急需解决的重要问题之一。

【关键词】土地信托;土地流转;信托机制;配套措施; 【作者】庞亮;东北农业大学,农业经济管理 【出版日期】 4.选题过程中是否遇到问题是如何解决的 选题中遇到题目定位问题,最后通过同学之间的讨论决定的。 二、文献检索过程 1.所用的检索词,说明选词的过程。 检索词:流转土地现状对策集体 SU='土地'*'流转'andFT='问题探究' TI='土地'and KY='流转' 所用的数据库名称,说明选库理由。

信息检索复习资料

文献的定义 最简明的定义:记录有知识的一切载体。 定义:记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或固化在物质载体上的知识。 二次文献 将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。 特种文献 会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品资料、档案8种类型文献是一种介于图书与期刊之间的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而也被称为特种文献或灰色文献。 文献检索式 或:A or B 或 A + B;用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。 与:A and B 或 A * B; 用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查全率。 非:A not B 或 A – B;表示检索记录中凡含有A不含B的记

录被检出。能够缩小命中文献的范围,增强检索的准确性。 网上的文献格式 期刊、专著、论文集、学位论文、报告、专利论文、[国际、国家标准]、报纸文章、电子文献。 文献信息源 用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。文献信息源是信息源的主体部分,是信息搜集、存储、检索和利用的主要对象。 CA美国化学文摘数据库收录文献 期刊论文、会议论文、图书、学位论文、专利、技术报告。 什么数据库能检索会议文献 国外:ISI会议录数据库、会议论文索引数据库、OCLC PapersFirst 与ProceedingsFirst、STN联机系统中的CONF会议论文数据库、美国物理所电子会议录数据库、美国光学工程师学会会议文献数据库、美国航空航天协会电子图书馆。 国内:中国重要会议论文全文数据库、万方数据知识服务平台会议论文数据库、中国国家科技图书文献中心会议论文数据库、中国学术会议文献通报、上海图书馆会议资料数据库。

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

信息检索原理与技术资料整理

信息检索原理与技术 资料整理 华中师范大学 信息检索原理与技术

第一章信息检索概论 1.1信息检索基础简述 1.信息:事物发出的信号所包含的内容。 2.知识:知识是人类的主观世界对客观世界的概括和反映,是大量有组织的信息,是关于 事实和思想的有组织的陈述,提供某种思考的判断和某种实验的结果。 3.知识的分类: ①“知事”(know-what):指关于事实方面的知识,也可理解为know-when、know- where,即在什么样的时间(know-when)、什么样的地点或条件下(know-where) 能解决什么样的问题。 ②“知因”(know-why):指自然原理和规律方面的科学理论,知识的产生是在专门研 究机构如实验室和大学完成的。 ③“知道怎样做的知识”(know-how):指做某些事情的技艺和能力,被称为技术情报 和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术。 ④“谁以及是怎样创造知识的”(know-who):侧重对创造思想、方法、手段、过程及 特点等的了解。 4.文献:文献是记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。 构成三要素:①构成文献内核的知识信息 ②负载知识信息的物质载体 ③记录知识信息的符号和技术 特点:知识性(本质)、传递性、动态性。 分类标准: 内容加工程度划分: ①一次文献信息:指作者以自己的研究成果为基础创作和撰写的、未经过加工的原始 文献。 ②二次文献信息:指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书 目信息,它具有汇集性。 ③三次文献信息:是对一次、二次信息综合、分析等深加工的产物,如评论、进展报 告、评述、百科全书、年鉴、指南、期刊书目等。 载体形式划分:书写型、印刷型、缩微型、声像型、机读型五大类。 5.文献信息链:文献作为人类文化信息的承载物,从其产生、替代、反复被利用、再创造, 直至产生新知识,是一个不断演进的运动过程。 6.信息、知识和文献三者之间的关系(重点):信息>知识>文献 信息、知识和文献的联系在于:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容。它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的; 知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的; 文献是知识的一部分,是进入人类社会交流系统的运动着的知识。 具体来说,三者之间的关系为:信息>知识>文献。

信息检索与搜索引擎课程报告

《信息检索搜索引擎技术》期末考试报告 学期:2016-2017学年第一学期 任课教师:毛存礼 专业年级:计科133 学号:201310405339、 201310405326、 201310405330、201310405325 学生姓名:李然、毛子铭、张倩、黄枫

目录 一、系统概述 (3) 二、系统需求分析 (3) 2.1功能需求分析 (3) 三、程序实现 (4) 3.1 爬虫的实现 (4) 3.1.1 对网页进行分析 (4) 3.1.2编写爬虫 (5) 3.2索引的实现 (7) 3.2.1分词的实现 (7) 3.2.2索引的建立 (8) 3.2.3检索索引 (9) 3.3向量空间模型的实现 (10) 3.3.1向量空间模型概述 (10) 3.3.2建立向量空间模型 (11) 3.4利用Lucene打分机制对文档打分 (13) 四、测试 (14) 五、心得体会 (17)

一、系统概述 随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Intenet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关指针。 用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。本系统基于HTMLUNIT框架,构建爬虫,基于LUCENE框架,构建索引,利用向量空间模型向量化表示文档间的相关性,利用LUCENE 给相关文档打分。 二、系统需求分析 2.1功能需求分析 该系统分为四个功能模块: (1)爬虫模块 (2)索引模块 (3)向量化表示模块 (4)打分模块 具体实现分工如下: ①爬虫模块:该模块采用Htmlunit框架,主要负责爬取网页内容,在 本地建立文档库,以便于索引功能模块,将文档库里的文档内容建立成索引。 (毛子铭所做) ②索引模块:该模块采用Lucene框架,功能分为两块:一是建立索引, 将爬取的内容建立成索引。二是检索索引,即提供给用户检索索引。(张倩所做) ③向量化表示模块:该模块采用向量空间模型,其功能是将查询文本和

信息检索复习资料

信息检索复习要点 第一章 一、情报和文献 1.情报(P4 1.2.3) 情报就是为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。 知识性、传递性、针对性是情报的3个基本属性。 2.文献(P5 1.2.5) 记录有知识的一切载体叫文献。 知识内容、信息符号、载体材料、记录方式是文献的4个基本要素。 二、文献按载体划分(P5~6 1.3.1) 1.印刷型 2.微缩型 3.视听型 4.电子型 三、文献级次划分(P6 1.3.2) 1.零次文献:非正式出版物或非正式渠道交流的最原始的文献。如手稿、演讲、听取经验交流,甚至包括口头言论。 2.一次文献:依据作者本人的研究或成果制作成果创作的文献,即通常所说的“原始文献”、“第一手资料”。如图书、期刊论文、科技报告、学位论文、专利说明书等。 (原创性) 3.二次文献:按一定的方法对一次文献进行加工,使之有序化而形成文献。如目录、索引、文摘等。(有序性) 4.三次文献:一般是围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩等深度加工而形成的文献。 如各种评述、进展报告、教科书、词典、年检、百科全书等。(综合性) 四、ISBN和ISSN(P7~9 1.3.3) 1.ISBN(国际标准书号)

(1)它是由国际标准化组织1972年公布的一项国际通用的出版物统一编码。它是由10位数字组成,共分4段【组号、出版社号、书序号、校验码(1位数,ISBN最后一位数值)】。 (2)校验方式:将ISBN 1~9位数字顺序乘以10、9、8、7、6、5、4、3、2这9个数字,将这些乘机之和再加上校验码,如果能被11整除,则这个ISBN号是正确的。2.ISSN(国际标准连续出版物编号) (1)实现对全世界文献的管理。由8位数字组成分2段,每段4位数字。中间用“-”隔开前7位是刊名代号,最后一位是计算机检验位。 (2)检验方式:将ISSN 1~7位数字顺序乘以8、7、6、5、4、3、2这7个数字,将这些乘机之和再加上检验号,假如能被11整除,则这个ISSN号是正确的。 第二章 一、信息检索(P12) 从广义的角度讲,文献检索是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需的文献过程,亦叫信息检索。而人们一般所指的文献检索,是指狭义的文献检索,即最后一个过程——信息检索,文献的查找过程。 二、信息检索的类型(P13 2.1.2) 1.按照检索的对象的不同,人们将信息检索分为文献检索、数据检索和事实检索。2.按照检索的方式的不同,人们还常将它分为手工检索和计算机检索。 三、图书的四大常用检索点(P20 2.3.1) 1.书名 2.作者 3.主题词 4.分类号 四、检索语言的基本种类(P19 2.3) 检索语言是文献检索中用了描述文献特征和表达信息提问内容的一种专门化的人工语言,是信息组织和文献检索共同使用的语言。 检索语言大致分为分类语言(P19)和主题语言(P24)两种。 (1)最早的图书分类法(P20 2.3.1 2) 我国西汉刘向、刘歆父子所著的《七略》。它首创的“七分法”对后世我国的分类思想的形成和发展影响极大。 (2)四库全书(P21 小资料) 纂修与清乾隆年间的《四库全书》,从收集编纂到成本,共用10年(1173-1782),集我国古代文献典籍之大成。共著录图书3461种,79309卷,36000余册。《四库》将各种书籍分为经部、史部、子部、集部。各部下分若干类,类下细分为属。 (3)全球使用最广的分类法(P21 2.3.1 3) 《杜威十进分类法》(DDC)是当今世界上影响最大、用户最多的图书馆分类法。

信息检索复习资料

第一部分:基本常识 1.文献按照出版形式可分为哪几种类型?举例。 图书、期刊、报纸、特种文献。 图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等 期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。 报纸:人民日报 特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案 美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA 报告4、能源部的DOE报告。 2现代科技文献具有的特点哪些? 答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降 3什么是核心文献、相关文献和边缘文献? 答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。如核心期刊等。相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。 4 什么是文献?构成文献的有哪四个要素? 答:文献的定义是记录有知识的一切载体称为文献。构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。 5 电子文献的主要类型和文件格式是什么? 答: (1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分; (2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的gif文件、jpg文件以及标记文件格式的html文件和xml文件之分; (3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分; (4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分; (5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类; (6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。 6 如何针对不同时间要求的文献信息,选用不同的文献信息源? 答:以信息利用者的观点,针对不同时间要求的文献信息应该使用不同的文献信息类型。例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸、期刊、广播、电视等媒体;两个月之前到十年之内的信息应主要通过网上图书、期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。 7什么是ISSN和ISBN?

网络数据库的信息检索教案

《网络数据库的信息检索》教学设计 一、教材内容分析 本节内容是教育科学出版社《信息技术基础》教材第二章第四节“网络数据库的信息检索”的内容。本节教材分三部分构成,一是概述,教材通过一个简单的实例来体验从网络数据库获取信息的一般过程,目的是为学习网络数据库的基本知识做准备性的铺垫。二是多样化的网络数据库,教材对这部分内容介绍比较多,意在让学生充分体验网络数据库的多样性和学会对各数据库信息的获取方法。三是网络数据库评价,在本章的最后重点安排了网络数据库的评价,目的是进一步提醒教师,在信息获取活动中,要培养学生及时、科学地评价信息的习惯,这是提高获取信息资源质量的关键,也是积累信息获取经验的关键一环。在本课教材访问丰富多彩的数据库这个模块中,应适当引导学生对资源进行点评,引导学生探索数据库这一现代信息管理手段的特点,为数据库知识的学习打下基础。 二、学生情况分析 学生已具备了一定的网络操作技能,对本节课的学习已经有了相关知识上的准备。在前面的课中,学生在不经意中已经使用到了网络数据库,比如小说网、音乐网等等,只是自己不知道而已。本节课选用有较强的代表性而学生一般都没有使用过的网络数据库。 三、教学目标分析 (1)知识与技能目标:

了解网络数据库;学会简单的信息检索;运用网络数据库检索获取需要的信息内容 (2)能力目标: ①培养学生利用网络数据库提高信息获取的能力 ②引导学生着重从资源获取的角度来审视数据库的价值 (3) 情感与价值观目标: ①在同学的互助下交流合作中,培养合作意识和合作精神 ②培养学生遵守网络道德,规范、合法地获取网络资源 四、重难点分析 重点:理解网络数据库、网络数据库的多样性、网络数据库信息的检索难点:对网络数据库信息的检索、评价 五、教学策略设计 教学过程实质上是学生主动学习的过程,强调激发学生的兴趣,力求形成学生强烈的学习动机和乐学、善学的学习态度。本节是采用情景设置法,从“神奇的化学实验——大象牙膏”入手,吸引学生的学习兴趣,引导学生进入欢快的化学学习之旅。然后设置疑问:你能帮化学教师搜索到不同版本的教学资料吗?进而导入本节的内容——利用网络数据库来解决问题。在进行网络数据库新课内容时,通过设计自主学习、合作探究、任务驱动及成果展现四个大环节,让学生去认识、感受、体验、评价网络数据库。使学生对网络数据库信息检索这一重难点从感性认识提升到理性理解,从而实现本节课的学习目标。 六、教学资源与媒体准备

《信息检索》课程报告 2

《信息检索》课程报告 姓名毛辰宇学号 2013160021 专业软件工程请就自己的选题撰写一份课程报告。 一、选题简介 1.课题名称(中文和英文)。 中文名称:网络安全 英文名称:Network security 2.选题来源(项目或工作选题、学习选题、兴趣选题)。 学习选题 3.为什么选择上述课题? 即将进行网络安全相关的研究。 4.希望文献调研达到的目的。 希望对网络安全有答题的了解。 5.选题过程中遇到哪些问题?是如何解决的? 内容比较多,选择一些比较全面的论文阅读比对。 二、文献检索过程 1.所用的数据库名称,说明选库理由。 维普数据库,使用的比较多。

2.所用的检索词,说明选词的过程。 网络安全、网络安全技术 3.利用查全率和查准率两个指标,对检索结果进行分析比较,说明 如何制定一个较为满意的检索式。 由检索词和检索系统支持的检索算符(逻辑算符、位置算符等)构成,是检索策略的具体体现。检索策略(Information Retrieval Strategy)是指为实现检索目标而制定的方案。具体说来,包括选择数据库、确定检索方法、明确检索途径、选择检索词、明确检索词间的关系等。 三、资料阅读 1.提供所阅读的资料列表(篇名、作者、出处)。 【1】孟令印,网络安全技术与应用[J].中国科技博览 【2】樊丽娟 .关于计算机网络安全技术的思考[J].商情 【3】臧伟. 信息系统中安全问题的探讨[J]. 科技创新与应用 【4】王洋. 无线网络安全技术分析[J]. 中国电子商情:科技创新【5】叶宗琴. 计算机网络安全技术浅析[J]. 中国电子商情:科技创新 2.阅读笔记(要求每条笔记要提供文摘的篇名、作者、出处)。 阅读了《网络安全技术与应用》,山东省农村信用社联合社菏泽办事处,2014,了解了本文中对当前网络安全技术的答题描述。

信息检索资料题目整理版

选择题:(10*2'=20') 1、用__A__检索2004年中国经济领域的统计数据、政策、会议、新理论。 A 《中国经济年鉴》 B 《中国统计年鉴》 C 《中国大百科全书》经济卷 D 《经济管理大辞典》 2、用__C__检索金融统计数据、中国宏观经济月度分析报告、食品行业报告《2003年奶业形势分析》 A 《中国人民大学报刊全文数据库》 B 维普《中文科技期刊数据库》 C 国研网 D CNKI或者万方数据库的会议论文数据库 3、检索2004年经济方面的信息资料应该用2005年出版的年鉴. 4、已知参考文献:徐经长等,国际会计学,北京:中国人民大学出版社,1999。要找原文,使用_ D_检索《国际会计学》的收藏情况。 A、维普《中文科技期刊数据库》 B、中国人民大学报刊全文数据库 C、国务院发展研究中心信息网 D、图书馆的馆藏查询 5、用__C_检索世界范围的专利摘要比较方便 A、美国专利商标局数据库 B、日本专利局数据库 C、欧洲专利局esp@cenet数据库 D、世界知识产权组织//ipdl.wipo.int/PCT电子公报 6、用_A_检索α—呋喃甲醇羧酸酯的合成,含有碳元素和氢元素的化合物的英文综合学术性文献。 A、外文EBSCO数据库 B、外文农业类CAB文献数据库 C、外文农业类AGRICOIA数据库 D、外文食品科技文摘数据库FSTA 7、综合性检索工具 维普《中文科技期刊数据库》、CNKI的《中国期刊全文数据库》、万方《中国数字化期刊群》8、专利信息检索工具 使用最广收费专利数据库:thomson scientific公司derwent系列专利数据库 免费专利数据库:欧洲专利局、美国专利商标局、IBM专利数据库 9、综合性检索工具 欧洲专利局、《DELPHION知识产权信息网数据库》、thomson scientific公司derwent系列专利数据库 10、单一检索工具包括专利公报、专利索引、各国专利局的专利数据库 中国国家知识产权局、美国专利商标局网站专利数据库 11、商标检索工具:中国知识产权网、中国商标网(提供商标近似查询、商标综合查询、商标状态查询)、美国专利商标局(提供商标电子查询系统)、国际商标协会 判断题:(10*2'=20')

信息检索复习题

信息检索复习题 第一部分各章思考题 第一章思考题 1.信息、知识、文献的概念及相互关系是什么? 2.信息环境问题主要体现在哪些方面? 3.信息素质的内涵包括哪些内容? 4.按文献的载体形式、出版形式可分别将文献分为哪几种类型? 5.按文献的加工程度可将文献分为哪几种类型?它们之间的关系是什么? 第二章思考题 1.文献的外部特征和内容特征分别有哪些? 2.检索方法及各自的优缺点有哪些? 3.常用的检索技术有哪些? 4.简述布尔逻辑算符AND、OR和NOT在编制检索提问式中的作用。 5.请为检索课题“航空或航天发动机的设计和制造”编制检索式。 6.在一个具有1000篇文献的检索系统中检索某课题,用一特定检索策略查该课题时输出文献60篇。经分析评估,发现该系统中共有该课题相关文献50篇,检出的文献中实际相关文献只有30篇,求查全率、查准率。 第三章思考题 1. 你是如何认识数字图书馆时代的馆藏资源的? 2. 请做排序:TP3/2;I247.5/123;I247.5/55;TP316/4;O13/5;TM925/44;G252.7/178;TP39/3。 3. 谈谈你对数字图书馆的认识。 4. 请检索你在图书馆近一年的借阅历史。 5. 请检索丁元霖主编的《商品流通企业会计》在中国国家图书馆是否有收藏,收藏在哪些书库? 第四章思考题 1.试比较分析中国知网(CNKI)、万方数据知识服务平台、维普资讯网中“中文期刊数据库”的异同点。 2.查找你所在单位人员撰写的你所学学科专业的硕士论文或博士论文3篇。 3.用检索实例说明中国知网(CNKI)标准检索、高级检索、专业检索、引文检索、学者检索的检索方法。 4.查找洗衣机方面的中国专利2项。简述检索方法和步骤。 5.查找参考文献写作规范的国家标准。 第五章思考题 1.结合你所学专业列出你所熟悉的外文电子图书数据库,并简述其检索方法。 2.简述你所学专业的常用外文电子期刊数据库有哪几种,并以其中一个数据库说明其检索方法。3.简述ProQuest学位论文数据库检索方法。 4.你常用的外文专利数据库有哪些?并简述其检索方法。 5.如何查找国外标准文献,请查找一条和你专业相关的国外标准。

《信息检索》课程报告

《信息检索》课程报告 姓名李春俊学号 201641600018 专业计算机技术 请就自己的选题撰写一份课程报告。 一、选题简介 1.课题名称(中文和英文)。 中文名称:MSP430系列单片机的特征和应用 英文名称:The feature and application of the MSP430 serial MCU 2.选题来源(项目或工作选题、学习选题、兴趣选题)。 项目 3.为什么选择上述课题? 需要了解MSP430系列芯片的功能特点和应用范围 4.希望文献调研达到的目的。 了解MSP430系列芯片详细的参数;相比于其他MCU的优势;在可穿戴设备中的应用情况。 5.选题过程中遇到哪些问题?是如何解决的? 起初不了解MSP430系列芯片,以具体某型号芯片查找文献,获得的文献资料很有限,扩大选题范围可以获得更多资料。

二、检索词的选择 1.所选课题的主题词有哪些? MSP430单片机 2.对应的上位词、下位词、同义词、反义词和近义词 MSP430单片机: 1)上位词:嵌入式处理器 2)下位词:MSP430低功耗混合信号处理器 3)同义词:嵌入式微处理器、DSP处理器、片上系统 4)反义词:高功耗复杂指令集处理器 5)近义词:高性能、低功耗、精简指令集处理器 三、文献检索过程 1.所用的数据库名称(至少选择两个中文,两个英文数据库)。 1)CNKI数据库 2)万方数据库 3)IEEE/IET Electronic Library (IEL)数据库 4)Web of Science数据库 2.针对以上所选数据库,构造不同的检索式进行检索。 (1)在CNKI数据库中检索 用检索式一:“MSP430单片机+应用”,找到161 条结果 [1]李鹏,王辉. 基于MSP430单片机的多通道温湿度记录仪的特点及应用[J]. 电子技术与软件工程,2016,(07):251.

信息检索与利用复习资料(整理2016.1)

信息检索与利用复习资料 (一)、名词解释 1、INTERNET(因特网):Internet:因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。 2、SCI: SCI是科学引文索引的英文缩写首字母。SCI是一个引文数据库,收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊。 3、报刊:报刊是指报纸和期刊的总称,是属于连续出版物,它具有统一的题名,定期或不定期以连续分册形式出版,有卷期或年月标识,并且计划无限期连续出版。报纸以刊载新闻和评论为主,期则围绕某一学科和某些学科或某一研究对象,由多篇文献资料编辑而成。 4、标准文献。广义的标准文献包括标准的原始文件及检索工具书等。狭义的标准文献仅指带有标准号的标准、规范、规程等技术标准。 5、超文本:超文本是在普通文本的基础上增加了链接功能的一种文本。用户只要用鼠标点击页面上有特殊颜色或有下划线的文字时,就会出现新的解释或访问更多的信息。 6、分类途径:是指按文献内容的学科分类体系查找文献信息的途径。一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样的编排的结果可将同一学科的文献集中,便于按学科查找文献。 7、技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 8、检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 9、竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。 10、科学文献:文献:凡是人类的知识用文字、图形、代码、符号、声频、视频等方式和技术手段记载在一定载体上的每一件记录,统称为文献。而把记录科学知识的每一份物质载体称为科学文献, 11、目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 12、全文搜索引擎。全文搜索引擎是使用自动索引软件来搜集和标引网页资源、建立数据库,以Web形式提供查找网络资源的一种网络信息检索工具。 13、索引:索引是将一种或一批相关书刊内容中的篇目、字句、人名、地名、事件、分子式等摘出,按一定的方法编排,并指明其在原书中的位置,为读者提供查找线索的工具书。索引是记录期刊、报纸、文集、论丛、会议录等文献所包含的论文题目、撰述者,将其摘录出来,并注明其出处,按照一定的原则编制而成,形成查寻文献篇名的检索工具。 14、图书馆目录:图书馆目录是提示、识别和检索馆藏文献信息的工具,也是宣传图书、辅导阅读的工具,是读者迅速、准确、有效地检索所需文献资料的向导,被喻为“打开人类知识宝库的钥匙”。 15、网络信息资源。以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 信息检索。是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。 16、网络信息资源:以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 17、网站:网站是某些单位或个人为了一定目的、为用户提供某些方面的服务,在Internet设置的站点,这些服务主要有Web服务、Ftp服务和Email服务等。 18、文献检索:以文献或其索引、文摘为检索对象,目的是核实已知文献的不确切项目,如著者名,年代、出处等,或查检某课题原始文献的线索及它们的具体收藏情况。 19、文献信息资源:文献是记录有知识的一切载体。文献信息资源是以文字、图形、符号、声频、视频等方

网络信息检索试题及答案

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有()特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

文献检索复习题及参考答案

医学文献检索复习资料 第一章 一、信息、知识、情报、文献(选择、判断改错) 1、信息:是物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反映,它提供了客观世界事物的消息、知识,是事物的一种普遍属性。 2、知识:是人类在认识和改造客观世界实践中获得的对事物本质的认识和经验的综合,是人们通过实践对客观事物及其运动过程和规律的认识。 3、情报:是指人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。 情报的重要属性:知识性、传递性、效用性。 4、文献:是指以文字、图象、公式、声频、视频、代码等手段记录或描述在一定的物质载体上,并能起到存储和传播信息情报和知识作用的一切载体。(记录有知识的一切载体。)文献由三个基本要素构成:内容上的知识或信息;揭示和表达知识信息的表示符号;记录信息符号的物质载体。 信息、知识、文献、情报的包含关系:信息、知识、情报必须固定在一定的物质载体上,形成文献后才能进行传递,才能被人们所利用,文献是信息、知识、情报存储、传递、利用的重要方式。信息可以成为情报;信息是知识的重要组成部分,但不是全部;情报是知识或信息经传递并起作用的部分。 第二章医学文献信息资源 一、文献信息资源类型的划分 1、按载体类型划分: (1)书写型文献:古代文献、书法作品、手稿、书信、原始记录等 (2)印刷型文献:图书、期刊、会议文献、政府出版物、专利文献、技术标准、产品资料、学位论文、技术档案 (3)缩微型文献:微缩胶卷、微缩胶片、微缩照片等 (4)视听型文献:唱片、录音带、录像带、科技电影、幻灯片、电视片等 (5)电子型文献: 电子型文献按发布形式分为:①参考数据库:A.书目数据库:中药在线、CBM、PubMed B.文摘和索引数据库 ②全文数据库 ③事实数据库 ④搜索引擎/分类指南 ⑤网络学术资源学科导航 ⑥FTP资源 ⑦其他 2、按出版类型划分: (1)图书:是现代出版物中最普通的一种类型,有封面、书名、作者、出版地、出版者,并装订成册。在每一种正式出版图书的版权页或其他明显部位都标有一个由10位或13位数组组成的国际标准书号ISBN,形式如ISBN 978-7-117-10172-1,这是一种国际通用的出版物代码,代表某种特定图书的某一版本,具有唯一性和专指性,读者可借此通过某些文献信息系统查询某种特定图书。图书基本上有两类:一类是供读者阅读的图书,包括专著、教材;一类是供读者查阅的图书(工具书)。 (2)期刊:是一种连续出版发行的文献。(期刊的内容新颖、出版周期短,通报速度快,信息量大,是情报的主要来源。) 期刊特点:①有固定的名称(刊名) ②相对固定的版式、篇幅和内容范围 ③定期连续出版发行 ④按一定的卷期号或年月顺序号连续出版 每种期刊均有一个由8位数字组成的国际标准连续出版物号ISSN,例如 ISSN 0317-8471 前7位代表期刊代号,末位是校验号。

网络信息检索方法与应用

网络信息检索方法与应用 摘要 随着Internet在全世界范围内迅猛发展,使人们获得有用信息越来越困难,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 关键词检索方法工具重要性 翻译summary With the rapid development of Internet in the world, to make people more and more difficult to obtain useful information, online information and huge numbers of people to obtain information contradiction between the increasingly prominent.Therefore, the retrieval of information technology and its development trends of the network to explore and research, is both urgent and practical issues.In this paper, the basic principle of network information retrieval techniques and tools of network information retrieval, information retrieval network status and other aspects of analysis, and the development trend of network information retrieval predicted, the network aims to find ways to improve information retrieval by means of and effective way to approach, and ultimately improve the effect of network information retrieval, making the network information resources can be fully effective use. Keyword Retrieval means Importance 一信息检索技术 信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。 1 信息检索的广义含义

相关文档
相关文档 最新文档