文档库 最新最全的文档下载
当前位置:文档库 › 3.信息检索与检索语言

3.信息检索与检索语言

3.信息检索与检索语言
3.信息检索与检索语言

文献信息检索与利用课程教案

授课内容:第三讲信息检索与检索语言(见第二章P13)

3.1文献信息检索的定义与类型

3.1.1定义

信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要查找所需信息的过程。

3.1.2. 信息检索的分类

⑴按检索对象划分:文献检索、数据检索和事实检索。

文献检索:是根据课题研究的需要,利用检索工具和检索技术方法,查检获取文献信息的过程。

数据检索是以数据为对象的一种检索,即查寻包括在文献中的某一数据、公式、图表以及某一物质的化学分子式等等。数据检索是一种确定性的检索。

事实检索是以事实为对象的一种检索。即查寻某一事物发生的时间地点及过程等。

⑵按检索手段划分:手工检索、机械检索和计算机检索。

手工检索,主要是利用目录、文摘、索引、题录等手工检索工具等方法来查找和获得信息。在信息检索中,手工检索是基础,检索工具是主体。

机械检索,主要是借助力学、光学、电子学等技术手段进行信息检索。

计算机检索,利用计算机检索系统、数据库资源和信息检索标识查找文献信息的过程。

⑶按检索途径划分为:直接检索、间接检索。

直接检索是从信息源或信息载体中直接获取信息。

间接检索是通过检索工具的指引间接获取所需信息。

3.1.3信息检索系统P15

手工检索系统

穿孔卡片检索系统

缩微品检索系统

光盘检索系统

计算机检索系统

网络化检索系统

3.2科技信息检索的意义与作用

随着科学技术不断地发展,科技信息也随之快速增长,尤其是

互联网的出现网络信息更是如潮水汹涌。在现代社会生活中,人们对信息的需求要比对能源、材料的需求更加迫切。其主要意义有: 1.把握科技发展动态、提高科研成功率

2.节省研究人员查找文献的时间,提高科研效率

3.掌握获取文献的方法,提高情报意识和情报观念

3.3信息检索的发展与趋势

3.3.1现代文献信息检索主要经历了如下两个阶段:

1.成熟、定型与稳定阶段

十九世纪初,文摘刊物从一般刊物中分离出来,单独编辑出版发行。索引工作与文摘刊物紧密结合。检索语言和索引方法也开始确立并发展较快,分类法、标题法、分面组配分类法对索引工作都产生了深远影响。与此同时,参考咨询工作也出现了。

2.迅速、全面发展阶段:

计算机技术、现代通信技术应用于文献检索领域,使文献检索获得了突飞猛进的发展,具体表现在以下几个方面:

⑴面向任务和跨学科的文摘刊物开始涌现。

⑵文摘索引工作向集中、协调和合作的方向发展。成立了国家科技信息机构,集中管理和协调文摘索引工作,建立本国的检索刊物体系,同类刊物的合并;国与国之间合作;世界范围的合作等。

⑶电子计算机检索迅猛发展。1957年,许多文摘索引刊物实现了计算机编制。机读数据库可用于计算机检索,借助于现代通信网络,检索服务可以覆盖世界各个角落,实现全国乃至世界范围的信息资源共享。

⑷检索理论和方法体系初步形成。文献检索研究迅速与数学、计算机科学、系统科学、语言学、信息论等学科结合起来,大大扩展了研究领域,研究水平也从现象描述进入实验研究,新的文摘索引方法、检索语言、检索技术、信息产品和评价方法不断涌现。

⑸文献检索领域进一步扩大。到二十世纪后期,全文检索迅速发展,特别是在新闻、法律和商业等领域;社会科学和人文科学领域

的文献检索逐步实现现代化;经济和商业领域信息检索服务的发展势头已超过科技领域;非文献型数据库和商情数据库的数量及利用率已超过常规的文献数据库。

⑹信息检索实现网络化。信息技术的发展使互联网迅速广泛普及,信息流通无论是在时间还是空间上都得到了极大的改善,人人可以从网上检索到信息,同时也可以把自己的信息送上网供其他人检索,信息检索真正进入了网络化阶段。

3.3.2 信息检索的趋势

信息检索随着科学技术的进步而不断发展,今后趋势是:

1.全文检索日益重要。全文检索是信息检索领域中的一次革命,它以文本数据为主要处理对象,根据资料内容而不是外在特征提供检索手段。与常规数据库检索采用结构化数据查询不同,全文检索不仅要查询结构化数据,而且还要查询非结构化数据。与标引检索相比,全文检索提供了全新的、强大的检索功能。目前全文检索已在图书馆、信息中心、报社等机构广泛应用。

2.信息检索与计算机技术的关系越来越紧密。随着计算机技术的日新月异,许多先进的科技成果在信息检索领域得到了广泛应用。以下技术都与信息检索有密切关系:

⑴人工智能技术。解决全文检索的非结构化查询的问题,除了应用自然语言理解、处理、切分词技术以外,人工智能技术也起到了很好的支持作用,它使得全文检索系统具备更强的认知能力,从而避免“误查”和“漏查”。

⑵ Client/Server体系结构。采用该结构可使检索系统具有良好的可伸缩性和可选择性,在实际多用户环境中获得很高的性能,这在网络化建设的今天,具有重要意义。

⑶多媒体技术。信息的表现形态目前正在从单一文字向多媒体发展,多媒体技术处理信息的范围从标准的文本数据,扩大到各种图像、图形、视频和音频信息,从而实现文字、图片的统一管理、存储、检索和输出。接收、处理、存储、显示图文一体化的信息资料,是检索系统进一步扩大应用领域的必然趋势,对多媒体的支持,使得检索系统更加丰富多彩。

⑷网络技术。目前网络信息检索有两种方式,即因特网方式和本地网方式。如上所述,随着因特网的飞速发展,全文检索技术成为信息系统中不可缺少的关键功能和必要手段,而因特网搜索引擎以全文检索为核心技术,从而成为网络时代的主流技术之一。虽然因特网方式速度较慢,但其检索范围要大很多。本地网方式是利用专门检索软件检索本地网中的信息,与搜索引擎相比,这类软件一般具有更强大的检索能力和更灵活的检索方式,检索速度比因特网方式快得多,它广泛应用于图书馆和其他信息服务机构,但检索范围相对要小。

3.检索语言由多样化向一体化、中介化方向发展。检索语言的兼容性和互换性日益受到重视,各种—体化语言、中介语言、词汇兼容互换技术和后控技术陆续出现并投入应用。

4.索引方法向自动化、智能化方向发展。信息处理和传播进一步电子化,文字处理与编辑、建库、出版发行、检索、原文提供等环节以联机链方式走向—体化,已成为信息生产与流通的新模式。联机检索正与办公自动化系统连成一体,从单纯的文献线索检索已逐渐发展到全文检索和文字、声音和图像一体化检索。

5.检索服务和信息产品更加多样化。从面向学科和任务的服务发展到面向问题和面向办公室与家庭的个性化服务。单一的机读型工具日益增多,有些原始文献只以机读形式出版,如某些电子期刊或电子图书等。

3.4检索语言P23-

检索语言是情报检索系统存储与检索所使用的共同语言。通常用人们约定的词汇和规则组成。检索语言亦称标引语言、索引语言。在检索过程中,检索语言起着重要的作用。它是沟通信息存储和检索两个过程中标引人员和检索人员双方思路的桥梁,又是编制检索工具的各种索引的依据,也是计算机化的信息存贮检索系统用以表达文献主题概念和检索课题概念的人工语言。如果没有检索语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同内容的信息需求表达取得一致,检索就不可能顺利实现。因此,为达到识别或检索目的而由信息工作系统专门编制、使用的一种控制语言

从某种意义上来说,它是一种信息识别符号体系。

3.4.1定义:

检索语言:是从自然语言中精选出来并加以规范化的一整套词汇、符号,用以对文献内容和信息进行概括或表示其概念关系的标识体系。

组成:检索语言由词汇和语法组成。

词汇:指登录在类表、词表中所有标识--分类号、检索词、代码等标识,是可识别语词。

语法:指如何创造和运用标识来准确表达信息内容和特征,以有效实现信息检索的一整套规则。

检索语言具备的三个基本要素:1有一套专用字符来构造词汇;2 有一定数量的基本词语用来表达基本概念;3 有一套专用语法规则,用严格的句法手段和词法对词汇进行控制,以准确表达各种各样的概念。

要把存贮和检索联系在一起,检索语言所表达的要领应该是唯一的。这就是说,表达概念要与所表达的事物一一对应,尽量减少一词多义和多词同义的现象,要使其在该检索语言中具有单义性。一种较艰的检索语言还应具有对多种检索要求的广泛适应性,保证有较高的检全率和检准率。具有对多种学科和多种信息类型的适应性;具有与其他检索语言的兼容性和国际通用性。

3.4.2类型

各种检索语言为人们提供与信息交往勾通的樗和识别语符,它们的基本原理是一致的。不过,由于在表达各种概念及其相互关系时所采用的方法不同,因而也形成了不同的检索语言类型。

检索语言类型:主题检索语言、分类检索语言、代码语言三种主要类型。

主题语言(关键词、标题词、叙词、单元词)

分类语言(由学科类目类号组成)

代码语言(国际标准书刊号、邮政编码、标准号、专利号、经济合同号等)

1 分类语言:分类是区别事物及其相互关系的一种思想方法,是人们思维活动中的一种本能。人们在实践中广泛运用这种方法来认识和区分周围的事物,从日常生活到探讨当代科学的发展,无不与分类有关。图书馆和信息管理部门在对文献资料进行有效地管理过程中,分类的方法应用的及为广泛。这是因为读者一般都是在某个专业范围或某个学科中从事科研、教学、生产和管理活动,习惯于从学科和专业出发获取知识和信息。因此用分类的方法管理文献信息是有益的。

分类的原理:就是对知识概念的划分。任何知识都是一个概念,任何一个概念都有内涵和外延。概念的外延所指的是一类事物,而“类”是具有共同属性的事物的集合。一类事物除了具有共同属性之外,还有许多不同的属性,即同类事物并不完全相同,不同的属性可以使用权同类事物进一步划分,所以“类”是可以划分的。

分类语言是用分类号来表达学科体系的各种概念,将各种要领按学科性质进行分类和系统排列。具体地说,它是以学科分类为基础,按照概念划分的原理,将知识要领从具体到一般、从简单到复杂、从低级到高级逐级划分,每划分一次就形成一批并列的概念----下位概念,它们同属于一个补划分的概念----上位概念。如“固体力学”这个类可以划分为“材料力学”、“结构力学”、“弹性力学”、“塑性力学”等子类。“固体力学”被划分的类,即上位类(上位概念),它所划分出的几个子类,即下位类(下位概念)。这几个下位要领之间体现的是平行的关系,而上下位类之间则是隶属关系。每个类目都用分类号作为标识,每个分类号就代表特定的知识要领体现这种分类体系的就是分类(法)表。

例:《中国图书馆图书资料分类法》分类简表的五大部22个基本大类

A 马、列、毛泽东思想 N 自然科学总论

B 哲学 O 数理科学和化学

C社会科学总论 P天文学、地球科学

D 政治、法律 Q 生物科学

E 军事 R 医药、卫生

F经济贸易 S农业科学

G文化教育体育 T工业技术

H 语言文字 U交通运输

I 文学 V航空航天

J艺术 X 环境科学

K历史传记 Z综合科学

二级类目举例:

I 文学

I0文学理论 I22诗歌

I1世界文学 I242古代作品

I2中国文学 I24小说 I246近代作品

I247当代作品I3/7各国文学 I26散文

T 工业技术

TB一般工业 TN无线电电子学、电信技术

TD矿业工程 TP自动化技术、计算机技术

TE石油、天然气工业 TQ化学工业

TF冶金工业 TS轻工业手工业

TG金属学与金属工艺 TU建筑科学

TH机械、仪表工业 TV水利工程

TJ武器工业

TK能源与动力工程

TL原子能技术

TM电工技术

2主题语言:是一种直接表达文献的主题概念的标识语词。将这些作标识的语词按字顺排列并使用参照系统来间接表达各种概念之间的关系,这就是主题语言。根据词语的选词原则、组配方式、规范方法,主题词语言可分为标题词语言、关键词语言、叙词语言。

⑴标题词语言:也称作标题词描述语言,是以标题词作为文献

内容和检索依据、完全先组式规范化的语言题语言。所谓标题词,是指从自然语言中选取经过规范化处理,能表示事物概念和文献主题内容的完整名词术语(词、词组或短语)。在编制词表时,事先将一级标题词和二级标题词加经固定组配,所以它属于先组式规范化的检索语言。

⑵关键词语言:是一种用自然语言来做标识的检索语言。这里讲的自然语言是指从文献的题名、文摘或正文中抽出来的非规范化的实意词。在主题语言中,只有关键词是不做规范化处理的,也不受词表控制。它的原理是将出现在文献标题、摘要或正文中具有实质意义的关键词排在检索入口,注明文献地址,从而达到满足用户检索的要求。

⑶叙词语言:

叙词:是指从自然语言中优选出来并经过规范化处理、从概念上不可再分的基本概念单元的名词术语。是对信息内容主题进行描述的后组式检索语言。

检索时利用这些表达概念单元的叙词进行组配,以表达一个复杂的概念。叙词语言是近代用途较文,既适用于手工检索,又适用于计算机检索。

3.代码语言

代码语言是指用字母符号编码的检索语言标识,如:标准号、专利号、合同号、身份证号、国际标准书号ISBN,国际标准刊号ISSN、邮政编码、书刊邮发代号等。

检索语言的种类虽多,但常用的手工检索工具中所用的检索语言也只有体系分类语言、关键词语言和叙词语言。如何运用这些语言查找文献的方法,我们将在以后的章中介绍。

3.4.3 主题词的选词原则

1.使用反映主题内容性质的实词,主要是名词

2.不使用虚词、关联词、语气词

3.新词与旧词一般选用新词,

4.简称与全称一般使用全称,具有唯一性的通用公认的简称可直接使用如“中国”。

5.同义词可合并

6.近义词可替代。

7.国外姓名按姓前名后。

8.翻译词按意译

3.4.4检索语言功能

检索语言是标引者和检索者在信息存贮和查检过程中沟通的桥梁。利用检索语言所组成的分类法或主题词表、号码表,就可以对住处资料进行标引加工和检索利用。一般来说,具体的信息检索系统由文档信息资源、设备、人员三部分组成。人们由于其专业知识、工作和生活经历、语言习惯各不相同,因而在使用检索语言上出各不相同。若不采用一定的措施克服语言上的差异,就难以形成完全一致的共同语言。检索语言可以可以保证存贮和检索人员用语的一致性。

检索语言主要作用有以下四点:

1对信息的内容特征及某些外表特征加以标引,赋予其检索标识,保证不同的标引人员表征信息特征的一致性;

2便于将标引用标识符和检索用标识符进行相符性比较,同时它保证检索提问和文献标引的一致性;

3保证检索结果和检索要求的一致性;

4对内容相同或相关的信息,加以集中或揭示,表述其相关性; 5便于对大量信息加以系统化或组织有序化,并力争从多方面揭示文献信息学。

练习与思考题

1.检索语言的类型及分类语言、主题语言的概念

2.简答文献的特征信息有那些?

3.《中图法》的基本类目与类号,你所学专业的学科大类的二级类目主要有哪些?

信息检索作业 第二题

2、常用中文信息资源练习(以下题目均需在SinoMed、维普、万方、CNKI中均进行检索,并比较异同),要求写出检索式,命中文献篇数,相关文献题录一篇。 1)查找重庆医科大学文明发表的文献(该题目主要学习计算机检索方法:字段检索、精确检索与模糊(包含)检索)。 SinoMed: 检索式:("重庆医科大学"[作者单位]) AND %"文明"%[作者] 命中篇数:中国生物医学文献数据库(101)条记录 相关文献题录一篇: 1.【标题】:变异链球菌耐酸毒力因子质子移位膜ATP酶在龋病进展中的动态变化 【作者】:高敬;黄文明 【作者单位】:重庆医科大学附属口腔医院牙体牙髓病科口腔疾病与生物医学重庆市重点实验室重庆市高校市级口腔生物医学工程重点实验室,重庆 401147 【出处】:华西口腔医学杂志;2016;34(2):200-204 维普: 检索式:机构=重庆医科大学并且作者=文明 命中篇数:107篇 相关文献题录一篇: [1]高敬.变异链球菌耐酸毒力因子质子移位膜ATP酶在龋病进展中的动态变化.华西口腔医学杂志,2016,34(2);200-204 目的研究变异链球菌耐酸毒力因子质子移位膜ATP酶(F-ATPase)在不同p H环境和龋病发生发展过程中的表达,评价F-ATPase在龋病进展中的动态变化。方法将变异链球菌菌悬液在不同p H(p H4.0~7.0)和不同葡萄糖浓度(含5%和不含葡萄糖)的BHI液体培养基中培养,检测F-ATPase基因的表达水平。将雄性Wistar大鼠随机分...

万方: 命中篇数:命中99条 相关文献题录一篇: [1]文明,柏玮,李必波等.SPIO标记的反义探针磁学性能检测[J].重庆大学学报(自然科学版),2008,31(8):956-960. 机构:重庆医科大学附属第一医院放射科,重庆,400016;重庆医科大学基础医学院放射医学教研室,重庆,400016;重庆医科大学药学院,重庆,400016;重庆大学数理学院,重庆,400030 摘要:采用化学交联法制备超顺磁性氧化铁(SPIO)标记的c-erbB2癌基因反义脱氧寡核苷酸探针,经过1.5T 磁共振仪测定,其T2弛豫率为0.156×106mol-1·S-1;振动样品磁强计测定出探针的磁化强度为69.423 8 emu/g Fe,比饱和磁化强度68.413 4 emu/g,比剩余磁化强度为30.354 1 emu/g,剩磁为19.734 5 Gs.为了检测探针的有效性,进一步使用该探针转染高表达c-erbB2癌基因的SK-Br-3肿瘤细胞株,同时使用正义和无义探针转染SK-Br-3肿瘤细胞株、反义探针转染正常小鼠肝细胞作对照,结果发现反义探针能够特异性进入SK-Br-3肿瘤细胞内,且能明显改善该细胞的磁学参数并降低磁共振扫描下的信号强度. CNKI: 1.检索式:作者=文明或者中英文作者=文明或者作者名称=文明并且机构=重庆医 科大学或者单位=重庆医科大学或者学位授予单位=重庆医科大学(模糊匹配) 2.命中篇数:找到 122 条结果 3.相关文献题录一篇: [1]葛晓东,李妹玲,文曦琳,李易,邓小林,吴晓凤,文明△,李少林. SPIO-ShRNA 双功能分子探针体外转染卵巢癌细胞的最佳浓度[J]. 北京大学学报(医学版),,:. 2)查找视盘脉管炎中医药相关方面的文献(该题目主要学习检索词的重述与转换,注意检索的提问是概念提问,但计算机是字符串的匹配) SinoMed 1.检索式:"视网膜血管炎/按摩疗法/气功疗法/穴位疗法/中药疗法/中医药疗法/中西医结合疗法/针灸疗法/中医疗法"[不加权:扩展] 2.命中篇数:命中4篇 3.相关文献题录一篇:1. 4.【标题】:中药辨证分型为主治疗视盘血管炎体会 5.【作者】:曹本友

检索语言的分类

检索语言的分类:按照揭示和反映信息内外部特征的不同,检索语言可划分为:分类语言:以数字、字母(或字母与数字结合)为检索标识,作为有关类目的代号。 主题语言:分为标题词语言、叙词语言和关键词语言; 名称语言:以人名、地名、机构名、篇名、书名等为检索标识; 代号语言:以文献特有的顺序号(如专利号、标准号、合同号等)为检索标识 邻近位置算符(W)W是with的缩写。(W)算符也可以简写为()算符,A(W)B,表示A紧挨着B,顺序不能颠倒。A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。 邻词位置算符(nw)A(nw)B,表示两个词的次序不变,其间可以插入n个词。 句子位置算符(S)S是sentence的缩写。A(s)B表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。 字段位置符(F)F是field的缩写。A(F)B,表示A和B 必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti 要求Rice和Genetics必在同时出现在篇名之中。 记录位置算符(C)C是citation的缩写。A(C)B 其作用等同于A and B,均表示A和B 同时出现在同一记录内,但词序不限,也不要求在同一字段内。 截词符号 常用的有“?”、“$”和“*”等,绝大部分数据库无限截词符用“*”,少数用“?”或者“$” 截词类型 (1)后截断,前方一致。如:“comput*”表示computer、computers、computing等。(2)前截断,后方一致。如:“*computer”表示minicomputer、microcomputer等。(3)中截断,中间一致。如:“*comput*”表示minicomputer、microcomputers等。 1 .括号改变运算顺序。 2 .引号引号内的检索项以整体形式出现。精确匹配: “”和《》号,给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 3 .个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词必须出现。 【实例】在某些搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。 1. 直接法(1)顺查法(2)倒查法(3)抽查法 2. 追溯法

信息检索综合作业课件

信息检索综合作业 一、实习内容 利用所学的信息检索知识和检索方法,根据自己选择的课题,综合运用各种检索工具,从多方面搜集相关资料,完成该课题的综合检索报告。 二、实习要求 1、检索课题:自拟。根据自己专业情况或自己的兴趣选择检索题目。 2、检索报告 (1)格式如下: ①选取3个数据库,包括两个2个中文数据库、1个外文数据库检索与所选主题相关的文献。尽量做到查全、查准两方面平衡。 ②每一个库根据检索结果的不同,制定不同的检索策略,要选取适当的关键词,进行组配并构建检索式。详细描述检索时的约束条件。 例如: 检索过程及结果 (1)中文信息资源 ①CNKI中国知网——中国期刊全文数据库 a.检索式:篇名=(网络购物+网上购物+网购)*关键词=风险*时间=2004-2013 b.检索结果:得到79条记录。下面是其中的3条。 [1]波骆尔.中蒙消费者网上购物感知风险研究[J].经营管理者,2012(8):166. [2]陈璐.基于我国市场环境下网络购物风险防范对策研究[J].江苏商论,2011(3):47-49. [3]董大海,李广辉,杨毅.消费者网上购物感知风险构面研究[J].管理学报,2005(1):55-60. ②CNKI中国知网——中国博硕士学位论文全文数据库 a.检索式:题名=(网络购物+网上购物+网购)*摘要=风险*学位年度=2004-2013. b.检索结果:得到167条记录。下面是其中的3条。 [1]刘佳艾. 信息不对称下B2C消费者信任影响因素研究[D]. 北京:北京化工大学,2012. [2]姚秀丽. 中国消费者网上购物风险及消费行为模型研究[D]. 北京:北京邮电大学,2010. [3]张科. 基于TAM理论的C2C网络消费信任研究[D]. 南京:南京大学,2007. ③Springer LINK a.检索式:TI= (online shopping + online purchasing ) *any word=risk* Publication Date =2004-2013 b.检索结果:得到22条记录。下面是其中的3条。 [1] YUN WAN, MAKOTO NAKAY AMA, NORMA SUTCLIFFE. The impact of age and shopping experiences on the classification of search, experience, and credence goods in online shopping [J]. Information Systems and e-Business Management, 2012(10): 135–148. [2] MONIKA KUKAR-KINNEY, ANGELINE G. CLOSE. The determinants of consumers’ online shopping cart abandonment [J]. Journal of the Academy of Marketing Science,2010(38):240–250. [3] A. ANT OZOK, JUNE WEI. An empirical comparison of consumer usability preferences in online shopping using stationary and mobile devices: results from a college student population

信息组织与检索

《信息组织与检索》 一.名词解释 二.1. 一次文献:即原始文献。它是作者以生产或科研为依据而创作的原始文献。如专着、期刊论 文、学位论文等。 三.2. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、 数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 四.3. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为 着录的基本单位,记录图书、期刊、资料等的名称、着者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 五.4.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要 而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 六.5. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。 6、文献信息资源 文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。 7、信息检索语言 信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。 8、竞争情报 竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。 9、INTERNET(因特网) Internet:因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。 因特网,源自英文的Internet,它的含义从广义上来说就是是“联接网络的网络”。这种将计算机网络互相联接在一起的方法称为网络互联。作为专有名词,它所指的是全球公有、使用TCP/IP这套通讯协议的一个计算机系统,这个系统所提供的信息与服务,以及系统的用户。因此,世界上这个最大的互联网络也被简称为“互联网”(the Internet)。 二. 判断题(对的打“√” ,错的打“×” ) 1.??通过BA、ISTP、Kluwer online、Springer Link 数据库都能检索到外文期刊论文全文。(×) 2.??在重庆维普数据库检索系统中能查到企业名录。???????????????? (×) 3.??利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印刷型图书和期刊。(∨) 4.??截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(∨) 5.??联合目录可以帮助读者确定其所需要的文献收藏在那个情报机构。(∨) 6.??综述因附有大量参考文献,所以是二次文献。(×) 7.??通过“万方数据资源系统”可以查找标准文献的全文。(∨) 三. 填空题 1.按文献载体形式划分,文献可分为印刷型、缩微型、声像型、和电子型。

信息检索题库

第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D )。A、AD(军事系统)B、PB (行政系统) C、NASA(航空与宇航系统) D、DOE(原子能与能源管理系统) 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文 3、(A )是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B )A、科技报告B、政府出版物 C、标准文献 D、档案文献 5、年鉴属于下列哪一类别(D )A、零次信息B、一次信息C、二次信息D、三次信息 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书(三次信息) C、综述(三次信息) D、文摘(二次信息) 7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述 8、以下各项属于二次信息的是(A )A、索引B、期刊(一次信息) C、学位论文D、百科全书 二、多选 9、二次信息主要包括(CD )等。A、手册B、年鉴C、目录D、题录 10、信息的属性包括(ABCD )A、客观性B、时效性C、传递性D、共享性 11、信息素质的内涵主要包括(ABC )。A、信息意识素质B、信息能力素质C、信息道德素质 D、信息职业素质 12、以下类型的信息属于三次信息的是(BC )。A、目录B、词典C、百科全书D、科技报告 附加: I)信息道德规范信息行为,主要包括(ABC)。A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息 II)根据信息的载体和表达方式的不同,信息源可分为(ACD)。A、语言信息源B、二次信息C、实物信息源D、文献信息源 III)文献的基本要素有(AC)。A、有一定的知识内容B、一定要记录在纸张上C、一种物质载体D、存在大脑中即可 三、判断

信息检索作业范本

文献检索综合检索报告 07 级 * * 专业 * * 班学号 *********** 姓名 * * *

题目:节能制冷技术及制冷设备的研究成果与发展趋势 检索词:制冷(Refrigeration) 节能(Energy conservation) 技术(Technology) 设备(Equipment)发展趋势(Developing trend) 检索过程:以中文检索期刊维普中文科技期刊为例,第一步现在搜索栏内输入关键词制冷,搜到了与制冷相关的文章10200篇文章,但与题目的相关性有的文章很差。因此采用逻辑联合的方式进行搜索,再搜索栏内输入关键词制冷and技术,然后进行检索,得到了295篇文章,进一步利用检索词之间的关系进行逻辑结合,输入关键词制冷and设备,然后进行搜索,搜到652篇文章!接着变换搜索方式在搜索栏内输入文摘节能and制冷and设备,然后进行搜索得到了201篇文章。接着还可以变换搜索方式一题目名的方式进行搜索制冷and技术and设备,然后进行搜索得到搜索结果19。 然后变换搜索数据库,进入CNKI网络数据库,进行不同的逻辑组合进行搜索,在搜索栏内输入关键词节能and制冷and技术,然后点搜索搜索到了316篇相关文章,为了扩大搜索范围和结果,输入关键词节能and制冷and技术and发展and趋势,搜索到了1文章,由于检索到的文章少,进一步进行检索,输入检索词节能and制冷and设备and发展,搜索到了8篇文章。 进入外文搜索网站EBSCOhost Web,然后进行逻辑搜索,这些行为同样是在时间2000到2008的范围内进行搜索的,输入检索词Refrigeration and Technology,搜多到了36篇文章。感觉搜索的结果还是不很理想,于是在中国科技在线和百度网站上进行搜索,已得到更好的结果.现将具体检索结果介绍如下。 检索结果: (1)数据库:维普中文科技期刊 检索年限:2000-2008 检索词:制冷 检索过程:进入数据库维普中文科技期刊,点搜索中的高级搜索,输入检索词,输入限制的年限,点击搜索进行搜索。 检索结果:10200篇文章 论文篇名:磁制冷发展现状及趋势:Ⅱ磁制冷技术 著者:陈远富滕保华 载文期刊名称:《低温工程》2001年第2期 摘要:简要介绍了磁制冷实现的原理,概括了磁制冷与气体压缩制冷的差异,比较了4种磁制冷循环的优缺点及适用场合,重点评述了室温温区磁制冷样机的研究进展,分析了磁制冷的关键技术,最后给出了磁制冷的潜在市场并展望了发展趋势。 (共7页) (2)数据库:维普中文科技期刊 检索年限:2000-2008 检索词:制冷and技术 检索过程:进入数据库维普中文科技期刊,点搜索中的高级搜索,输入检索词,输入限制的年限,点击搜索进行搜索。 检索结果:295 论文篇名:固体吸附式制冷技术及其在船舶上的应用 著者:甘伟章学来 载文期刊名称:《机电设备》2000年第4期 摘要:该文介绍利用低品位能源的固体吸附式制冷技术的基本原理和工质的选择,并

信息检索作业

信息检索结课作业 姓名:__专业:____学号:__ 一、理论知识 1、信息源的分类? 答:1)文件信息源 2)政府信息源 3)行业协会 4)公益信息服务商 5)信息咨询及中介咨询机构 6)内容信息服务商 7)个人信息源 2、科技文献信息服务机构有哪些? 答:1)图书馆体系 2)科技信息研究体系 3)特种文献服务系统 4)档案系统 5)其他(OCLC CALIS万方中国知网等) 3、常用的信息检索技术有哪些? 答:1)布尔逻辑检索 2)截词检索 3)位置检索 4)字段限定检索 5)加权检索 6)聚类检索 4、举例说明检索策略如何制定? 答:1)明确检索的内容和目的 2)尽可能使用专题检索工具及专业数据库,并收集一些专题信息网址3)了解何种信息由哪些机构提供服务,并注意收集一些机构的URL 4)了解常用的搜索引擎以及检索系统的特性与功能 5)掌握实用的检索技巧 6)机检和手检有机结合起来,节约检索费用 7)注意检索策略信息动向,培养信息检索能力 5、举例说明检索的基本流程有哪些? 答:1)分析用户的信息检索请求 2)了解检索工具系统的基本情况 3)制定检索策略 4)拟定并执行具体检索步骤 5)获取并整理检索结果 6)分析评价检索操作与检索结果 6、检索结果不理想的原因有哪些,并分别说明如何提高查全率和查准率?

答:结果不理想原因: 1)标引的质量 2)检索语言的性能 3)检索策略的优劣 4)检索人员的信息素养 提高查全率:1)使用泛指性较强的检索语言(如上位类、上位主题词) 2)改变布尔运算符(将且改为或) 3)使用截词符 4).改变检索项。如要求检索词位于标题中或为关键词或主题,检出记录数少,则可改为要求位于摘要或全文中,检出记录数即可增加. 5).减少限制条件,增加副主题词 提高查准率:1)使用专指性较强的检索语言(如下位类、下位主题词) 2)使用截词符 3)改变检索项。如要求检索词摘要或全文中,检出记录数多,则可改为要求位于标题中或为关键词或主题 二、模拟检索 题目: (一)定题检索(按给定实例模式检索) 题目: 检索示例:检索课题:超高温气体流动 课题分析:“气体”是本课题主体,“超高温”限制,“流动”是研究内容,故检索词是:气体超高温流动 选择的检索工具:维普数据库 检索策略:检索式:气体*超高温*流动 文献范围:期刊论文 检索式的调整过程:气体*流动找到相关结果660条 气体*超高温*流动找到相关结果共找到1条 结果整理:选择一条整理 答:检索课题:留守老人的物质和精神生活现状及对策研究 课题分析:“留守老人”是本课题主体,“物质和精神生活”是研究内容, 故检索词是:留守老人物质和精神生活 选择的检索工具:中国知网 检索策略:检索式:留守老人*物质和精神生活 文献范围:期刊 检索式的调整过程:留守老人*物质和精神生活找到相关结果647条 留守老人*物质和精神生活*对策研究找到相关结果247条 结果整理:【作者】肖结红; 【机构】巢湖学院经济管理与法学院; 【关键词】农村;留守老人;养老;生活状况; 【基金】安徽省教育厅科研项目“农村空巢老人精神赡养的困境及对策研究”(2010SK491) (二)自拟题目检索(题目要根据自己专业情况来或自己的喜好进行选择题目) 1、分析过程(100字左右字的问题分析过程,要体现检索词和分析的过程)

情报检索语言

虚拟现实(VR)就是利用计算机和其它的专用硬件和软件产生一种境界的仿真,参与者可以通过视觉、听觉和触觉等感觉与仿真的内容交互操作,达到一种“真实”的感觉,所以有人也称其为“灵境”。 信息构建就是为用户提供序化、优化及美化的信息。它需要借助一切信息组织、信息呈现的技术和方法,如图形设计、可用性工程、用户经验、人机交互、图书馆学信息科学中的主题法分类法等的理论方法,在用户需求分析的基础上,对信息进行组织、布局、优化,如设计导航系统、标签系统、索引和检索系统,以及内容布局等。 超文本是一种新型的信息组织技术,它以结点为单位,结点与结点之间通过表示它们之间关系的链加以连接,构成表达特定内容的信息网络。 数据仓库是支持决策过程的、面向主题的、集成化的、稳定的、不同时间的数据集合。这个定义体现了数据仓库作为信息组织技术和工具的鲜明特征,如主题性、有序性等。 自动归类是指计算机通过词频统计、语法分析和语义分析等途径得到代表文献内容的类主题词,然后按照某一分类表将文献划分到某个类目的过程。 自动标引是以计算机代替人工,自动生成表达信息记录内容特征的主题、分类或其它有意义的标识,它是标引技术与计算机结合的产物,是信息组织自动化的基础。 数据管理就是对数据进行分类、组织、编码、存贮、检索和维护。 数据库(Database,DB)是存储在一起的相关数据的集合。 主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的这些语词能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。 主题词分为单元词、标题词、关键词和叙词,标题词是先组式语言,即在主题标引前,其概念已组配好;单元词和叙词是后组式的语言,即只在正式标引式才将概念加以组配,显然它的适用能力比先组式语言强;而关键词是不受控制的语词,是一种接近自然语言的一种主题语言。 组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。组配时主要使用比号组配法和比孔组配法两种方法 关键词是指在文献的标题、摘要或正文中出现的、对表达文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。 关键词法原理的应用,常有三种形式,即题外关键词索引、题内关键词索引和单纯关键词索引 条形码是由一组粗细不一、相互平行的黑白条符组成并按一定编码规则组织起来,用来表示字母、数字、甚至汉字等信息。 信息编码是指用一个或一组按特定规则排列起来的符号来表达信息的过程,它实质上包含两个环节,一是信息的代码化;二是代码的组织。

《信息检索工具的工作原理》教学设计

《信息检索工具的工作原理》教学设计 江苏省盐城市滨海县獐沟中学汤凤池 【教材分析】 本节课教材是《网络技术应用》选修教材第一章第三节因特网信息资源检索的第二部分。在高一信息技术必修教材中已经对网络检索,搜索引擎内容有初步涉及。本节内容旨在让学生了解搜索引擎工作原理,知识相对来说抽象,不易理解。因此选择理论和实践结合的方法,通过对预设情境任务的完成结合教材内容理解相关概念。“兵”教“兵”的模式确保了学生作为学习主体所发挥的作用。 【学情分析】 现在的高二学生经过了高一年级一学期的信息技术学习,对搜索引擎的概念已经有所了解,再加上目前计算机和网络的普及程度,绝大多数学生使用网络搜索自己想要的信息已经是很平常的事情了。但不排除在部分信息建设滞后的地方读初中的学生对网络了解的不足,因此本节课既要照顾到已经对网络搜索熟悉的同学,也要注意那些相对来说不熟悉网络的同学的掌握情况。 【教学目标】 知识与能力:在学生能够熟练掌握网络检索工具的基础上了解网络搜索引擎的基本工作原理,能够了解全文搜索引擎和目录搜索引擎的概念和特点 过程与方法:使用小组模式,采用“兵”教“兵”的形式,让熟悉网络搜索的同学去带那些平时很少上网的同学,同时小组间采用竞赛的形式来激发学生的积极性, 教师做适当的讲解引导。 情感价值观:培养学生团结互助的小组协作精神,并强化公平竞争的理念。 【教学重难点】 搜索引擎的基本原理,全文搜索和目录搜索的区别和应用 【教学方法】 任务驱动小组竞赛 【教学过程】 一、导入 我们已经可以用网络搜索引擎来检索需要的信息了,但是用了这么久的网络搜索,网络搜索引擎的原理是什么呢?这就是本节课我们一起学习的内容。 二、全文搜索引擎的工作原理 学校要建立一个主题网站,但是缺少相关的材料。 任务一:使用全文搜索来查找“我们学校”的相关资料。 任务要求:必须使用指定全文搜索引擎(百度,谷歌),每位同学至少独立搜索一项相关信

信息检索复习资料

一、名词解释 1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。 5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。 6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。 7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。 8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。 9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。 10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。 11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。 12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。 13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。 14.手册——是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。 15.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。 16.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。 17.文献综述——是一种文献信息调研报告,又是学术论文的一种形式。它是通过全面系统的搜集某一特定研究领域的全部或大部分相关文献资料,并经过阅读、理解、分析、比较、归纳的基础上,对该课题的发展过程、发展趋势及存在的问题等,进行全面介绍、综合分析和评论而形成一种不同于一般论文的文体。 18.开放存取——又称开放访问,是国际学术界、出版界、图书情报界利用互联网进行学术信息和科研成果自由传播、免费利用的行动. 19. 一次文献:即原始文献。是作者以生产或科研为依据创作的原始文献。如专著、期刊论文、学位论文等。 20.技术档案指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 21.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 22.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 23.追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。

王乃成信息检索工具的工作原理

课题:信息检索工具的工作原理 课型:新授课 课时:1 课时 教学目标: 1.了解常用的英特网信息检索工具类型;能描述信息检索工具的基本工作原理和特点。 2.体验因特网信息检索工具的优缺点。 3. 掌握常用因特网信息检索工具的使用方法,能熟练使用信息检索工具获取所需信息。 内容分析: 本节为“因特网信息资源检索”中的重点部分,介绍了全文和目录索引类搜索引擎的工作原理,这是学习的重点。教材中通过搜索奥运信息的例子来说明在网上检索信息的过程, 以达到简化原理、帮助学生理解的目的。教学中应尽量选取贴近生活的例子来说明复杂的工 作原理,降低难度,以提高学生的检索能力为最终目的。 教学过程: 1.情境引入 已搜索一首歌曲为基础,提出问题:同学们想像一下信息检索工具该如何工作呢?有几种方法能达到,让学生们互相讨论,并展开对比讨论,选出最恰当的方法。 2.教学过程 方法一:全文搜索引擎的工作原理 (1)提出问题 ①去超市购买一枝钢笔的过程。 购物→描述商品特征→取货→交给顾客 ②利用全文搜索引擎查找夏季奥运会的由来,并观察操作的一般过程。如图 1-1 ~ 1-3 所示。 图 1-1 百度检索首页

图 1-2 百度检索结果页面 图 1-3 百度检索答案举例页面 总结 全文搜索引擎检索信息的过程: 搜索关键字或词→数据库中检索→搜索结果。 (2)通过上述范例引申 从专业的角度拓展给学生讲解搜索引擎的组成。 ①搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持 续不断地抓取网页。 ②索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器 的数据库中。 ③检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果 反馈给用户。 巩固练习:搜索江苏省2012年高考方案 进一步总结,得出全文搜索引擎的工作包括三个过程。 ①搜索器在因特网中发现、搜集网页信息。 ②索引器对所搜集的信息进行提取和组织,并建立索引库。 ③由检索器根据用户输入的查询关键词,在索引库中快速检出相关文档,进行文档与查询内容的相关比较,对检出的结果进行排序,并将查询结果返回给用户。 方法二:目录索引类搜索引擎的基本工作原理 (1)提出问题 ①如果去学校图书馆借阅“短篇小说集”,该怎么去做,描述一般过程。 借阅图书→找书目→找相应书籍→从书架拿出 ②利用目录类搜索引擎查找“北京大学”的信息,如图 1-4 ~ 1-7所示。

信息检索与利用大作业

信息检索作业 一、分析课题要求: 1、文献出版类型:期刊、学位论为,学位论文 2、学科围:工程科技Ⅱ辑 3、时间跨度:2005~现在 二、撰写课题检索策略式 中文检索式:智能车辆 or 交通标志and检测技术研究 外文检索式:% intelligent vehicle or traffic sign and research on detecting technique 时间围:2000至今 三选择检索工具: 中文期刊类检索工具:选择了知网cnki (1)交通标志and检测技术研究 准确度较低,共57条结果。 (2)智能车辆 or交通标志and检测技术研究

准确度较高,共4条结果 中文图书类检索工具: 选择了超星 (1)交通标志and检测技术研究 4条,不准确 (2)智能车辆 or交通标志and检测技术研究

1条,准确 3、中文学位论文检索工具 选择了知网cnki为检索工具 (1)交通标志and检测技术研究 285条结果,不准确 (2)智能车辆 or交通标志and检测技术研究

227611结果,较准确 4、外文检索工具 选择了SCI (1)(% intelligent vehicle or traffic sign and research on detecting technique) 共15741条结果,不准确 (2)主题:(intelligent vehicle) AND主题:(traffic sign) OR主题:(detecting technique) 共15741条,不准确

共8431条结果,准确 5、搜索引擎 采用百度 (1)交通标志and检测技术研究 共24100条结果,不准确 (2)智能车辆 or交通标志and检测技术研究 共47100条结果,准确

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。这种附着在各种载体上的记录统称为文献。 2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。 3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。信息是物质存在的方式、形式和运动规律的表征。人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。 4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。 5、信息资源的构成可从不同的层次和角度来划分: 一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技 报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。 二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次 文献。(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。例如词典、手册、百科全书、年鉴、各种教科书及综述等。 三、按信息的表现形式划分:(1)文献型信息源;(2)非文献型信息源。非文献型信息 源包括电子信息源、数值型信息源、声像型信息源、多媒体信息源以及实例与口头信息源。 6、信息出版类型:是指记录有知识的文献出版类型。 7、信息检索:是指将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。它的全过程又称为信息存储与检索。 8、信息检索的基本原理:对信息集合与需求集合的匹配与选择。 9、信息检索的基本方式可分为传统信息检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。 10、信息检索的研究范围包括一切与信息存储与检索有关的系统、过程、理论和方法。 11、计算机信息检索系统根据内容不同可划分为:联机检索系统、光盘检索系统和网络检索系统。 12、检索工具按用途可分为两大类:指示型检索工具(二次文献)和提供具体信息的参考型检索工具(三次文献)。 13、检索工具按编著方式可分为:(1)目录型检索工具。目录主要报道实有的文献或收藏文献的情况,以一个完整的出版单位作为著录的基本单位。此类检索工具对于查找、索取原始文献具有重要作用;(2)题录型检索工具。题录是用来描述某一文献的外表特征并由一组著录项目构成的一条文献记录。题录实质上是一种不含文摘正文的文摘款目,在揭示文献内容的深度方面,题录比目录做得深入一些,但又比文摘款目浅;(3)文摘型检索工具。文摘是指对文献的内容简洁而又正确的摘录,供人们浏览和查用,使读者能以较少的时间和精力掌

信息检索作业

1.利用“独秀学术搜索”查找下列问题答案(要求列出查询步棸及资料来源) (1)信息源的类型划分及含义 划分: 按信息源产生的时间顺序来划分 先导信息源、即时信息源、滞后信息源。 先导信息源是指产生于社会活动之前的信息源。如天气预报。即时信息源是指在社会活动中产生的,如工作纪录,实验报告等。滞后信息源如报刊。 按信息源传播形式来划分 口传信息源、文献信息源和汉密哈顿实物信息源。口传信息源存在于人脑的记忆中,人们通过交流、讨论、报告会的方式交流传播实物信息源存在于自然界和人工制品中,人们可通过实践、实验、采集、参观等方式交流传播文献信息源存在于文献中,人们可以通过阅读、视听学习等方式交流传播。(包括印刷型信息源和电子信息源等) 按信息的加工和集约程度分 一次信息源:直接来自作者的原创的,没有经过任何加工处理的信息二次信息源:感知信息源从一次信息源中加工处理提取的信息三次信息源:再生信息源或工具书(百科全书,辞典,手册,年鉴)四次信息源:图书馆、档案馆、数据库、博物馆。联合国教科文组织1976年出版的《文献术语》一书将信息源定义为:个人为满足其信息需要而获得信息的来源,称信息源。一切产生、生产、存贮、加工、传播信息的源泉都可以看作是信息源。 含义:信息源(information sources)一般指信息的来源地(包括信息资源生产地和发生地)。 信息源内涵丰富,它不仅包括各种信息载体,也包括各种信息机构;不仅包括传统印刷型文献资料,也包括现代电子图书报刊;不仅包括各种信息储存和信息传递机构,也包括各种信息生产机构。 (2)布尔逻辑检索 布尔逻辑检索是当今最成熟的检索理论之一,也是构造检索表达式最基本、最简单的匹配模式。布尔逻辑检索是通过布尔逻辑算符来实现的,这些运算符能把一些具有简单概念的检 索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索要求。常用的布 尔逻辑算符有三种,分别是逻辑或“oR”、逻辑与“AND”、逻辑非“NOT”。 逻辑或:一般用“OR”或“+”表示,少数数据库用“I”表示,是一种用于并列关系的组配。 它可以扩大检索范围,防止漏检,有利于提高查全率。凡是用“OR”的检索式,“oR”两侧的检索词只要有一个在一条记录中出现,该记录就算命中。 逻辑与:一般用“AND”或“*”表示,是一种用于交叉概念和限定关系的组配。它可以缩小检索范围,有利于提高查准率。凡是用“AND”的检索式,“AND”两侧的检索词必须同时出 现在同一条记录中,该记录才算命中。 逻辑非:一般用“NOT”或“一”表示,少数数据库用“#”或“/”表示,是一种排斥关系的组配。它用来从原来的检索范围中排除不需要的概念或影响检索结果的概念,有利于提高查准率。凡是用“NOT”的检索式,“NOT”前面的检索词必须在记录中出现,而后面的检索词一定 不能出现,该记录才算命中。

检索语言

一、名词解释 查全率 是指系统在进行某一检索时 检出的相关文献量与系统文献库中相关文献总量的比率 它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。 检索语言 是根据信息检索的需要创造出来的一种人工语言 是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 标题词法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。标题词指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。 信息素质:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。 二、简答题 1.简述检索语言的基本功能 答: 1) 对文献的信息内容(及某些外表特征)加以标引的功能。要求利用检索语言能够正确标引文献信息内容及其外表特征。 2) 集中文献的功能。对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率。 3) 信息组织的功能。对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索。 4) 一致性功能。便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性。 5) 获得最高查全率和查准率的功能。保证检索者在按不同需要检索文献时,都能获得最高的查全率和查准率。 6) 桥梁和纽带功能。在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,以提高信息检索的准确性。2.分类检索语言的作用 答: ①这是进行分类标引和组织分类检索工具的规范。②它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。③它是检索者从分类途径检索文献资料的指南。④它是文献工作者工作中常用的参考手册。 三、文献信息检索

4文献检索的原理方法与步骤1

重点:文献检索的方法步骤 难点:文献检索原理 授课内容:第四章文献信息检索原理及方法步骤 4.1 检索原理 文献检索包含文献的存储与检索两个部分,对用户而言,后者更为重要。只有经过组织有序的信息集合体才能提供检索的途径,才有用于检索的功能。文献的编排、组织与检索查询有对应的关系,因此了解一个文献系统的组织方式也就找到了检索的根本方法。 ⑴检索点:每件信息都包含有其内部及外部特征(即信息的属性),文献与课题的主要特征信息可以用来作为检索的出发点和匹配依据,它们称作检索点(access point),这些检索点包括分类、主题、著者、题名、机构名称、代码等。 ⑵检索手段:检索是通过检索工具(系统)和检索方式方法来实现的。无论是用手工检索书本式的工具,还是用计算机检索数据库获取文献资料,都有分类、主题、代码等多种检索途径。 ⑶检索系统:包含网络条件、技术设备(存储服务器、计算机)及文献信息集合体(数据库)。 检索系统按存储的媒体和技术手段来分,检索系统有两种:手工检索工具(印刷型的检索性刊物与参考工具书)和计算机检索系统(各种数据库)。

文献存储和检索原理:是使用户的课题提问标识与检索系统中的信息特征标引标识尽相一致地选择与匹配。如图1—3: 图6—1 信息用户的需求和信息集合的比较与选择,即匹配的过程。从用户需求出发,对一定的信息集合(系统)采用一定的技术手段,根据一定的线索与准则指出(命中)相关信息。 各种检索系统的检索原理基本相同。简单地讲,就是检索提问标识与存储在检索工具中的标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。 信息检索的全过程包括存储和检索两个过程。存储过程就是按照检索语言(主题词表或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(即形成检索途径)的信息集合的过程。具体来说,信息的存储包括对信息的著录、标引以及编排正文和所附索引等。所谓信息的著录是按照一定的规则对信息的外表特征和内 容特征加以简单明确的表述。信息的标引是就信息的内容按一定的分类表或主题词表给出分类号或主题词。检索过程则是按照同样的分类表(或主题词表)及组配原则分析课题,形成检索提问标识,根据存储所提供的检索途径,从信息集合中查获与检索提问标识相符的信息特征标识的过程。因此

相关文档