文档库

最新最全的文档下载
当前位置:文档库 > 论述信息检索的起源与发展过程

论述信息检索的起源与发展过程

论述信息检索的起源与发展过程

20世纪以来,人类创生的信息量高速增长,浩如烟波。如何从这海量的信息里找出所需信息就成为信息检索的重任。

伴随着计算机进入多媒体时代,信息科技也步入了多媒体发展时期。手工检索靠手翻、眼看、大脑判断的检索方式已难以全面适应当今信息的发展,计算机信息检索也必然到了应用与发展的阶段,以Internet 为代表的全球化、网络的实际应用更进一步推动了这一发展,这既是对手工检索的扩展,也是时代的需要。在当今资本资源和数字资源并存的信息时代,作为信息资源管理者,既需要了解和掌握传统手工检索的方法,也需要熟悉和掌握计算机检索,尤其是网络信息检索的理论和技术,这是信息时代对图书馆工作者信息素质的必然要求。

1信息检索的起源和发展过程

信息检索源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶开始发展,至20世纪40年代,索引和检索已成为图书馆独立工具和用户服务项目。随着1946年世界上第一台计算机的问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来,脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各个领域高速发展,得到了广泛利用。Dialog国际联机情报检索系统是这一时期的情报检索领域的代表,至今仍是世界上最著名的系统之一。

(1) 手工检索阶段(1876—1954)

信息检索源于参考咨询和文摘索引工作。较正式的参考咨询工作是由美国公共图书馆和大专院校图书馆于19世纪下半叶发展起来的。到20世纪40年代,咨询工作的内容又进一步,包括事实性咨询、编目书目、文摘、进行专题文献检索,提供文献代译。“检索”从此成为一项独立的用户服务工作,并逐渐从单纯的经验工作向科学化方向发展。

(2) 脱机批量处理检索阶段

1954年,美国海军机械试验中心使用IBM701型机,初步建成了计算机情报检索系统,这也预示着以计算机检索系统为代表的信息检索自动化时代的到来。单纯的手工检索和机械检索都或多或少显露出各自的缺点,因此极有必要发展一种新型的信息检索方式。

(3) 联机检索阶段(1965年—1991)

1965年美国系统发展公司研制成功ORBIT联机情报检索软件,开始了联机情报检索系统阶段。与此同时,美国洛克公司研制成功了著名的Dialog检索系统。20世纪70年代卫星通信技术、微型计算机以及数据库产生的同步发展,使用户得以冲破时间和空间的障碍,实现了国际联机检索。计算机检索技术从脱机阶段进入联机信息检索时期。远程实时检索多种数据库是联机检索的主要优点。联机检索是计算机、信息处理技术和现代通信技术三者的有机结合。

(4) 网络化联机检索阶段(1991年至今)

20世纪90年代是联机检索发展进步的一个重要转折时期。随着互联网的迅速发展及超文本技术的出现,基于客户/服务器的检索软件的开发,实现了将原来的主机系统转移到服务器上,使客户/服务器联机检索模式开始取代以往的终端/主机结构,联机检索进入了一个崭新的时期。

2信息检索系统类型

(1) 参考数据库检索系统

参考数据库检索系统以二次文献数据库为主,提供文献的题录、文摘数据或事实数据。

(2) 全文数据库检索系统

全文数据库检索系统是近年来随着数字化技术不断成熟而发展起来的,系统能提供文献的全文数据,包括图表、图像等多种形式的媒体。

(3) Internet网络检索工具

Internet搜索引擎主要提供网上资源的链接,某些搜索引擎也提供简单的网页介绍或检索词的上下文。

3信息检索方式

(1) 命令检索方式

命令检索方式指的是检索过程中,每一项检索提问,必须通过具体的命令来完成,这些检索命令通常需要用户熟记。这种方式虽然对于初级用户来说比较麻烦,需要记很多的命令,但是对熟悉系统的用户来说,命令方式有其步骤简单的优点,尤其是完成一些复杂的检索算法时,操作步骤简单。许多国际联机检索系统,在推出新的检索方法的同时,仍保留着原有的命令检索方式,为喜欢命令检索的用户提供服务,Dialog系统就提供了比较多的检索命令。

(2) 单检索方式

这种检索方式实际上是将各种检索指令转化成菜单选项,系统的功能和检索指令通过菜单和子菜单的选项来实现,用户通过菜单一目了然,只需根据需要在菜单上选择某一项,或进行检索,或显示命令中的纪录等。菜单驱动的检索方式对初级用户是比较友好的,用户不需要培训就可以自行检索,很容易入门,但对于较复杂的检索算法,常常需要进入层层菜单才能完成。

(3)命令与菜单相结合的方式

这种检索方式既保留了指令检索的方式,又提供了菜单的某些直观的功能。对于复杂的检索方法,主要以命令的方式来组织,而一些常用的命令或参数可以通过菜单选项来选择,这样,简化了完全依赖于指令方式的检索步骤,可以让用户减少指令和参数的记忆量。目前有些联机检索系统在WEB上推出了这样的检索方式。

4信息检索技术

4.1布尔逻辑检索技术

布尔逻辑检索技术就是指利用布尔逻辑运算符进行检索词语和代码之间的逻辑组配运算,从而获得检索结果的一种检索方法。这是计算机信息检索中最基本的也是最常用的技术。

1.逻辑“与”(AND)。逻辑“与”组配是具有概念交叉关系和限定关系

的一种组配。通常用“AND”或“*”作为算符表示。

2.逻辑“或”(OR)。逻辑“或”是并列概念关系的一种组配,通常用运算符“OR”或“+”表示。

3.逻辑“非”(NOT)。逻辑“非”组配是指不包含某种概念关系的一种组配,它可以从原检索范围中排除一部分文献纪录,逻辑“非”的运算通常用“NOT”或“—”作为运算符。

4.2截词检索技术

截词检索(Truncation)是一种常用的检索技术,特别是在西文检索中,更是广泛使用。截词检索就是对词的片断进行比较,检索者将检索词在合适的地方截断,然后将截出的片断进行检索。

4.3字段限制检索

在检索系统中,为了提高检索的准确率,缩小检索的范围,通常用一些限制的手段和方法。使用这些方法进行检索通常称为限制检索(Limit Search)。常用的限制方法就是字段限定。

4.4全文本检索技术

全文本检索技术(Full text Searching)是对数据库纪录的全文文本检索,即纪录中的每个词都可以作为检索入口,且可以限定词与词之间的语义关系。全文本检索也有人把它称为自由文本检索。

5结语

随着信息技术的进一步发展,信息检索技术必将更加完善,它将在人类与信息之间建起一座方便的桥梁。

参考文献:

[1]李满潮.Visual C #?NET高级编程[M].北京:清华大学出版社,2002,(231 –235).

[2]付磊. ASP1net 编程实作教程[M].北京:北京希望电子大学出版社,2002,( 151– 158)