文档库 最新最全的文档下载
当前位置:文档库 › 信息组织复习材料

信息组织复习材料

信息组织复习材料
信息组织复习材料

第一章

1.信息组织的基本方法就可以概括为:以信息外在特征和内容特征为基础的信息序化方法和信息优化方法。

2.信息的序化:是按照一定的方法将无序的信息组织成有序信息的过程。经序化过的信息会变得一目了然,便于管理和利用。

3.信息的优化:是在序化的基础上,按照结构功能优化的目的对信息进行再序化的过程。

4.信息序化的基本方法:1.语法信息序化法 2. 语义信息序化法 3.语用信息序化法

5.信息的优化主要包括: 信息的优选、浓缩、重新表述及三者的综合运用。

6.信息的重新表述 有改写、编译、翻译等方式。(了解)

7.信息的综合优化的主要形式是信息综述和信息述评。

8.信息综述:是对某一领域或课题一定时期的有关信息进行归纳、整理、分析、加工后所形成的信息产品

6.信息述评:是针对某一领域、研究课题或成果的水平、现状、发展动向及影响进行全面而系统的分析评价或明确提出建议

7信息组织的一般过程包括:1.信息替代 2.信息序化

信息的替代过程(亦可成为信息揭示过程)实际上是对原始信息的外表特征(包括题名、著者、出处等)和内容特征(包括分类号、主题词、摘要等)进行描述的过程,这项工作通常称为著录。

8.信息序化是对替代信息给出信息标识(如分类号、主题词等)的过程,这项工作通常称为标引。

9.衡量信息检索效率的指标:查全率R = 查准率P = 查全率R 与查准率P 呈负相关

第二章

分类法:是以知识属性来描述和表达信息内容的一种信息处理方法。

分类语言:是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为隔离的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。 分类法的类型:

1)体系型分类法:是传统的分类法,它的特点是:直线型的序列,层累制的结构,列举式的类目,码号式的语言。《中国图书馆分类法》是典型的体系型分类法。

2)体系一组配分类法:在传统的分类法上,发展起来一种体系—组配型分类法,它的基本特点仍然有体系型分类法的特点,但它增加了复分组配能力。

《国际十进分类法 》是典型的体系—组配型分类法。

比较中图法和UDC

中图法是体系型分类法,UDC 是体系—组配型分类法

中图法正表分为5个基本部类,22个基本大类,UDC 有十个基本大类

中图法的配号制度基本上采用层累制的原则,UDC 采用小数制

中图法采用拼音和数字结合的混合号码,UDC 采用纯数字作为标记符号

分类法通常由六个部分组成:类目、号码、正表、附表、说明、索引

类目间关系(了解p14-p15)

号码的类型及其编制方式(了解 p16-p19)

层累制:又称等级制,它的组合和排列方法是利用号码的基数和次序将一个个的号码层层展开出来。

《中图法》分类思想:《中国图书馆分类法》是典型的体系型分类法,按照“五分法”,即分为:(1)马克思列宁主义、毛泽东思想;(2)哲学;(3)社会科学;(4 )自然科学;(5)综合性图书。在此基础上又分为二十二个大类

复分表:即附表,就是将一组可适用于多个类别的子目结构,单独制表。

1)通用附表:(1)总论复分表 (2)地域区分表 (3)时代区分表 (4)民族区分表

2)专类附表

国际常用分类法(了解)

1.《杜威十进分类法》(DDC )

2.《美国国会图书馆图书分类法》(LCC )

3.国际十进制分类法(UDC )

第三章

总量存储的某一课题的文献查出的有关文献量查出的文献总量查出的有关文献量

1、主题法:以主题语言为基础描述和表达信息内容的一种信息处理方法。

2、主题语言:是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。

3、主题法的种类:

标题法(标题词法)用经过规范化处理的自然语言语词及语组来逐一表达主题概念

元词法(单元词法)以经过规范化处理的自然语言语词的字面组配来表达主题概念

叙词法(主题词法)以经过规范化处理的自然语言语词的概念组配来表达主题概念

键词法(关键词法)直接以文献中的语词来表达主题概念

4、叙词性能

叙词的优异检索性能,首先在于它是一种后组式检索语言,可以自由地进行广泛的组配,形成各种专指标识,扩大或缩小检索范围,以及进行多维性、多途径检索等。

(1)保留了单元词组配的基本原理

叙词的组配性能是吸收了单元词法,用规范化的科技单词进行自由组配的原理与方法,又吸收了组配分类法的概念组配的原理与方法。

(2)采用了标题法对语词进行严格规范化的方法,以保证词与概念的一一对应

叙词采用了标题法利用经过严格规范的科技名词术语,保证叙词与概念一一对应,它具有直接标引文献内容的特征,以及利用标题词的参照系统显示叙词之间的概念逻辑关系等优点。但又克服了标题词的参照系统不够完善,特别是标题词的固定组配,缺乏描述复杂概念高专指度和多途径检索能力的缺点。

(3)采用了体系分类法的基本原理,编制叙词分类索引(范畴索引)和等级索引(词族索引)

克服了体系分类法的间接性、单维性和缺乏标识高指专度复杂概念与多途径进行检索的能力,以及不适应现代科学技术发展等缺点。从多方面显示叙词之间的相互关系,从而保证全面、准确地选用叙词进行标引和检索,这是由于叙词采用了与关键词法类似的编制叙词轮排索引。

叙词语言如何综合多种标引语言的原理和方法?叙词语言由此获得了哪些好的性能?(作业答案)

①概念组配,吸收自组配分类法;②采用先组,吸收自标题法;③参照系统,吸收自体系分类法

④范畴索引以及词族索引,吸收自体系分类法;⑤轮排索引,吸收自关键词法;

⑥字顺表及范畴索引中的字顺排列,吸收自标题法

5、检索语言的核心是词表,包括分类表、标题表、叙词表等。(自己了解)

叙词表包括以下几个部分:①②③④⑤⑥叙词字顺表,又称叙词表的主表。分类索引,又称范畴索引。等级索引,又称词族索引。双语种对照索引。附表。

范畴索引(分类索引)是将叙词按其概念所属学科或范畴分成若干大类,在大类之下再分小类,在小类之下则将叙词按字顺排列,形成一个类似体系分类表的概念分类系统。

等级索引(词族索引)是利用概念的属分关系,将具有属分关系的叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级系统。

6、《汉语主题词表》中国编制的大型综合性中文叙词表。中国科学技术信息研究所与北京图书馆主编,经过近9000人5年时间的工作,1980年科学技术文献出版社出版。其目的是建立全国统一的联机情报检索网络。

它包括了人类知识的所有门类,分3卷10个分册出版,共收叙词 11万条。该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索引。

7、主题词款目著录各项含义(看看p49-p51)

①款目主题词:一种是正式主题词形成的款目主题词,另一种是非正式主题词形成的款目主题词(同义词或近义词)。

②范畴号:它是字顺表中的主题词与范畴索引相互对照的标识

③用代项和组代项:是非正式主题词与其相对应的正式主题词之间的指引关系。检索频率较低而在组配中易于发生错误组配的词,用规定的组配方式固定在词表中,叫做组代项。

④属分项:上位概念主题词之下,表示出其下位概念的主题词,叫做分项。与此对应,下位概念主题词之下表示出其上位概念的主题词,叫做属项,(属分关系又叫种属关系)。

⑤参项:是不能构成属分关系而又关系密切的正式主题词之间的指引关系,这种关系又叫做相关关系。 ⑥族首词项:是主题词与词族索引的对照指引。

⑦词义注释:对于字面形式相同而含义不同或含义易于引起误解的词,加此项予以注释。

8、关键词:是从文献资料的正文、摘要或书名、篇名中抽出的并在表达文献内容主题方面具有实在意义起关键性作用的词汇。

9、关键词的性质

①关键词与标题词、单元词、叙词同属主题法系统的检索语言,而标题词、单元词和叙词都对自然语言的语词加以严格的规范化处理,关键词法则基本上不作规范化处理,或仅作极少的规范化处理。其明显不同是:标题词、单元词和叙词都需要词表,关键词则不存在所谓的词表。 ②如关键词与主题词(叙词)比较,主题词是由标引员根据一定的词表选出的控制词汇,即经过规范化的词汇,它可以不同于文献作者在文献题目或正文中所用的词汇。同时,主题词表有一定专指度的限制,不是每一个概念都能找到相应的主题词,有时细小的概念需要上溯到较广的概念,才能找到相应的主题词。而关键词是文献中现成的词汇,这是文献作者所用的语言,是一种自然语言。因而,关键词能够达到任意的专指度和泛指度。 ③ 利用词表或分类表控制的检索语言标引文献,必须根据文献的主题概念,从词表或分类表中选用最能确切反映文献主题概念的语言进行标引,因此标引工作必须由人工进行。由于关键词是一种非控制的语言,因而能用计算机进行自动抽词标引,这样可大大加速文献的标引过程,缩短检索工具出版的周期。

10、单元词(了解)P67

单元词法也称元词法,以单元词作为文献内容标识和查找的依据。所谓单元词,是指从自然语言中选取的,经过规范化处理的,具有独立概念的最基本的词汇单元,即在字面上不能再分的名词术语。也就是说,在概念上不能再分的词作为一 个单元,以此来标识文献内容的方法。

11、参照系统:See 和See Also (了解)P67

12、 叙词与叙词、非叙词间概念逻辑关系

1)同义关系(等同关系)

2)等级关系

3)相关关系

13、分类法和主题法的主要差异(如右)

分类法和主题法的兼容性(如下)

14、分类主题一体化词表可以分为以下三种类型:

(1)分面叙词表(2)分类主题词表(3)集成词表

第4章 标引与著录 1. 标

分类法 主题法

主题概念标识

分类号 受控词语 文献集中方式

按学科、专业集中 按事物集中 概念关系显示

等级(层次)结构 参照系统+范畴词族 概念排列检索

按学科及逻辑体系 按字顺序列 词汇控制 严于等级关系控制、疏于词形控制 严格实施词形、词义、词间关系控制

:是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,即对主题分析结果赋予检索标识的过程。

2.文献标引包括分类标引和主题标引

3.分类标引:分类标引,就是将文献主题的自然语言形态,转换成分类语言形态的一种标引,也就是将

文献主题转换成分类号的一种标引。

4.分类标引的依据:(了解)1)单个主题分类标引(1)依研究的学科性质归类(2)依书本的主旨和用

途归类(3)依据研究的事物,问题或生活现象的性质归类(4)依著者赞成的学科性质归类(5)按切和主体性质归类(6)按问题或学科性质归类(7)除取主要分类号外,还可取互见分类号(8)一般依重点归类。2)两个主题分类标引:并列关系,从属关系,因果关系,影响关系,比较关系,应用关系。3)多个主题分类标引:直接归入他们的上位类;如果主题不能包括在它们的上位类里,就按内容重点归类;如果论述其中一个主体对其余各个主体的关系,就按发生关系的主题归类;如果论述的几个主题是互不相容,或者是比较其异同,优劣的,就依书中意旨和著者目的或所赞同的主题归类。4)地域。时代分类标引

5.主题标引:是对文献进行主题分析,并给予主题词标识的过程。它以文献篇名和文摘为依据,必要时

参考全文的内容,考虑检索途径的全面性和表达主题的专指性,充分利用词表提供的各种辅助选词手段,充分反映馆藏特点和各类用户的要求。

6.标引规则的要求:1)标引的准确性2)标引深度3)标引的一致性

7.标引方案次序选择:(了解)①专指性标引(记住):又称直接标引,是指在转换反映文献主题的标引

概念时,要用专指度最相符的主题词来标引。②组配标引③上位词标引④近义词标引⑤增词标引

8.适度标引:是指标引出的叙词与原文献主题概念基本一致,既不过度,也不过粗的标引技术。

9.适度标引:是指标引出的叙词与原文献主题概念基本一致,既不过度,也不过粗的标引技术。

10.组配规则:(了解114)所谓组配,就是把几个主题词按一定的组合方式合理地组合在一起,用来表示

达到更专指的主题

11.字面组配:(了解119)例子也看一下:指的是单纯字面组配。也就是指那些单纯从字面的拼合出发,

而不考虑概念之间的逻辑关系和语法关系的组配。

12.概念组配:所谓组配标引是指采用几个叙词的组合形式,对文献内容特征进行的标引。但组配的叙词

之间必须具有概念上的某种逻辑联系。

13.(1)概念交叉组配(2)概念限定组配(3)概念并列组配的区别(了解)

14.字面组配与概念组配的区别:(选择题)字面组配其实质是词的分析与组合(拆词);概念组配实质是

概念的分析和综合(拆义),二者的检索效果是有很大的差异的。

15.著录:在编制文献目录时,对文献信息的各种特征进行分析、选择和记录的过程

16.MARC(Machine Readable Catalog)是机读目录的简称:指以代码形式和特定结构记录在计算机存

储载体上的,用计算机识别与处理的目录

第五章

1、信息组织自动化技术:自动标引,自动分类,自动文摘。

2、自动标引分为:自动抽词标引,自动赋词标引。

3、自动抽词标引:绝对频率法(由计算机程序将文本与停用词表对照,除去介词、连词等虚词,然后统计出文本中词语出现的频率,按词语出现的频率排序)、相对频率法(当某个词或短语在某一文献资源中出现的频率高于它在整个数据库中出现的频率时,这个词或短语就可以被选作标引词,这就是相对频率抽词法)、位置法(即利用词语在文献中出现的位置来进行选择)。

4、自动赋词标引:基于关联词表的自动赋词标引、基于中介词典的自动赋词标引。

5、中文标引的特殊难点(了解):词的切分问题;难以进行比较全面的语法分析;汉语用词的灵活性;主题词选择和隐含标引问题。

6、自动分类包括:自动聚类、自动归类、类号的自动转换。

7、自动聚类是指从待分类对象中提出特征,再将提出的全部特征进行比较,并根据一定的原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。

8、自动归类是指先分析被分类对象中的特征,将其与各种类别中对象所具有的共同特征或一定的分类标准、分类参数进行比较,然后将被分类对象划分为特征相近的一类,并赋予相应的分类号。

9、自动分类的一般过程:建立类主题词;计算文献的归类属度;当文献类归属度超过某类规定的阀值时,即可考虑能否将它划归某类;根据一定的分类规则,赋予文献的分类号

10、自动文摘技术包括:自动摘录;基于文摘的自动文摘;基于信息抽取的自动文摘;基于结构的自动文献。

第六章

1、(了解)数字信息资源是用户可通过计算机本地或远程读取、使用,以数字形式存储在光、磁载体上的图像、文字、声音、视频等信息,如电子邮件、专题讨论小组和论坛、电子布告板新闻、电子期刊等。

2、(了解)数字信息资源的特征:数字信息资源对系统的依赖性;信息与实体的可分离性;数字信息资源的非直接可读性;数字信息结构的复杂性;数字信息资源的共享性;数字信息的易更改性;数字信息的质量参差不齐,缺乏必要的控制;数字信息的跨国界数据流动和传递;数字信息的不安全性。

3、元数据是:一种有效的信息资源组织和管理的工具,是一种编码体系,它可以帮助人们检索和确认所需要的信息资源,可以对数据单元进行详细、全面的著录描述,可以支持信息资源的存储和使用管理,支持对信息资源进行长期保存。

4、元数据功能:信息发现;信息描述;资源管理;资源保护与长期保存;使用;真实性保障。

5、(了解)根据元数据所支持的功能,可分为描述性元数据;管理性元数据;结构性元数据

6、Dublin core的15个核心元素:题名;作者或创造者;主题词和关键词;出版者;内容描述;其他责任者;日期;资源类型;资源格式;资源标识;关联;资源来源;语言;内容范围;权限管理。

7、RDF的三个部分构成:RDF DaTa MoDeL(RDF数据模型)RDF SCHEMA(大纲)RDF SYNTAX (语法机制)

8、RDF的数据模型包括三个对象类型:资源;属性;陈述

9、按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:1.目录式搜索引擎;2.机器人搜索引擎;3.元搜索引擎

10、一个机器人搜索引擎由搜索器(搜索器的功能是在互联网中漫游,发现和搜集信息)、索引器(索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表)、检索器(检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制)和用户接口(用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。)四个部分组成。

11、积极人搜索引擎的工作原理(P173)

12、元搜索引擎是:一种基于机器人搜索引擎的搜索引擎,用于查询与提供相关的信息线索或者全文。

13、元搜索引擎的工作原理:元搜索引擎通过自己定制的搜索界面,接受并处理用户的查询问题,在进行实际的调查时调用一个或者多个独立搜索引擎的数据库,搜索结果是来自独立搜索引擎的检索结果或者是这些结果集合的综合,结果呈现既可以是引用原始的独立搜索引擎的页面,也可以是由元搜索引擎重新制定后的形式。

第七章

数据库系统DBS出现了4种典型的系统结构:1)单用户数据库系统2)主从式数据库系统3)分布式数据库系统4)C/S(Client/Server,客户机/服务器)数据库系统

数据库系统的信息组织方法,即上述4种数据库系统的信息组织方法(了解p194-p199)

多媒体数据库关键技术:1)数据模型2)数据的压缩和还原技术3)存取管理和存取方法

4)用户界面5)分布式技术6)多媒体信息的检索与查询7)多媒体数据的输入

多媒体数据库的主要实现方法:

1)从关系数据模型发展多媒体数据库2)面向对象数据库3)分布式超媒体数据库

基于内容检索(Content—based Retrieval):就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体进行查找,检索出具有相似特征的媒体数据。

第八章

1、(了解)数字图书馆的特征:①数字图书馆信息组织对象类型已大大扩展;②数字图书馆的信息组织是一种分布式模式,其信息对象可能并不存储在同一个地方,而可能分布在不同的数据服务器上。③数字图书馆的信息对象是一种以机读型信息形式存储与检索的数字化信息对象。④数字图书馆信息对象的格式化特征和多格式特征。

2、数字图书馆的设计系统的三层结构:外层;内层;虚拟网站层

3、数字图书馆与传统图书馆的比较:传统图书馆的主要职能是收藏,并在对所收藏的图书资料保存、组织的基础上为读者提供各种服务。数字图书馆的收藏对象是数字化信息,但数字化收藏加上各类信息处理工具并不能构成数字图书馆。数字图书馆是一个将收藏、服务和用户、管理员集成在一起的一个环境,它支持数字化数据、信息和知识的整个生命周期的相关操作和活动,包括生成、保存、发布、传播和利用。

4、数字图书馆信息资源与因特网信息资源的比较:资源内容的组织方式的不同,数字图书馆的资源内容是按照用户的需求挑选的经过加工的、是使受教育者易于接受的形式,因特网的资源内容主要是无序的、内容差别很大;资源内容标引方法不同,因特网的信息资源是以标引文献条目为主,大多数全文文献不经过标引,其查全率与查准率都有问题,数字图书馆的资源标引则深入到文献内容;检索效果不同,数字图书馆的用户往往能迅速的找到所需要的资源,而因特网的用户,查询结果不能得到很好的满足

第九章

1.(了解多看看)信息存储系统的结构P231

计算机存储系统主要是由两级存储器和存储管理软件构成。

两级存储器就是主存存储器和辅助存储器。

存储器合理有效地使用取决于操作系统中的存储管理模块和文件管理模块。

2.(掌握)存储器的类型

1)按照存取方式分类(特点要了解)P233

(1)RAM(Random Access Memory,随机存取存储器) (2)ROM(Read Only Memory,只读存储器) (3)顺序存储器SAM (Serial Access Memory)。(4)直接存储器DAM (Direct Access Memory)。

2)按存储介质分类

(1)磁存储器(2)半导体存储器(3)铁电存储器(4)光存储器(5)其他介质存储器

3)按功能分类(了解以下各种)

(1)寄存器型存储器2)高速缓冲存储器(Cache)

(3)主存储器MM(Main Memory)简称主存,又称内存储器(Intenal Memory),简称内存。

(4)外存储器(External Memory)也称辅助存储器。

3.(了解)存储器的主要技术指标P235

1)存储器容量(存储容量=存储单元个数×存储字长)2)存储密度3)存取时间和存取速度4)存取周期与数据传送率5)误码率6)可靠性7)功耗8)性能价格比

第十章

光盘存储器的类型:

(1)按制造材料和记录信息的方式划分。只读光盘、一次性写入光盘、可擦写光盘。

(2)按所用驱动器结构划分。内置式光盘存储器和外置式光盘存储器。

(3)按转速划分。光盘存储器按转速可分为单倍速、双倍速、4倍速、……、52倍速光盘驱动器。(4)按接口方式划分。光盘存储器按接口方式可分为3种类型:IDE接口、SCSI接口和专用接口。

光存储器的特点:(了解)

记录密度高,存储容量大;存储寿命长,易于保管;非接触式读/写信息,这是光盘存储器特有的性能;信息的载噪比高。载噪比是载波电平与噪声电平之比,以分贝dB表示;

易于大量复制,信息位价格低;能自由地更换光盘。

磁存储器的类型:

(1)磁带存储器(2)硬磁盘存储器(3)软磁盘存储器(4)磁泡存储器(5)磁芯存储器(6)磁鼓存储器

磁存储器的特点:(了解)

记录密度大、存储容量大;信息的写入和输出速度快,可以立即重放和再现;记录的信息经过多次重放后仍保持原有的特性;可实现多通道记录,可将多个磁头配在一起,记录许多磁迹。记录和存储的信息稳定性高,不挥发;成本低、维护简单,适于大量生产。在计算机系统中作为辅助大容量存储器使用,存放系统软件、大型文件、数据库等大量程序与数据信息。

第十一章

1.(了解多看)直接连接存储DASP268

DAS( Direct Attached Storage)也称为SAS(Server Attached Storage,服务器附加存储)。DAS是直接连接在各种服务器或客户端扩展接口下的数据存储设备。

2.(了解)磁盘阵列RAIDP270

RAID(Redundant Array of Independent Disks)冗余磁盘阵列技术

3. (掌握)NAS和SAN的比较与融合P282

?NAS是一种以文件为传输协议,通过网络传输的技术;而SAN是以块为传输协议,主要通过Fibre Channel传输的技术。

?从目前的普遍应用来看,SAN占据的还是大型应用领域,NAS集中在中小型的应用领域。

?从系统的构建而言,NAS方案可以利用用户原有的网络,而SAN方案需重新建立存储网络。

?从对比SAN和NAS的实现方式来看,SAN解决了DAS的一些难题,比如实现存储集中、集中备份、容灾等。但其数据管理工作还是在服务器上进行,需在每一个存储服务器上安装存储服务。

?另外,SAN的设备结构复杂,各个厂商标准不一,产生兼容问题,而且需要复杂的软件才能使用,使得其成本很高。

?NAS最大的优点是简单,不要求服务器额外安装软件,数据集中管理,软硬件可以集成,在网络上即插即用。作为存储系统,NAS提供了比SAN更高的可实用性。

4.(掌握)存储管理系统的任务包括5个部分:P287

1)操作管理:2)数据管理3)资源管理4)网络管理5)元件管理

5.(掌握)网络存储的分级管理P289

1)存储级管理2)网络级管理3)企业级管理

第十二章

1.(掌握)文献的类型

12.3.1按文献记录的载体划分(这个可不记要了解下)

1)书写型文献(Hand Writing Document) 2)印刷型文献(Printed Document)

3)缩微型文献(MicroForm Document)4)电子型文献(Electronic Document)

5)视听型文献(Audio-visual Document)

12.3.2 按文献的加工程度划分(一次二次的概念要掌握)

零次文献(Raw Literature)

一次文献(Primary Literature):是作者以生产或研究成果为依据而创作的原始文献。如,期刊论文、学位论文、专利文献、会议文献、研究报告、专著、译文等。

二次文献(Secondary Literature):将无序的一次文献进行收集、整理,著录其特征并以规定的格式编制成为便于管理和查找文献的工具,即检索工具。如目录、题录或索引、文摘等。三次文献(Tertiary Literature)

12.3.3 按文献信息公开程度划分

白色文献灰色文献黑色文献

12.3.4 (掌握)按文献出版形式划分(10类)(还要记住各种著录格式)

1).图书(Book、monography)ISBN号即国际标准书号(International Standard Book Number) 图书著录格式:著者.书名[M]. 出版地:出版社名称.出版时间

2).期刊(Periodicals,Journal,Magazine)国际标准连续出版物刊号ISSN

期刊著录格式:作者(多作者用逗号分开,超过3个者用“等或et al”). 文章题目[J].刊物名称,年代,

卷数(期数):页数

3).报纸(Paper,Newspaper)

著录格式:析出责任者. 析出题名[N].报纸名,年-月-日(版次).

4).专利文献(Patent Document):

专利文献著录格式:专利申请者. 专利题名:专利国别(或地区),专利号[P].出版日期.

5).标准文献(Standards)

著录格式:标准颁布国家或组织. 标准名称[S]. 标准号.

6).会议文献(Conference Paper)

著录格式:析出责任者. 析出题名[C] //编著者. 文集名. 出版地:出版者,出版年:起止页码. 7).学位论文(Dissertation)

著录格式:责任者. 题名[D]. 学位授予地址:学位授予单位,年份.

8).科技报告(Technical Report)

著录格式:著者.题名[R].报告题名,编号,出版地:出版者,出版年:起止页码.

9).科技档案 10).产品样本

2.(掌握)参考数据库主要包括两类型:书目数据库文摘和索引数据库

3.(掌握)事实数据库三大类:数值数据库指南数据库术语数据库

4.(掌握概念)倒排文档:从数据库全部记录的基本字段中,按照著者、主题、分类等提取出所有的检索词,分别按字顺排列而重新形成的索引文档。

5.(掌握)分类指南:是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。通常搜索引擎与分类指南是结合在一起的,例如:Yahoo,新浪,悠游等。

6.(掌握)信息检索步骤

1.分析检索课题,明确检索要求

2.选择检索工具,确定检索途径

3.确定检索标识,确定检索运算

4.构筑检索提问,获取初步结果

5.调整检索策略,获取所需信息

7.(掌握)如何扩大和缩小检索范围??

扩大检索范围的措施:

–降低检索词的专指度,可从词表或检出文献中选择泛指词。

–调节检索式的网罗度,如删除某个不重要的检索词。

–进行族性检索,可用分类号或用OR连接一组同义词和近义词。

–取消某些限制过严的限制符。

缩小检索范围的措施

–提高检索词的专指度。

–增加AND连接,进一步限定主题词。

–把检索词限定在主要字段,如标题字段、主题词字段等。

–缩短检索年限,或限定某些刊物。

8.(了解)在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。分为三种逻辑关系:逻辑与、逻辑或、逻辑非;分别用AND、 OR、 NOT表示。

第十六章

1.(掌握)专利的类型三类

(一)发明专利(二)实用新型专利(三)外观设计专利

2.(了解)中国专利号:ZL92106358 为专利申请号前加ZL。申请号被批准后即为专利号。

3.(了解)中国专利文献编号组成形式,如:CN1030011A CN:国家代码;

1:专利类型 1----发明专利;2----实用新型专利;3----外观设计专利;

A: 文献种类代码 A----发明专利申请公开 B---发明专利审定公告C----发明专利授权公告;U---实用新型专利申请公告Y---实用新型专利授权公告 S--外观设计专利申请公告;

4.(掌握)什么是标准的分级和种类?

根据《中华人民共和国标准化法》的规定,我国的标准分为国家标准、行业标准、地方标准和企业标准四级。

?按约束力分,国家标准、行业标准可分为强制性标准、推荐性标准(/T)和指导性技术文件(/Z)三种;

?按标准化的对象分,标准可分为技术标准、管理标准和工作标准三大类。

5.(填空题)表谱与图录的分类:

表谱的类型:(1)年表(2)历表(3)专门性表谱

图录分为两种:地图和图谱

6.(了解知道)国内国外的数据库:

国内的:13.1 中国高等教育文献保障系统(CALIS)13.2 中国知识基础设施工程CNKI

(中国学术期刊全文数据库(CJFD))13.3 中文科技期刊数据库(维普)13.4 万方数据资源系统(中国学位论文全文数据库中国会议论文数据库)

13.5 人大复印报刊资料全文数据库

国外的:14.1 IEEE Electronic Library (IEL) 14.2 Elsevier期刊全文数据库14.3 EBSCO

14.4 OCLC 14.5 ACM(美国计算机学会)全文数据库14.6Kluwer Online全文电子期刊14.7 Springer 数据库检索

信息组织试题及参考答案

信息组织试题库一、名词解释 1.情报检索语言 2.信息揭示 3.仿分 4.倒排文档 5.八分法 6.信息描述 7.层累制 8.分类 9.UDC 10. 信息组织 11. 信息标引 12. XML 13. 关键词法 14. 词族索引 15. 等级体系分类法 16. 语法信息组织法 17. 模糊检索 18. 多元搜索引擎 19. EI Village 20. 超媒体存取 21. 虚拟图书馆 22. 文献分类 23.MARC 24. SGML 25. 文献标引 26. 主题词法 27. ISBDs 28. 顺排文档 29. 引证关系组织法 30. 双位制(百分法) 31. 信息存储 32. 双关索引 33. 范畴索引 34. 组配分类法 35. 语义信息组织法 36. 书次号 37. 文献检索 38. 超文本存取技术 39. 信息检索工具 40. 文献序号索引 41. 引文索引

42. 题内关键词索引 43. DIALOG 44. 基本索引字段 45. KWOC Index 46.PB报告 47.分析标引 48.类 49.概念组配 50.主题词款目 51.部分标引 52.词族 53.族首词 54.超级组配 55.款目主题词 56.词间相容关系 57.基本部类 58.类系 59.标识 60.专类附表 61.情报检索 62.二次文献 63.报导性文摘 64.图书分类 65.题录 66.PRECIS 67.多向成族 68.主题法 69.标引 70.类名 71.类目 72.类目表 73.类列 74.基本大类 75.基本序列 76.简表 77.详表 78.复分表 79.通用附表 80.上位类下位类 81.同位类 82.交替类目 83.参见类目 84.标记制度 85.单纯号码

信息组织自考试题汇总.pdf

1.什么是信息组织 信息组织指根据使用的需要,依据主题内容或特征,将信息资源组织为有序集合的过程。 2、信息组织与信息检索的关系 信息组织与信息检索是密切联系的,一方面,信息组织是信息检索的基础和前提,只有进行信息资源处理和有序化组织,才可以利用它有效地进行检索查找;另一方面,信息检索是信息组织的出发点和归宿,是信息组织的真正原因。两者既有区别,又是相互依存,相互作用,互为因果的。 3、信息组织活动的类型 (1)信息组织的操作,指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。 (2)信息资源组织规范,是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作 的的依据。包括:信息描述规范、检索语言。 4、根据对象与特点划分的检索工具的类型 文献目录:以各种类型的文献单元为对象,对其进行揭示、报道的工具包括文献收藏目录和书目。 索引:是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等。 机读数据库:是一种依托现代计算机技术、以机读形式建立的检索系统。一数据库通常由某种同类记录按照一定的方式组织 而成。 网络搜索引擎:以网络信息资源为对象的检索系统,是上述各种系统的。 5、两种基本检索途径及其特点(按照标识特征,检索工具可分的两类) 一类以信息资源的外部特征为检索依据,提供从资源形式出发进行检索的途径,常见的这类标识包括:责任者名,题名,机 构名等。可以查找一种或数种文献。 另一类则以表达信息资源主题内容的标误用为依据,提供从内容角度进行检索的途径。主要有分类法和主题法两种。使用这类途径检索,不必预先了解文献特征,可直接从主题内容入手进行查找。 6、传统检索系统中对信息资源处理的基本方式(1)对信息资源进行描述,包括:着录或编写题录。(2)对信息资源的内容进行浓缩。包括:编写内容提要或文摘。(3)提供检索点。包括:着者名,标题名称,出版机构名等。 检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称情报检索语言。 检索语言由词汇和语法两部分组成。词汇是检索语言的主体,是各种词表,包括分类表或标题表、叙词表等;语法,则是 分类标引和主题标引的规则系统,它们规定词汇集的使用方法。 1、信息资源分类的含义、特征、作用 信息资源分类含义:根据信息资源的内容属性和其他特征,将各种类型的信息资源分门别类地,系统地组织和揭示的方法。 信息资源分类特征: 是按照内容特征的相互关系加以组织的。 从一定的角度出发组织和揭示信息资源的。 以一定标记符号作为排序工具。 通过类目索引提供从字顺角度查找类目的途径。 分类法的作用: 进行资源组织。文献分类排架 建立分类检索工具。即将分类法用于信息资源的揭示 分类统计。是有效进行资源管理和利用的基本手段 兼容工具。 2、信息资源分类法及其类型 信息资源分类法——指根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具。 分类法类型:根据涉及学科领域:综合性分类法、专业分类法.根据适用的文献类型:图书分类法,文献分类法、期刊分类 法、标准文献分类法、专利分类法、网络资源分类法等.根据信息资源规模:大型分类法、中小型分类法等.根据类表的媒体形式:印刷型分类法、机读分类法.按照分类法编制方式:等级列举式,分面组配式、列举—组配式分类法 3、等级列举式、分面组配式分类法及其特点 等级列举式分类法,亦称列举式分类法、枚举式分类法,是一种将所有的类目组织成一个等级系统,并且采用尽量列 举的方式编制的分类法。 其特点:类目体系直观,易于把握,便于使用;类目展开比较系统;标记简明,适合分类排架和组织分类目录。 分面组配式分类法:一种按照分析—综合原则编制的分类表。 只在类表中按照范畴列出各种基本概念,并分别配予相应号码,使用时,先分析文献主题,根据主题分析的结果,通 过相应概念的组配表达文献主题,以各个概念标识的组合,表示该主题在分类体系中的次序,这种分类法称为分面组配式 分类法。 其特点:可通过概念组配,对复合主题进行专指标引; 标记具有较强的表达性,便于调整组配次序,进行多无检索; 可通过组配表达新出现的复杂主题,与科学的发展保持同步; 类表的篇幅较小,便于控制、管理、增补、修订等。 4、分类法的结构组成 分类法组成:类目体系,标记符号,说明与注释,类目索引四个方面 类目体系(表)的组成部分: 主表:基本部类、基本大类、简表、详表

信息组织资料

(1)名词 a 轮排转换(2):依次把检索语句中每一个有检索意义的词轮流排列在检索位置上。 b.分析标引(10):分析标引是一种根据资源中部分片段或集合型资源的构成单元进行的标引。 c.职能符号(2):一种表示主题标识在组配中的句法职能而规定的辅助符号。 d.层累制(5):是按照类目相应的等级配置相应位数的号码,类号可以反映类目次序和等级的标记制度。 e.标记符号(5):是分类法中标记类目的次序、关系和位置的符号。 f.同义控制(2):是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是。 g词义控制(2):是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。 h.联系符号(2):是一种揭示同一文献主题之间联系强度的符号,可以防止主题词之间出现误组配。 i.描述控制(2):即对描述记录的内容、描述方进行的控制。包括描述项目、描述文字、描述级别、描述格式的控制。j.句法控制(2):是根据信息资源标引和检索的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定。常见的句法措施有确定引用次序、使用辅助符号和句式转换。 k.范畴索引(8):范畴索引又称分类索引、范畴表,是一种按照词汇所属的学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。 l.引用次序(2):是指复合主题标引和检索时,各个主题因素的组合次序。在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序m.检准率(2):是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。用公式表示为:检准率=检出的相关信息资源数/检出的信息资源总数×100% n.轮排(2):是指把一串多词素的检索词包含的各个有检索意义的词素轮流排列在检索入口位置的方法。 o.叙词法(8):叙词法是一种从自然语言中精选出来的、经过严格规范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的主题法。 (2)复习重要知识点 A常识性知识 1)信息组织类型中以内容特征形成的检索工具类型(1):以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有分类法、主题法。 2)词汇控制方法(2):词汇控制的主要措施是什么? (1)词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。 (2)词汇控制的主要措施包括: A同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。 B词义控制,是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。 C词间关系控制,是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。 (3)词汇控制还应包括词量控制、词组选择与使用控制、词汇专指度控制等。 3)文献分类法类目之间的关系(5) 文献分类法类目之间有哪些关系,它们的表现有哪些? (1)类目之间的关系主要有:从属关系,即类目体系中一个类与其直接区分出来的子类之间的关系;并列关系,是类目体系中同位类之间构成的关系;交替关系,是指交替类目与相应的使用类目之间形成的关系;相关关系,是指类目之间除从属、并列、交替等关系之外其他联系; (2)上述关系在类目体系中体现为:从属、并列关系是类目体系的主要关系,揭示类目之间的纵向联系,类目从属关系以上位类、下位类表现出来,类目并列关系以同位类表现出来;类目交替关系、类目相关关系是类目体系主要关系的补充,揭示了类目之间的横向联系;在类目体系中,交替关系以交替类目与使用类目体现出同一关系主题内容的资源的可选择性;相关关系以类目参照体现类目之间的交叉等联系。

信息管理概论期末综合练习题2010

广州市广播电视大学期末考试 《信息管理概论》综合练习题 一、名词解释 1、现代信息管理 P25现代信息管理就是借助于现代信息技术,充分运用经济、人文等手段,对社会中存在的各种类型的信息资源及信息活动加以管理以求最大限度地发挥它的作用,实现它的价值,并带来效益。 2、知识管理P32知识管理是协助企业组织和个人,围绕各种来源的知识内容,利用信息技术,实现知识的生产、分享、应用以及创新,并在企业个人、组织、业务目标以及经济绩效等诸个方面形成知识优势和产生价值的过程。 3、基础技术P106基础技术主要是指新材料、新能量技术等,信息技术在性能、水平等方面的提高有赖于这两类技术的进步。 4、支撑技术 P106支撑技术主要是指机械技术、电子技术、激光技术、空间技术和生物技术等。 5、信息描述 P162信息描述是根据一定的描述规则和技术标准,对信息的外在特征和部分内容特征进行分析、选择、记录的过程。 6、信息揭示 P164信息揭示是信息组织的中级形式,即对信息的内容特征进行深层揭示并转换成主题标识,形成一个科学的逻辑的概念标识系统。 7、网络信息服务 P196网络信息服务是指在网络环境下信息机构和行业利用计算机、通讯和网络等现代技术从事信息采集、处理、存贮、传递和提供利用等一系列活动,其目的是为了给用户提供所需的网络信息产品和服务。 8、信息检索服务 P192信息检索服务是根据用户的要求,由专门人员辅助或代替用户查找信息并将结果提供给用户的一种信息服务工作。 9、管理信息系统:P255管理信息系统式一个以人为主导,利用计算机硬件、软件、网络通讯设备以及其他办公设备,进行信息的收集、传输、加工、储存、更新个维护,以企业战略竞争、提高效益和效率为目的,支持企业高层决策、中层控制、基层运作的集成化的人机系统。 10、信息政策:P319信息政策是指用以调节信息搜集、加工、储存、处理及传播等信息活动的指导原则、法令、指南、规则、条例、手续等所构成的相关的政策群体,它涉及信息产品的生产、分配、交换和消费等各个环节以及整个信息产业的相关问题。 二、单选题 1.知识管理的发展始终围绕着组织、人和( C )技术三个要素。P33 A 工程 B 管理 C 信息 D 知识 2.信息( B )是知识管理实现的有力保证。P35 A 管理 B 技术 C 创新 D 设施 3.信息不同于物质与能量,信息就是信息(A )。P50 A 共享性 B 转换性 C 传递性 D 表征性 4.信息的最大功能是通过信息的交流与共享万里创造更大的价值(C )。P50 A 共享性 B 转换性 C 传递性 D 表征性 5.揭示利用( B )进行有效控制的手段和描述及优化系统的方法和原理。P66 A 管理 B 信息C协调 D 指挥 6.寻求通过加工(B )来生成智能和发展智能的机制与途径。P67 A 管理 B 信息C协调 D 指挥 7.处于信息技术体系的最低层( A )。P106 A 基础技术 B 支撑技术 C 主体技术 D 应用技术 8.处于信息技术第二层是(B )。P106 A 基础技术 B 支撑技术 C 主体技术 D 应用技术 9.收集、通信、计算机和控制是称(D )。P108

管理基础知识重点复习

管理基础知识复习资料对管理定义的理解:管理是以管理者为主体进行的活动;管理是在一定环境下进行的管理是为了实现特定的目标;管理需要动员和配置有效资源;管理具有基本的职能管理是一种社会实践活动管理的特性: (1)管理具有两重性:生产力属性和生产关系属性;科学性和艺术性(2)管理具有目标性(3)管理具有组织性(4)管理具有创新性 管理的职能:计划、组织、领导、控制管理职能的发展:决策和创新 管理的类型: (1)公共管理—以公共利益的实现为目标,以公共组织为依托,公共管理过程是公共权力的运用过程公共管理具有独占性 公共管理接收公众监督 (2)企业管理—管理目标相对单一管理具有竞争性 管理具有典型的经济理性 管理权力来源于生产资料的所有权以及由此委托的经营管理权 管理者的角色: (1)人际关系—挂名领导、联络者、领导者(2)信息传递—信息监听者、传播者、发言人 (3)决策制定—企业家、故障处理者、资源分配者、谈判者 管理者的类型:

按层次分—高层管理者、中层管理者、基层管理者、作业人员 按领域分—综合管理者、专业管理者 管理者应具备的技能:技术技能、人际技能、概念技能 管理环境:一般或宏观环境、具体或微观环境、组织内部环境 (1)组织的一般环境:政治、社会文化、经济、技术、自然 (2)波特认为,影响企业内竞争结构及其强度的主要有:现有企业、潜在竞争者、替代品制造商、原材料供应商、产品用户等5种环境因素。 两种环境分析方法介绍:1、识别环境不确定程度的方法 2、内部环境综合分析:SWOT分析是最常用的内外部环境分析技术。 管理理论的发展:国外早期的管理思想—威尼斯兵工厂马基艾维利-《王子》-领导者原则 中国早期的管理思想—儒家:仁义礼智信 道家:无为而治 法家:法治 商家:积著之理-范蠡;治生之学-白圭 产业革命后的管理思想—查尔斯.巴贝奇(科学管理者的启蒙者) 亨利.普尔提出三条基本管理措施

信息组织学期末试题及参考答案范文

一、单项选择题【每小题1分, 共8分】 1. 信息组织的基本对象和管理依据是__D______。 A)外在特征 B) 内容特征 C)主题特征 D) 外在特征和内容特征 2. 信息组织的方法基础是____B____。 A) 语言学 B) 语言学、逻辑学和知识分类 C) 逻辑学 D) 语言学和逻辑学 3. 不属于布尔检索的是____B_______。 A)+ B)- C) ︳ D) () 4.大量信息的组织常采用数据库方法,ISO2709与GB2901是__B___的标准格式。 A)文献数据库B)数值数据库? C)事实数据库 D)多媒体数据库 5. 在元数据中,___A_____具有内容选择和过滤机制。 A)DC B)PICS C)CDF D)RDF 6. 根据信息资源的三级组织方法,Dublin Core被划分在_B________。 A) 一级 B) 二级 C) 三级 7.在HTML语言中, 实现外联图像的语句是_______A______。 A)< A HR EF=”文件名”>…… B)< IMG SRC=”文件名”>…… C)…….. D)…. 8.在多选按钮表单设计中, 相关的HTML语句为_____B_____________。 A)

B) C) D) 二、多项选择题【每小题2分,共12分】 1.信息组织的内容包括__________ _____________________________。 A) 信息搜集与选择 B) 信息分析与揭示 C) 信息描述与加工 D) 信息整理与存储 2.Yahoo分类目录对分面原理的具体应用表现在____________________。 A) 建立分类索引 B) 根据上下文进行信息内容组合 C) 利用冒号标记信息内容 D) 提供不同的路径入口 3.网络二次信息的组织方式是____________________________。 A)搜索引擎方法 B) 词表方法 C) 主题树方法 D) 国际十进分类法 4.在Web数据库中, 数据类型有__________________________。 A) 线性数据 B) 结构化数据 C) 无结构数据 D) 半结构化数据 5.标引语言的类型有_____________________。 A) 分类语言 B) 主题语言 C) 自然语言 D) 代码语言 6.电子商务系统设计步骤包括____________。 A) 商务分析与系统设计 B) 系统实现 C) 整合运行 D) 正常运行与维护 三、填空题【每小题3分,共24分】

网络信息资源组织方式

网络信息资源组织方式 网络信息资源组织方式分为一次网络信息资源组织方式、二次网络信息资源组织方式和三次网络信息资源组织方式。一次网络信息资源是指网上传输的原始信息资源是未经过加工处理的第一手信息资源;二次网络信息资源是指将一次网络信息资源进行描述、揭示、分析和存储后,形成了有序化、系统化的网络信息资源;三次网络信息资源是指对二次网络信息资源进行组织而形成的网络信息资源。 一次网络信息资源组织方式有:文件方式(以文件名标识信息内容,用文件夹组织信息资源)、数据库方式(将搜索引擎的巡视软件采集和标引的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询)、主题树方式(将信息资源按照某种概念体系分门别类地逐层加以组织,用户通过浏览的方式层层遍历)、超文本方式(以节点和链接在网上相关信息间建立关联,将众多的网络文本信息组织成某种网状结构,可从任一节点开始随机、自然地浏览查找自己所需信息)、超媒体方式(将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织)、自由文本方式(全文数据库的全文检索)。 二次网络信息资源组织方式有:机器人搜索引擎方式、指示数据库方式(贮存的是有关网上一次信息的网址以及相关信息的描述信息)、元数据库方式(对特定网络资源的总体管理和记录)、浏览器书签方式。

三次网络信息资源组织方式有:网络数字图书馆组织方式(对虚拟图书馆和数字图书馆中的二次网络信息资源进行的再组织)、网络信息资源评价网站组织方式、元搜索引擎目录组织方式。 未来网络信息资源组织方式的发展趋势主要是两方面: 1.主题指南与分类法的结合 利用主题指南和分类法对网络资源进行组织,有助于为网络资源构造基本结构和框架,从而使信 息分布有序化。虽然现在有些网站已经使用分类主题一体化方式来组织信息,但是现有的主题指南和分类法在涵盖网络信息的数量和规模上还是有限的,但它反映了网络信息组织的一个重要趋势,而且分类主题一体化方式在现有的基础上也将不断得到完善。 2 数据库方式与超媒体方式的结合 超媒体技术是超文本与多媒体技术的结合,它使人们可通过高度链接的网络结构在各种信息库中 自由航行,找到所需要的信息。但当超媒体网络过于庞大时,就不可避免会出现“迷航”现象。因此,现代网络信息资源组织的方式最好是数据库方式和超媒体方式的结合,这也是网络信息资源组织方式的发展趋势。

信息组织学复习资料教学内容

第2章信息组织概述 1.信息组织的内涵 ●信息组织(information organization)就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使 之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能, 以满足人们信息需求的过程和活动。 ●从层次上看,信息组织包括了序化和优化两个层次,序化是基础,优化是延伸。 2.信息组织要素 ●属性与序、规范和操作是信息组织的两对基本要素,是信息组织进行的依据,信息组织学科体系就是建立在这些要素之上。 (1)属性 ●属性反映了信息的本质特征 ●事物的属性总体上可以分为外在属性和内在属性,在信息组织工作中,外在属性称为外表特征,内在属性称为内容特征。 ●信息组织的过程就是按照事物属性之间的同一性、包容性、交叉性和排斥性等关系对信息实施序化的过程。 (2)序 ●序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在在时空中的表现,即事物发展中的时间序列及排列组合、聚类 状态、结构层次等空间序列。 (3)规范 ●有序无序是针对一定参照系而言的,这个参照系就是规范。 ●信息组织规范主要包括: ①基本术语规范; ②有关信息技术规范(信息交换格式、程序设计与数据库语言、网络标准与协议 等); ③信息组织技术规范(如信息描述规则、信息代码、信息标引规则和信息组织成 果编排规则等);

④其他相关规范。 (4)操作 ●操作指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。 ●这一操作一般是依据一定的信息资源描述处理的规范,对信息资源的特征和内容进行分析、归纳、选择、记录,并在此基础上将其组织进信息资源集合和 检索工具。 3.信息描述规范 ●描述项目规范:如题名、责任者、出版社、关键词等 传统文献著录时基本描述项目分为9个大项。依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形态项;丛编项;附注项;文献标准编号及有关记载项;提要项。 《都柏林核心集》则将其描述项目分为1 5个大项。题名、作者或创作者、主题和关键词、描述、出版者、其他责任者、日期、类型、格式、资源标识符、来源、语种、关联、覆盖范围、权限管理。 ●描述文字规范:采取的文字 ●描述级别规范:详略程度 ●描述格式规范:各种描述项目的次序、描述的标识、描述项目的表达形式等 4.词汇规范 ●用词规范:同义规范、词义的规范; ●词间关系的规范:这些关系包括等同、等级、相关三种基本类型。 5.句法规范 ●引用次序:指复合主题标引和检索时,各个主题因素的组合次序。 ●辅助符号 ①关系符号:分类组织中用:+ :( );主题组织中用:—,:②联系符号:防止错误的组配关系③职能符号:明确主题标识的句法含义④逻辑组配符号。 ●句式转换

组织行为学期末考试试题

组织行为学期末考试试题1 一、判断题(下列说法对者在题前括号内打“√”,错者打“X”,每小题1 分,共15 分)(√)1、认知是指个体对感觉器官对感知的信息进行翻译、理解、判断、抽象的过程。(X )2、根据相互作用的观点,包括企业在内的组织冲突是弊大于利。 (√)3、班杜拉认为:人类的许多行为是从观察别人的行为中学习的,榜样的影响是社会学习理论的核心。 (√ )4、所谓“江山易改,本性难移”,所以一个人的性格一旦形成就很难改变。 (X )5、弗隆姆的期望理论是建立在组织内个体对自己的行为有“做”与“不做”的决定权基础之上的。 (X )6、动机与行为之间的关系向我们揭示出:一个人的外在表现与内在动机总是一致的。(√)7、能力是顺利完成某种活动所必须具备的心理特征,能力是和某种活动相联系,并表现在活动的全部过程中,因此它具有明显的针对性。 (√)8、员工对自己所在组织的认可程度、投入程度,以及认为工作对自身价值实现的重要程度称为组织认同感。 (X )9、“内因是根据”,不管在什么情况下,将成功和失败都归因于内因才是客观有效的认识。 (√)10、心理契约的破坏会导致雇员责任的减少。与离职率成正相关,与信任、工作满意和留职意愿呈负相关。严重破坏时,雇员与组织之间的关系会变得更加具有交易性。 (X )11、所有的任务型群体都是命令型群体。 (X )12、群体凝聚力是维持群体行为有效性的一种合力,凝聚力高的群体将比凝聚力低的群体更为有效。 (√)13、知识是人类实践经验的总结,是以思想内容的形式为人所掌握;而技能是人们在理论与实践活动中运用的基本动作方式,是一种操作技术,以行为方式的形式为人所掌握。(√)14、社会惰化效应说明了群体规模的增大是与个人绩效负相关的,代表的是一种协同效应。 (√)15、虚拟组织从组织外部寻找各种资源,来执行组织的一般职能,如生产、销售、技术开发等等,而把精力集中在自己最擅长的业务上。 二、单项选择题(将每题最正确答案的代号填入括号内,每小题1.5 分,共30 分) 1、要研究组织中人的外显行为的规律性,最为必须的理论基础是( ) A、社会学 B、心理学 C、人类学 D、伦理学 2、组织行为学作为一门独立的专门研究组织中心的心理与行为规律的科学,最先产生() A、二十世纪二、三十年代 B、二十世纪三、四十年代 C、二十世纪五、六十年代 D、二十世纪八、九十年代 3、在组织行为学中,把性格划分为理智型、情绪型、意志型和中间型,是依据下列哪类划分标准() A、按心理活动的某种倾向性 B、按人的行为模型 C、按思想行为的独立性 D、按何种心理机能占优势 4、在社会知觉的偏差中,由获得个体某一行为特征的突出印象,进而将此扩大成为他的整体行为特征的心理效应称为() A、首因效应和近因效应 B、晕轮效应 C、第一印象效应 D、定型效应 5、表扬、奖励员工,让他们参与管理,给他们提供培训机会,能满足员工的( ) A、尊重需要 B、交往需要 C、安全需要 D、生理需要 6、赫兹伯格认为,激励员工的关键在于( )。

《信息组织》马张华考前复习要点

《信息组织》复习要点 第一章导言 第一节信息组织的必要性 1.信息组织:根据信息检索的需要,以文本及各种类型的信息资源为对 象,通过对其内容特征等的分析、选择、标引、处理,使其有序化并以适当方式加以提供的活动。 2.信息资源:通常指一切以记录形式存在的信息载体,只是比较而言,更 侧重于对新型媒体形式的强调。(可以是图书、期刊、报纸、论文,也可以是网络上的电子资源) 3.信息检索:根据检索需要,从检索系统中检出相应信息资源的过程。4. 信息组织与信息检索有什么关系? (1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源; (2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。 第二节信息组织的形式和检索途径 1.文献组织的基本排列方式: 一般有两种基本排列方式,其一为:(固定排列法)和(按一定意义的次序排列。)(固定排列法,如档案、博物馆的收藏、光盘、录音带、缩微品。按一定意义的次序排列包括按题名字顺排序,按责任者排序等,如图书、

期刊等, ) 2. 按照检索工具的对象和特点,可以分为(文献目录)、(索引)、(机读数据库)、(网络搜索引擎)四种类型。 3. 按照标识特征,检索工具可以分哪两种基本类型? (1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。 (2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有(分类法)、(主题法)。 4.按照系统中所用的标识是否进行控制,检索工具可以分为(受控检索系统)与(自然语言检索系统)。 5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。 6.检索工具还可以按照采用的形式,分为卡片式、书本式、缩微式、电子方式等。 第三节信息组织的处理方式和研究内容 1.信息处理的基本做法:(领会) ①对信息资源特征进行描述。包括:著录或编写题录,通过记录信息资源外部特征,供用户识别或确认该资源。 ②对信息资源的内容进行浓缩。包括编写内容提要或文摘,使用户能

管理信息系统期末重点复习资料教学内容

第一章: 1:管理:按照管理目标,对管理对象进行的计划,组织,指挥,控制和协调等一系列活动。2:管理系统:是为了达到一定的组织目标,针对管理对象,由具有特定管理职能,相互间存在有机联系得各种管理机构,管理制度,管理过程,管理方法和技术等所构成的完整的组织管理体系。 3:数据:是记录下来可以被鉴别的符号,它本身并没有意义。数据经过处理仍然是数据,只有进过解释才有意义。 4:信息:是信号,符号或消息所表示的内容,用以消除对客观事物认识的不确定性,并实现对系统的控制。 5:管理信息:是对管理活动及其属性的一种客观描述,是管理活动中各种发展变化和特征的真是反映。 6:系统:由处于一定环境中的相互联系和相互作用的若干部分结合而成并为达到整体目的,具有特定功能的有机整体。 7:管理信息系统:是一个由人,计算机等组成的能进行管理信息收集,传递,储存,加工,维护和使用的系统。它能实测企业的各种运行情况,利用过去的数据预测未来,从全局出发辅助企业进行决策,利用信息控制企业的行为帮助企业实现其规划目标。 8:信息系统:是一个人造系统,它由人,硬件,软件和数据资源组成,为了及时,正确地收集,加工,存储,传递和提供决策所需的信息,实现组织中各项活动的管理,调节和控制。9:决策支持系统:是一种以计算机为工具,应用决策科学及有关学科的理论与方法,以人机交互方式辅助决策者解决半结构化和非结构化决策问题的信息系统。 10:ERP:是指建立在信息技术基础上,以系统化的管理思想,为企业决策层及员工提供决策运行手段的管理平台。 12:CRM:客户关系管理是代表增进赢利,收入和客户满意度而设计的,企业范围的商业战略,它以信息技术为手段,对业务功能进行重新设计,并对工作流程进行重组。 13:BRP:业务流程优化,企业流程再造工程是对企业的业务流程做根本性的思考和彻底重建,目的是在成本,质量,服务和速度等方面取得显著的改善,使得企业能最大限度地适应以顾客,竞争,变化为特征的现代企业经营环境。 14:广义的管理系统和狭义的管理系统的其别何在? 广义的管理系统包括了管理机构,管理对象及相应的信息系统,而狭义的一般仅指管理机构和其信息处理系统。 15:什么是数据,什么是信息?二者之间有何区别和联系? 3加4,信息是进过加工后的数据,它对接收者的行为能产生影响,对接收者的决策具有价值。数据是信息的一种重要的载体,信息是数据本身所具有的的含义。关系:信息的表现形式是数据;信息对决策有价值,因为信息可以消除不确定性;数据和信息的辨别取决于语义环境;同一个数据,不同的人可能对他做不同的处理,获得信息的价值也就不同。16:一般对管理信息可以怎样分类? 固定信息,流动信息;业务,管理,决策;内源信息,外源信息。 17:在企业信息系统中,怎样划分流动信息和固定信息? 固定信息是指在一定的时间内不会发生大的变化的信息;流动信息指在整个管理活动过程中经常发生变化的信息。划分标准是在一个完整的业务周期内是否经常发生变化。 18:信息的性质和系统的性质有哪些? 信息的性质:客观性,可传递性,可共享性,可扩散性,可压缩性,时效性。 系统的:集合性,相关性,阶层性,整体性,目的性,环境适应性。

信息管理学期末复习资料

信息管理学期末复习资料 一、名词解释 信息:香农概念——信息是二次不定性之差,不定性就是对事物认识不清楚,不知道,信息就是消除人们认识上的不定性。 哲学概念——信息时客观世界中各种事物的特征或运动状态在人脑中的 反映,它体现出了人们对事物的认识和理解程度 管理:通过计划、组织、指挥、协调、控制等基本功能,有效地利用人力、财力、物力、设备、技术、信息诸种因素,促使它们密切配合,并发挥最高效率, 以达到预期的目标。 信息管理:狭义上认为信息管理师对信息本身的管理,即采用各种技术方法和手段对信息进行组织,控制,存储,检索和规划的等,并将其引向预定 目标。 广义上认为信息管理是对信息活动诸要素进行合理的组织和控制,以 实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。信息资源:信息是普遍存在的,但信息并非全部是资源,只有满足一定条件的信息才能称之为信息资源。 狭义的信息资源:指信息本身或信息内容,即经过加工处理的,对决策者有用的数据 广义的信息资源:是信息活动中各种要素的总称(包括信息、技术、设备、资金和人等要素) 信息资源管理:是为了确保信息资源的充分开发和有效利用,以现代信息技术等为手段,对信息资源实施计划、组织、指挥、协调、控制的一种 人类管理活动。 信息经济学:把信息和信息活动当做普遍存在的社会经济现象来加以研究的学科。信息源:信息的来源 内部信息:来自组织内部,一般比较可靠,容易掌握 外部信息:从其他地方收集或买来的,要注意其正确性,需要花大力气去搜集 一次信息源:由现场直接采集的信息 二次信息源:各种文件或数据库中存储的信息 静态信息:具有相对稳定性,在一定时期内不发生根本变化的信息 动态信息:反映生产经营活动中的实际进程和实际状态的信息。 信息采集:是信息资源能够得以充分开发和有效利用的基础。指一切信息工作的信息采集,不只是指信息服务部门为用户的需求所进行的信息采集。信息组织:是对所采集的信息实施有序化的过程,是信息管理过程的核心内容之一 信息流:具有动态含义,它是一种定向运动着的信息所形成的流 信息处理:一切为更好地利用信息而对信息所实施的处理工作过程,都称为信息处理。信息处理过程要经过几个环节:收集、加工、传递、存储、检 索、使用、反馈等 内源信息流:指来源于经营系统内部的或经营企业内部的信息流动 外源信息流:来自经营部门之外,但与经营部门的经营活动有着密切联系的,外部社会环境和经营环境流入经营内部的信息流。

信息组织复习要点

复习要点 第一章 一、名词解释: 信息组织、检索语言、索引 三、其它要点: 1.信息组织处理层次 2.信息组织与信息检索关系 3.控制语言 4.检索工具的类型 第五章 一、名词解释: 分类法、等级列举式分类法、类目索引、引用次序、同位类、交替类目、网络分类搜索引擎、复分表 二、问答题: 1.信息资源分类的特征和作用是什么? 2.什么是等级列举式分类法?其特点和不足是什么? 3.怎样判断分类法基本大类设置的优劣? 4.分类法是由哪些部分组成的?什么是基本部类、基本序列、基本大类、简表?我国分类法的基本部类是什么? 5.复分表的作用和使用中应注意的问题? 6.分类标记制度有哪些?各有什么特点? 7.分类标记采用哪些标记技术? 8.分类法对横向关系的处理采用了哪些方式? 9.文献分类法类目之间有哪些基本关系?它们的表现形式有哪些? 10.网络分类法与传统文献分类法有哪些不同? 三、其它要点: 1.类目索引的类型

2.对标记符号有哪些基本要求? 3.分类标记的种类 4.引用次序的作用 第七章 一、名词解释: 分类标引、使用本、同类书区分号 二、问答题: 1. 确定使用本通常包括哪些内容? 2. 分类标引的基本规则有哪些? 3. 试述同类书区分的意义和排列方法。 三、其它要点: 1.分类标引有哪些基本要求? 2.《中图法》组配标引的类型 3.标引工作程序:归类、给号 4.单主题信息资源的分类标引 5.多主题信息资源的分类标引 6.分类索书号的编制 第八章 一、名词解释: 主题法、标题法、元词法、叙词法、叙词、双语种索引、范畴索引、词族索引、轮排索引 二、问答题: 1. 主题法有哪些基本类型? 2. 概要说明范畴索引、词族索引、轮排索引的作用和编制方法。 3.为什么要对先祖度进行控制?

[第3章信息组织的原理与方法] 信息组织方法有哪些

[第3章信息组织的原理与方法] 信息组织方法 有哪些 第3 章信息组织的原理与方法 有了正确的理论,才有正确的实践 信息组织的原理 系统原理 信息组织是一个系统化的过程,其最终目的是将无序的零散的信息层次化、结构化,形成一种有序的体系或系统,因此,系统科学是信息组织的重要理论基础,对信息组织有极为重要的指导意义。 在信息组织系统中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联,那么信息系统的整体功能将大于各个信息单元的功能之总和。也就是说,这将能充分发挥信息资源的价值和作用。不仅如此,在信息组织活动中,类目体系的展开、主题词族的编制、信息的分析等都体现着系统的思想。基于这一原理,信息组织的目标是要建立一个有效的方便检索的信息系统。 语言学原理 具体而言,信息组织中的语言问题重要性在于:

信息组织的对象都是用语言描述的各种各样的具有语义性和准语义性的信息。没有语言就不可能有对事物的准确认识。 信息描述和信息揭示中需要运用大量的语言工具。对语言的理解和掌握是人类区别于动物的一个根本标志,某些动物虽然也能说人话,有时似乎也能“理解”人类语言,但这不是真正意义上的,它们对人类语言的使用仅仅是动物高级条件反射。只有人才能准确识别、记忆和领会语言。人对事物的认识几乎都要转化语言,只可意会不可言传的事物不能为其他人所了解。 在信息组织的现代技术手段的使用上,信息的编码、算法语言、程序语言、机器语言运用和自然语言理解和处理都充分体现了语言的重要作用。 逻辑学原理 信息组织是一种智力活动,离不开人的逻辑思维,信息组织本身是思维的一种表现形式,概念是思维的元素,逻辑则是思维的规则。所以信息组织自然包含相应的逻辑学问题。实践证明,逻辑思维越强的信息组织者其信息组织工作也越好。事实上,信息组织是对信息对象的各个元素,经过从事物到概念再到语言的层层递进的分析之后,运用科学思维使之序化的一个复杂的过程。 1、概念的关系 概念是事物本质属性的概括,其内涵是它所指事物的本质属性的总和。

信息组织试题库参考答案

信息组织题库参考答案 一.名词解释 1.仿分以某一类的子目作为复分依据的方法叫仿照复分,简称仿分。仿分是为大类普遍采用的复分 方法,使用范围一般不超出该大类。 2.倒排文档指将文档记录中的可检字段及其属性值,或称文献特征标识(即索引单元,如题名、著 者、叙词、自由词等)抽取出来,按照字段属性的某种顺序进行排序与存储,使之成为可以用作索引的文档,倒排文档也可称为索引文档。 3.八分法又叫八分制,是指同位类超过十个时,用1到8来标记同位类,到9时不用9,而用91… 99来标记与1到8相同级位的类。采用此法,突破了号码的级位代表类目级别的等级性。 4.信息描述是指根据一定的信息管理规则和技术标准,将存在于某一物理载体上的信息源的外在特 征和部分内容特征进行选择与记录的过程。 5.层累制也称层累制标记法,结构型标记法或表达性标记法,是一种与类目等级相适应的等级标 记制度,其特点是根据类目的不同等级,分别给予相应的不同位数号码,同位类再以符号的顺序依次相配,它的表达性强,能够显示类目纵向层层区分,横向并列的体系结构。 6.分类是根据事物的某种属性聚集相同事物、区分不同事物的活动。同类事物即指具有某些共同 属性的一组事物的集合。 7.UDC是《国际十进分类法》的简称。是在国际目录学会的主持下编成的。它是列举和组配相结合 分类法的代表,是唯一一部受到世界各国不同程度利用的,流行最广泛的图书资料分类法。 8.信息组织即信息的序化和优化。利用一定的科学规律和方法,通过对信息外在特征和内容特征的 描述和序化,实现无序信息流向有序信息流的转换,保证用户的有效获取。 9.信息标引采用语词或号码标识揭示与替代信息内容特征的活动。 10.XML 可扩展标记语言XML是SGML的一个重要分支,可提供描述结构化资料的格式,是用来自动描 述信息的一种新型的国际标准语言。 11.关键词法是一种以文献或题名中的自然语词作为描述和标引信息资源的标识,并提供字顺查检途 径的信息组织法。 12.词族索引是将主表和附表中具有属分等级语义关系(其中包括主题词之间的包含关系和整体关 系)的叙词,首先按照等级形式分别集合词族,然后依据每个词族中概念含义最广泛的族首词字顺编排而成的辅助索引。 13.等级体系分类法也叫体系分类法或列举式分类法,是一种以知识分类为基础,按照从总到分、 从一般到特殊、从低级到高级、从简单到复杂的逻辑次序,层层展开每门学科知识的类目排列表。 14.语法信息组织法是指以信息的形式特征为依据序化信息的方法。常见的语法信息组织法有字顺 组织法、代码组织法、地序组织法、时序组织法等。 15.模糊检索也叫概念检索,即系统不仅可根据输入的关键词进行检索,而且会自动地采用该关键 词的同义词和近义词进行查询以提高检索效率。 16.多元搜索引擎也被称为搜索引擎之上的搜索引擎。用户只需递交一次检索请求,由多元搜索引擎 负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以统一的格式呈现到用户面前。 17.超媒体存取超文本与多媒体技术的结合称为超媒体,超媒体存取的特点是将文字、表格、声音、 图像、图形等多媒体信息以超文本格式组织在一起,使用户可以通过高度联接的网络结构,在各种信息库中沿链接访问各类信息。 18.虚拟图书馆是针对某学科或专业领域的需要,将互联网上的有关领域的各类信息资源线索,包括

信息组织期末复习资料

信息检索需求的多样化 (1)文献检索:是以文献为检索对象的信息检索。它为用户提供的是与用户的信息需求相关的文献信息,它的目的是相关文献的出处和收藏处所。文献检索的结果是提供与课题相关的数篇文献的线索或原文,供用户参考. (2)数据检索:是以数值和图表形式表示的数据为检索对象的信息检索。数据检索是一种确定性检索.(3)事实检索:是以从文献中抽取的事项为检索内容的信息检索。 信息标引:就是对信息内容进行分析并充分而有效地予以揭示。揭示信息的内容是检索信息、利用信息的 前提条件。从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。准确标引信息要求准确的内容分析,否则就会出现错误标引。 信息系统组织:信息通过特征描述和内容揭示,获得了表示信息的标识,但这只是针对某一文献和信息 单元的,把这些信息有序地组织起来才完成了信息组织的过程,这个过程就是信息系统组织。信息系统组织 是把描述和标引的信息实体和信息记录组织成一个有序的系统。 一、信息组织方法:(一)按组织对象分:文献实体组织与信息内容组织(二)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织(三)常用信息组织方法: 1.分类组织法 2.主题组织法 3. 集成组织法 三、信息组织手段1、人工组织2、自动组织 1、分类检索语言:分类检索语言习惯简称分类语言或分类法,分类检索语言语族主要有三个语支,即(1)等级体系分类语言(2)分析综合分类语言(3)半分析综合分类语言。 2、主题检索语言(1)标引词语言(2)单元词语言(3)叙词语言 检索语言词汇控制的意义:检索语言构成材料就是词汇,把词汇按某种方式组织起来构成检索语言词 典,它是标引和检索的工具。检索语言的词汇控制又称规范化处理。由于表述信息内容的词汇非常庞杂,日 常的自然语言词汇并非都能准确表达信息的学科和主题内容。 自然语言缺点(1)词汇的同义现象。(2)词汇的多义现象。(3)词汇语义不清或语义不确定。(4)词量庞大(5)词间关系不明晰在现行的一些检索系统中,也比较广泛地直接采用自然语言检索,它虽然节省了词汇控制的成本,但却是以牺牲检索效率为代价的。因此,完全采用自然语言进行信息组织的系统并不是理想的检索系统。即便是面对互联网急剧增长的信息资源,人们也越来越感到需要进行规范化控制。由此有了规范化检索语言在网络信息组织中的应用研究,有了网络本体语言的开发。网络信息组织从自由走向规范足以说明词汇控制的意义。 检索语言词汇控制的内容:词汇控制的目的是为了使检索词符合唯一性、规律性、定型性、通用性和准 确性。为了达到这个目标,应该从以下几方面进行词汇控制。 (1)词量控制。词量控制是指对收入词表的词汇进行压缩、精选,使之与所要标引的信息数量和检索要求相适应。(2)词类控制。自然语言词汇有多种类别,如名词、动词、形容词、副词、介词、叹词,还有大量的词组。(3)词形控制。词汇也存在不同的书面表达方式,如不同的次序、简繁体、单复数、不同拼写法,以及标点符号、字符、数字等,为了实现每个词词义和词性的唯一性,必须进行词形控制。(4)词义控制。检索语言中的每个词汇都只表示一个概念,即使检索语言词汇一般都比较精炼和简短,也会出现一词多义和同形异义现象。因此,必要时在主题词或类目词后加限定词,加含义及范围注释,或附加简明定义等。(5)词间关系控制。在情报检索语言词典编制中,对词汇语义和词间关系必须控制,这是为了词典中每个词汇都有独立的语义,词间关系能形成一个语义网。(6)专指度控制。检索语言词汇的专指度是指其 语义的内涵与外延与信息主题内容的切合程度。 信息检索系统由六个子系统构成:(1)信息选择子系统(2)标引子系统(3)词表子系统(4)检索子系统(5)用户与系统之间的交互子系统(6)匹配子系统即对信息标引与提问标引进行匹配的子系统。 从系统构成分析可见,检索语言和标引是系统的中心环节,它起着承上启下,连接用户与系统的关键作用。概念之间的关系(一)属种关系:它是指一个概念的外延包含另一概念的全部外延,其中,外延大的概念叫属概念,外延小的概念叫种概念。(二)同一关系:它是指两概念在外延上完全重合。(三)交叉

相关文档
相关文档 最新文档