文档库 最新最全的文档下载
当前位置:文档库 › 信息组织学期末复习题及答案

信息组织学期末复习题及答案

信息组织学期末复习题

一、单项选择题.

1. 标引语言是表达文献主题概念和文献需求主题概念的简明性、单一性和______的概念标识系统。

A) 规范性B) 关联性

C) 受控性D) 新颖性

2. 分类应遵守_____、完整性和科学性三条基本规则。

A) 惟一性B)时效性C)经济性?D)兼容性

3. ……语法表示__________。

A)链接图像 B)链接声音

C)链接文本D)链接网页

4. XML是SGML的______。

A) 一个应用 B) 一个并列的语言

C) 前身D) 子集

5.按照UKOLIN分级方法ISO 2709属于________级元数据。

A) 一B) 二

C) 三 D) 四

6.UDC的标记制度的大类用______位数字标记。

A) 一B) 二

C) 三D) 四

7. 第一部标题表《美国国会图书馆标题表》于______年诞生。

A) 1990B) 1810

C) 1909D) 1809

8. 《中图法》采用_______做基本标记符号。

A) 单纯的阿拉伯数字B)单纯的拉丁字母

C) 拉丁字母阿拉伯数字D)汉字

9. 因特网上内容选择平台元数据是____________.

A) DCED B) CDF

C) PICS D) MCF

10. OCLC系统采用的分类语言是______。

A) 中图法?B) 科图法?C)杜威分类法?D)国际十进分类法

二、填空题

《汉语主题词表》由___________、______________和_______________等模块构成。

1.电子商务系统的设计步骤是______________、_____________、

_________、_______________等阶段。

2.XML文档的逻辑结构由___________、_______________、

______________等部分组成。?

3.电子政务系统一般采用________、________,_____________、

_____________四层的体系结构。

4.现将一视频文件A.avi插入到一个网页上(高、宽各为150像素),

要求在鼠标经过其上方时视频立即播放,其插入语句是

_________________________________________________________

_________________。

5.在DL的信息组织中,DC-Lib由____个元素组成,其中题名、关联

等____个元素又含有各自的子元素。

6.MARC21(XML)可以和

__________________________________________

等多种格式实现转换。

三、简答题

1.如何理解信息组织的理论基础?

2.怎样构建搜索引擎?

3.企业的知识管理系统如何组织?

4.体系分类法通常结构有哪些组成部分?

四、论述题?

元数据的发展及应用。

答案

一、B A A D C A C C C C

二、

1.主表、附表、辅助索引

2.商务分析阶段、系统设计阶段、系统实现阶段、整合运行阶段

3.XML声明、DTD(文档类型定义)、XML元素集(实例)

4.应用层、交换层、数据层、网络层

5.

START=MOUSEOVER>

6.18、11

7.Tagging Transform ations, Caracter Set Conversion,Dublin

Core Records, Mods Records, Other XML Formats

三、简答题

1. 如何理解信息组织的理论基础?

系统论、耗散结构理论和协同论是信息组织的理论基础。

①系统论。

系统科学的思想是20世纪20年代由奥地利学者贝塔朗菲(Ludwig Von Bertalanffy)提出来的,他把系统定义为相互作用的诸要素的复合体,认为系统的定义可以确定为处于一定的相互关系中并与环境发生关系的各组成部分的总体。系统论认为,系统内部各要素不是一种简单的结合,而是相互关联地有机结合在一起。正是由于系统要素间这种有机的相互关联关系,系统的整体功能才产生了质的飞跃,远远超出各单个要素的功能之总和。这就是系统论的“整体大于部分之和”的原理。在信息组织中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联性,那么,信息系统的整体功能将大于各个信息单元的功能之总和。也就是说,这将能充分发挥信息资源的价值与作用。基于这一原理,信息组织的目标是要建立信息系统。

②耗散结构理论。

本世纪60年代,比利时学者普里高津(Ilya Prigogine)提出了一个著名论断:在开放系统中,系统不断与外界进行物质和能量的交换,熵趋于最小值,能量远离平衡,混乱度最小,从原来无序结构转为一种时间、空间和功能上的有序结构。这就是适于一切开放系统的耗散结构理论。耗散结构是一种自组织结构。自组织的机理是:系统内各组成部分或要素间有着强烈的相互作用,由此产生多方面的相互影响、制约的相干状态,致使各级组织不断地与外界环境进行交换,从而使自身保持稳定,在动态中实现自身的有序结构和特定功能。这样使得系统在非平衡态下,实现的是动态有序的活结构,而不是孤立、趋于无序的死结构,也不是变化微小、不能产生新组织结构的近平衡结构。普里高津找到了非平衡、开放系统是有序之源。这一原理给信息组织的启迪是:所要建立的信息系统应该是一个开放系统。现实存在的包括信息组织和信息检索在内的信息系统正是这样一个开放系统,它与外界进行着信息的交换,既采集信息也输出信息。

③协同论。

协同学是斯图加特大学物理学教授海尔曼.哈肯(H. Haken)创立的,以其系统演化方程为中心内容。这一内容有:自然界事物是多因素体系,即复杂系统;系统的总状态取决于作用,至少非线性的驱动力和涨落力,即系统所产生的扰动是不可缺少的;注重系统内要素的相互作用的同时,环境的影响也不能忽视,前者主要表现为涨落,后者主要表现为外控制参量;时空也是影响系统状态的要素,因为运动是主体的运动、历史的运动。由于系统内各要素的协同作用,从定量的深度决定着开放系统的自组织程度。于是,这种描述化为一个公式:相互作用→自组织→有序。一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的,这正是来自协同论的指导思想:无论什么系统从无序向有序的演化,都是大量子系统之间相互作用而又协同一致的结果。

2. 怎样构建搜索引擎?

建立搜索引擎是将无序的网络信息资源进行有序化组织的有效方法。一个搜索引擎一般由搜索器(Robot Spider), 索引器(Indexer),索引数据库(Index Database),检索器(Searcher),和用户接口(User Interface)等五个部分组成。构建搜索引擎分别从这五个部分入手,实现各个模块的功能。

图8.1 搜索引擎的系统结构

(1)搜索器

搜索器是从因特网上采集信息的专用程序,亦称网络机器人(Robot),蜘蛛(Spider),爬虫(worm)等。其功能是日夜不停地在网上漫游,不断地从网上采集并及时送回相关信息。它不仅要尽可能多地采集各种类型的新信息,而且要定期更新已经搜索过的旧信息,及时更新搜索引擎的索引数据库。搜索器搜集信息的方法策略有多种:从基本网址集开始,用“滾雪球”的方式逐步扩大,直至整个因特网;从国家(.cn? .uk? .de .Fr…)或地区(.hk? .mc)域名划分,逐步展开,对某个子空间进行遍历;从网站类别(.gov? .edu? .com? .org…)划分对某一类的网站进行穷尽搜索。

(2)索引器(indexer)

索引器从搜索器返回的纯文本信息文件抽取索引项(属性),生成倒排工作文件,进而逐步建立索引数据库。其工作过程可分三步进行。

(3)索引数据库 ( index? database )

索引数据库是搜索引擎的核心,它既是索引器提供的产品,又是搜索器进行工作的基础。索引数据库的结构如图所示,它由四类文件组成:倒排地址表 ( IALi )、倒排索引ixfi及其它索引文件 ( ixf i1、ixf i2、ixf i3 ) 和纯文本 ( fulltext ) 文件。

我们通过网站搜索引擎检索的结果是初步的,在浏览相关fulltext的命中记录后,如果需要进一步了解信息源,可以点击该记录URLs,则通过超链接,立即

跳转到相应网站提出详细信息供用户使用。这样,索引数据库实际上已成为搜索引擎的核心,它将因特网无序的海量信息资源有序化,用户可以很容易得到自己感兴趣的信息资源。

(4)检索器 ( Searcher )

检索器是对具体搜索引擎所配置的索引数据库而研制的专用检索程序包。它的职责是从用户接口接受并理解用户需求将其转换成检索指令,对索引数据库实施检索,并将结果集按内容的相关度排序,并排序结果文件向用户反馈。

(5)用户接口 ( User interface )

用户接口的作用是接受用户的检索需求的输入,并进语法检查,使其规范。如,概念之间的逻辑运算符AND、OR、NOT,通配符和连接号、括号配对、词组定界符等的正确使用,否则,返回用户进行修改,调整后再传给Searcher对索引数据库进行检索,并适时地显示检索器反馈的检索结果。用户接口需要人性化的设计。

3. 企业的知识管理系统如何组织?

企业知识门EKP是企业员工日常工作所涉及相关主题内容的统一入口,员工可以通过它方便地了解今天的最新消息、当天的工作内容、完成这些工作所需的知识等。通过企业知识门户,任何员工都可以实时地与工作团队中的其它成员取得联系、寻找到能够提供帮助的专家或者快速连接到相关的知识。企业知识门户的使用对象是企业员工,它的建立和使用可以大大提高企业范围内的知识共享,并由此提高企业员工的工作效率。

企业知识门户具有信息集成、知识分类、个性化展示和系统资源管理的集成。知识门户的基本服务包括:

经验知识管理:案例管理、知识文档、工作总结、专家网络、培训系统、考试系统;

事务协作管理:规范制度、审批流程、公文流转、个人工作台,团队协作(TeamRoom);

组织文化管理:内部论坛、网上调查、贺卡系统、电子期刊、员工活动、文化窗口;

信息发布管理:主页管理、新闻系统、电子邮件;

系统维护管理:系统配置库、催办系统、登录配置库、网络域搜索、帮助系统;

可选扩展模块:人事档案管理、ISO文控管理、合同管理、图书管理、技术支持;

知识管理工具:CKO工具箱、知识推进、知识地图、知识评测、知识审计。

4. 体系分类法通常结构有哪些组成部分?

体系分类法,又称等级分类法、列举式分类法,是一种直接体现知识分类的等级制概念标识系统。它是对概括文献信息内容及某些外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成的。体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径。

(1)体系分类法的宏观结构

虽然各种体系分类法的宏观结构不尽一致,但一般来说,可以将体系分类法的宏观结构如下(见图2.1):

①分类表

分类表,也称类目表,它是根据类目之间的关系,按照一定的原则组织起来的类目一览表。分类表是分类法的主体,因此,人们有时将分类表等同于分类法。

(1)体系分类法的宏观结构

虽然各种体系分类法的宏观结构不尽一致,但一般来说,可以将体系分类法的宏观结构如下(见图2.1):

①分类表

分类表,也称类目表,它是根据类目之间的关系,按照一定的原则组织起来的类目一览表。分类表是分类法的主体,因此,人们有时将分类表等同于分类法。

体系分类法通常有

(1)分类表,也称类目表,它是根据类目之间的关系,按照一定的原则组织起来的类目一览表。分类表是分类法的主体,因此,人们有时将分类表等同于分类法。

编制和使用说明

(2)分类法的编制说明一般是对分类表的编制目的和适用范围、编制原则、体系结构、辅助表、标记符号、注释等予以介绍和解释,以使人们对分类表有一个基本的、全面了解。编制说明一般置于分类表之前。当分类法修订再版时,一般还会加上新版说明或修订说明,作为对原编制说明的补充,其内容主要是介绍新版的变动内容。

索引

(3)分类法索引,又称类目索引,它是一种按类名及类目相关概念名称字顺查找相应类号的类表辅助工具。它一般是将分类表中有检索意义的全部类目名称、

类名的同义词、注释中出现的概念名称、甚至一些分类表中未列出的概念名称,按其字顺排列,并在每一名称(标目)后注明相应的类号,方便分类法的使用者按主题概念名称字顺查找类号,而且将分类表中被分散的同一事物不同方面的类目集中,使分类法在一定程度上具有主题法的性能。

四、论述题

元数据的发展及应用。

所谓元数据, 就是描述数据的数据(data that describes data)或“关于数据的数据”(data about data)。它是促进数据处理和标引数据的数据;也是人们组织和发现Internet信息资源的数据。信息数字化、多媒体及互联网络等技术的综合发展使人类共享一体化的信息资源最终成为可能。通过Internet,人们发布信息和获取信息变得方便、容易;同时Internet是个开放的体系,任何人都可以既是信息的接受者又是信息的提供者。因此,随着WWW

的发展,网络信息资源呈无限增长的趋势。与此伴随而来的问题是:如何在浩瀚的信息海洋中找到自己真正所需的信息?因此资源发现成为INTERNET应用的瓶颈与焦点。于是人们希望通过对资源描述的工具——元数据(Metadata)这一课题的探讨及实施来促进信息资源描述、组织、发现及利用效率的提高。元数据是描述数据的数据。它是专门用来描述数据的特征和属性的。它也是描述和组织Internet信息资源、发现Internet信息资源的工具。

在信息资源主导类型已由印刷型转变为数字型的现实背景下,元数据的研究更是一个十分具有现实意义的课题。现有的一些由专业人员提供的不仅复杂并被结构化的特殊体系方案,如MARC、GILS(Government Information Locator Service)、TEI (Text Encoding Initiative)header、FGDC(Federal Geographic Data Committee)和IAFA模块(用来描述匿名的FTP档案和基于主题的信息网关),这些标准虽然能达到一定的查准率,但在数据加工标引工作上既费时又费人工,并且需要的是专业的从业人员,因此对于充斥于网上的海量信息可以说是无能为力。而各种网络搜索引擎(如Lycos、Alta Vista、Open Text等)的蓬勃发展虽然曾在一定程度上促进了资源发现,然而现实并非如我们所预想的那么简单:搜索引擎虽然对许多资源有自动索引功能,利用它们我们固然可以得到大量的相关结果,但其精确度却实在不容人乐观;同时还可能会错过一些潜在的相关资源,因为它们没有被使用适当的术语进行标引。这恐怕是当前INTERNET信息检索中最突出的问题。此时一个更简单有效的元数据方案显得十分吸引人。而且,随着因特网上的搜索服务的改进,从各种复杂或简单的元数据格式到各个不同的用户团体之间,也特别需要一种标准化的语言或交换格式。

元数据的主要功能:

(1) 描述Internet 数据内容和本质特征,存储相应的检索路径。

(2) 使Internet 数据便于发现,提高了信息资源的查准率和查全率。

(3) 提供数据之间的联系,指出相关数据的地址和存取方法。

(4) 对Internet资源进行分类,有效地选择用户所感兴趣的信息。对数据管理进行有效的控制,防止一些用户(如孩子)存取某些数据。

(5) 对某些缺少文本的数据(如,声音、图像)进行文字说明,以便对描述对象有一个完整描述。

相关文档
相关文档 最新文档