文档库 最新最全的文档下载
当前位置:文档库 › 东北大学信息检索复习要点

东北大学信息检索复习要点

东北大学信息检索复习要点
东北大学信息检索复习要点

信息检索复习要点2013

第一讲网页采集

1.网页采集器的基本原理[简答题]

网页采集器一般称为“网络蜘蛛”,也叫“网页机器人”。网络蜘蛛(Web Spider)把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。

网络蜘蛛是通过网页的链接地址来寻找网页,从一个网页开始,读取网页的内容,保存下来,找到在网页中的链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去。

第二讲分析处理

1.网页分析处理的必要性[简答题]

分析处理能帮助得到更加准确的查询结果,重复的利用时间和资源。

2.分词程序的设计[综合设计题]

1)分词是将连续的字序列按照一定的规范重新组合成词序列的过程,中文分词与其他

分词不同,比如:英文中单词之间是以空格作为自然分界符;中文只是字、句、段有明显的分界符;词没有一个形式上分界符;从字串到词串,是一个降低不确定性的过程。

2)利用找到歧义字段、建立歧义字段库解决分词歧义问题。

3)利用正向最大匹配法(流程图)、逆向最大匹配法(流程图)及最大概率分词法进行分

词。

●正向最大匹配法(流程图见PPT)

●逆向最大匹配法:

1)将文章分成句子(通过标点符号来实现);

2)循环的读入每一个句子S,设句子中的字数为n;

3)设置一个最大词长度,就是我们要截取的词的最大长度max

4)从句子中取n-max 到n 的字符串subword,去字典中查找是否有这个词。如果有就

走(5),没有就走(6);

5)记住subword,从n-max 付值给n,继续执行(4),直到n=0.

6)将max-1,再执行(4)。

●最大概率分词法:列出可能的拆分结果,查表,结果大的,为最终结果。

基本细想:

1)一个待切分的汉字串可能包含多种分词结果

2)将其中概率最大的那个作为该字串的分词结果

分词算法:

1)对一个待分词的字串S,按照从左到右的顺序取出全部候选词w1, w2 , … ,wi, … , wn ;

2)到词典中查出每个候选词的概率值P(wi) ,并记录每个候选词的全部左邻词;

3)按照公式1计算每个候选词的累计概率,同时比较得到每个候选词的最佳左邻词;

4)如果当前词wn是字串S的尾词,且累计概率P' (wn)最大,则wn 就是S的终点词;

5)从wn开始,按照从右到左顺序,依次将每个词的最佳左邻词输出,即为S的分词结

果。

3.计算准确率、召回率和F值[计算题]

答:准确率 P(Precision):结果中的正确样例数与结果中全部样例总数的比值。

召回率 R(Recall):结果中的正确样例数与实际存在的正确样例数的比值。

F 值:准确率和召回率的加权平均,一般用 F1。

(注意:让求的是 F1 还是 F 其它,然后带入相应的值β值。)

举例:

用户利用某信息检索系统在资料库中检索与和服相关的文章。系统返回给用户5篇文章:《日本和服简介》、《和服的穿着方法》

、《在日本试穿和服》、《新款和服特价销售》、《青岛东和服装厂简介》。已知资料库中共有40篇文章,其中有8篇与和服有关的。请计算此次检索的准确率、召回率和F1值。

答:结果中正确的样例数为:4

结果集中的总样例数为:5

P 准确率 = 4/5*100%=80%

实际存在的正确的样例数为 8

R 召回率 = 4/8*100%=50%

F1=(2*80%*50%)/(80%+50%)=(2*4/5*1/2)/(4/5+1/2)=(4/5)/(13/10)=8/13

第三讲 信息检索模型

1. 各种信息检索模型的原理[简答题]

按所使用的数学方法分类

基于集合论——布尔模型;基于线性代数——向量空间模型;基于概率论——概率模型

(1) 布尔模型的原理

1) 布尔模型信息检索模型是最简单的信息检索模型,是基于集合理论和布尔代数的

一种简单的检索模型。

2) 文献表示为不带权重的标引词的集合。

3) 查询表示为标引词的布尔表达式,用逻辑符“and”、“or”、“not”来组织关键词表达

式。

4) 联系机制为:布尔表达式转换为集合表达式,即布尔算子and 、or 、not 替换为交、

并、补。

5) 在结果集合里的文本是相关的,其他是不相关的。

(2) 向量空间模型的原理

将文献表示为带权重的标引词的集合,权重表示该索引词与该文本的相关程度。将用户的查询也表示为带权重的标引词的集合,权重表示标引词与用户需求的相关程度。将文本与用户的查询的相似度转化为向量(t 维空间的向量)之间的计算,可以采用向量内积或向量夹角余弦方式进行计算。查询被当作为假想的文本。

1) 向量模型用检索项的向量空间来表示用户的查询要求和数据库文档信息。查询结果是

根据向量空间的相似性而排列的。

2) 向量空间模型可方便地产生有效的查询结果,能提供相关文档的文摘,并对查询结果

进行分类,为用户提供准确的信息。

3) 向量空间模型的基本思想是以向量来表示文本:(W1,W2,W3……Wn ),其中 Wi 为第

i 个特征项的权重,那么选取什么作为特征项呢,一般可以选择字、词或词组。

4) 要将文本表示为向量空间中的一个向量,就首先要将文本分词,由这些词作为向量的

维数来表示文本。

(3) 概率模型的原理

2.基于向量空间模型的搜索引擎的设计[综合设计题] 1)概念、定义及用户需求:

向量空间模型是基于线性代数的一种信息检索模型,它用检查项的向量空间来表示用户的查询要求和数据库文档信息,查询结果是根据向量空间的相似性而排列的。

向量空间模型可方便地产生有效的查询结果,能提供相关文档的文摘,并对查询结果进行分类,为用户提供准确的信息。

2) 基本思想、算法和数学推导

向量空间模型的基本思想是以向量来表示文本:(W1,W2,W3……Wn),其中Wi为第i 个特征项的权重,那么选取什么作为特征项呢,一般可以选择字、词或词组。要将文本表示为向量空间中的一个向量,就首先要将文本分词,由这些词作为向量的维数来表示文本。

D(文献表示)

文本表示为带权重的标引词的集合,dj={w1,j, w2,j, …, wt,j}

权重表示该标引词与该文本的相关程度

Q(查询)

查询也表示为带权重的标引词的集合,q={w1,q, w2,q, …, wt,q}

权重表示标引词与用户需求的相关程度

F(联系机制)

文本和查询有同样的表示(t维空间的向量)

查询被当作为假想的文本

R(排序)

用向量夹角的余弦计算dj和q的相似度

可能遇到的技术难点有两个方面:特征项权重、降维

3)可能遇到的技术难点:特征项权重、降维

索引过程首先要从文献中抽取重要词,把它们映射到特征项集中,进行权重计算。由于文献中不同词汇的出现频率随文章的内容和作者的习惯而不同,因此,最初的索引系统都是从应用词频开始的。实际应用中显得有些粗糙,比如:为什么中频词好?两个阈值怎么选取?等等,但是,这些思想为信息检索系统中项的选取奠定了基础。

4)改良方案

简单地把所有的词汇都作为文献的特征项,检索效果并不很好,不同的词汇对文献的表示作用不同。一般说来,常用词在所有文献中都有着较高的频率,区分度低;罕用词在文献集中的出现次数较少,难以确定它们的统计规律,相关度低;而中等频率的词汇常常与文献所表示的主题相关,区分度较高,表示能力最强,最有价值。

有价值的特征项应具备以下特征:相关度(与文献内容有关,以便在需要时进行索引项的检索)区分度(能将一篇文献与其它文献区分开),通过项频率tf(文献内频率)和反比文献频率idf(inverse document frequency)来度量特征项的价值。

5)用向量空间构造的搜索引擎的应用的展望.

3.计算用向量表示的网页的相似度[计算题]

注意:权值的值实际上是由tf*Idf 算出来的,如果题目中未给出相应的值,则可以通过tf*Idf 算出来,具体算法见13题。

13.计算特征项权重(tf*idf方法)[计算题]

公式:tf*log(N/df)

其中n 为文献的个数;

tf 为该词在当前文献中出现的次数;

df 为出现该词的文献的个数。

例题详见PPT 3 建模

第四讲跨语言信息检索

1.跨语言信息检索的原理[简答题]

跨语言信息检索(CLIR)是指以一种语言的提问式检索出其它语言信息的一种检索方法。

一般认为,跨语言信息检索是信息检索与机器翻译相结合的技术.跨语言信息检索是涉及到多种新的概念,是各种技术的有机结合。一般CLIR系统包含以下三个步骤:

(1)多语言信息的搜集以及存储;

(2)应用NLP、机器翻译等技术实现源语言与目标语言的统一;

(3)利用传统的单语检索技术实现查询与文档之间的匹配。

其中,步骤(2)是实现CLIR的关键。根据翻译方向的不同;当前的跨语言检索方法大体可以分成以下四种种方式:将源语言表示的查询翻译到目标语言,即查询翻译方法;将目标语言表示的文档翻译到源语言,即文档翻译方法;将查询和文档同时翻译到另一中间语言,即中间语言翻译方法。除此之外,还有基于本体的非翻译方法

2.基于规则的机器翻译方法的原理[简答题]

又称传统的翻译方法,是基于语言规则的理性方法,,强调人对语言知识的理性整理。基于规则的机器翻译方法认为翻译的过程是需要对源语言的分析和源语言意义的表示,然后再生成等价的目标语言的过程。根据翻译过程的不同,规则方法可分为两种主要方法:基于转换的方法的翻译过程包括三个阶段:分析得到一种源语言的抽象表示;把源语言的抽象表示转换为目标语言的抽象表示;由目标语言的抽象表示生成目标语言。基于中间语言的方法在对源语言分析后产生的是中间语言,而目标语言的生成是直接由这种中间语言开始的。

3.基于实例的机器翻译方法的原理[简答题]

基于实例的机器翻译的本质是“以翻译实例为基础,基于相似原理的机器翻译”,其利用的主要知识源是预处理过的双语语料和翻译词典。基于实例的翻译过程通常包括三步:在翻译实例库中搜索匹配片段;确定相应的译文片段;重新组合译文片段以得到最终翻译。

第五讲文本分类

1.文本分类的一般过程[简答题]

文本自动分类是指在给定的分类体系下,根据文本的内容用计算机程序确定文本所属类别的过程。一般采用机器学习的方法进行自动文本分类。即:基于训练集的文本自动分类。

文本分类的一般过程为:

1.收集训练集和测试集,对文本进行预处理

2.对文本类别进行人工标注

3.对文本进行特征提取

4.训练(学习)

5.评价

a)精确率、召回率、F1

宏平均(关于类别的均值),微平均(关于文本的均值)

2.基于KNN和核心向量法的文本分类系统[综合设计题] ( )

第六讲自动文摘

1.基于统计的自动文摘技术的原理[简答题]

将文本视为句子的线性序列,将句子视为词的线性序列。它通常分4 步进行: (1) 计算词的权值; (2) 计算句子的权值; (3) 对原文中的所有句子按权值高低降序排列,权值最高的若干句子被确定为文摘句; (4) 将所有文摘句按照它们在原文中的出现顺序输出。其中权重计算依据为:词频、标题、位置、句法结构、特殊词等。

附:题型

一、简答题(3小题,共45分)

二、计算题(2小题,共25分)

三、综合设计题(1小题,共30分)

注:综合设计题要求,运用所学信息检索知识并结合软件工程要求,从2个题目中任选一个,分析用户需求、进行系统设计(以上为基本要求,20分);分析开发和应用过程中可能遇到的问题,给出相应的改良方案,并对该系统的实际应用做出展望(以上为拔高要求,10分)。

医学文献检索复习笔记

医药文献检索与利用(zll) 一、检索总论 信息及信息素养 信息:是普遍存在的,是物质的一种基本属性,是物质存在方式及其运动规律、特点的外在表现。 信息定义:事物的运动状态和状态变化的方式。 信息与知识的区别:信息是大家的,独立于行为和决策,独立于环境存在,容易转让,可复制。 情报:传递有特定效用的知识(知识性,传递性,效用性)。 文献:以文字、图形、符号、声频、视频等手段记录和传播知识的载体。 (知识内容、信息符号、载体材料、记录方式) 文献按加工层次划分: 一次文献(原始论文——期刊论文、学位论文、研究报告、专利说明书); 二次文献(目录、索引、文摘,pubmed、web of science、sinomed); 三次文献(综述、年度总结、年鉴、指南、百科全书、annual reviews); 零次文献(未被正式发表的,书信、手稿、笔记、口头交流) 文献按载体形式划分:印刷型、电子数字型、缩微型、声像/视听型 文献按出版类型划分:图书(ISBN号 10位,4段——地域号、出版社号、书号、校验号;本馆订购的电子图书:apabi,超星、读秀、elsevier、karger、Springer)、期刊(ISSN 号 8位,前七位是刊名代号,末位是计算机校验号)、特种文献 整个信息行为:信息需要、信息检索、信息选择、信息利用

信息素养定义:人们在工作中运用信息、学习信息技术、利用信息解决问题的能力。 信息素养的构成要素:信息意识;信息能力;信息道德。 ACRL信息素养能力的评价标准:(5个一级指标,24个二级指标)。 医学文献检索相关概念 指从文献信息集合中查找所需文献或文献中包含的信息内容的过程 计算机检索原理概述 检索提问字符串匹配数据库中特征标识字符串 数据库的构成:文档、记录、字段 常见字段:TI(题目)、AB(文摘)、AU(作者)、MESH(主题词)、 SO(期刊名称)、 AD (作者单位)、DT(文献类型)、PY(出版年) 检索语言 文献外部特征的检索语言:题名、著者、文献序号、引用序号 文献内容特征的检索语言:分类检索、主题检索、代码检索 (1)分类检索:美国国立图书馆图书分类法,杜威十进制、国际十进制、中国图书馆分类、国际疾病分类。 (2)主题检索:是以规范化的词汇来表达文献内容的主题;主题词(叙词)、副主题词(限定词)、关键词。 (3)代码检索:化合物分子式索引等 计算机检策略与步骤 (1)布尔逻辑检索:NOT >AND> OR,括号优先 (2)截词检索:代表一个字母,必须以半角状态输入 %或*代替任意个字符 (3)位置运算检索:(W)、(nW)、(N)、(nN)、(F)、(S)、(L) (4)字段限定检索:“=”或“in” (5)计算机检索的一般步骤:(大题) 分析检索课题(课题所属的学科范围、要求的文献类型、年限、语种、需要的文献量等)选择检索工具(数据库的选择) 确定检索途径(首先选择基本检索方式全字段检索)

信息检索考试题库

一、单项选择题 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 知识是指人类对客观世界的认识。知识可分为(C) A.有用知识和无用知识 B.基础知识和高级知识 C.感性知识和理性知识 D.理论知识和实践知识 文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型 B金石型 C.电脑型 D.机读型 信息检索系统的功能为:报道文献信息、存储文献信息和(B) A.揭示文献信息 B.检索文献信息 C.宣传文献信息 D.介绍文献信息 检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D) A.目次 B.题录 C.附图 D.正文(主文档) 为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A) 是题名的标识符 是关键词的标识符 是摘要的标识符 是著者的标识符 以下不是布尔逻辑算符的是(B) B.Near 布尔逻辑算符通常的运算顺序是(A) A.有括号时,括号内的先执行;无括号时 NOT > AND > OR B.有括号时,括号内的先执行;无括号时 NOT > OR >AND C.有括号时,括号内的先执行;无括号时 AND >NOT > OR D.有括号时,括号内的先执行;无括号时 AND > OR > NOT 限定词“in”是为了缩小检索范围,提高检索速度和命中率的。下列检索表述式正确的是(B) A.“信息in OCLC” B.信息in AB” C. 信息in CNKI” D.信息in Calis” 我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A) A.《中国图书馆图书分类法》 B.《国际十进分类法》 C.《人大法》 E.《科图法》 信息检索的方法有追溯法、综合法和(C) A.须查法 B.倒查法 C.工具法 D.抽查法 CNKI数据库的全文数据输出文件的格式为(D) 和TXT 和VIP 和PDF 和PDF 超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A) A.书名、作者、索书号和出版日期 B.书名、作者、索书号和出版社 C.书名、作者、分类号和出版社 D.书名、版本、索书号和出版社 读秀知识库是由海量全文数据及元数据组成的超大型 数据库。其提供的中文图书有(B) 万种 万种 万种 D400万种 SCienCe DireCt数据库收录2000多种期刊,其中被ISI 收录期刊种类为(C) SD数据库常用字段中“TITLE-ABSTR-KEY”字段是表示: ( D ) A.题名-作者-关键词 B.题名--作者-摘要 C.作者- 摘要-关键词 D.题名-摘要-关键词 Dialog数据库于1972年正式开始提供商用联机服务, 是世界上最大、历史最悠久的联机检索系统。目前数据 库有( A ) 多种 多种 多种 多种 网络信息资源的一次出版信息包括:网上图书、期刊、 报纸、专利、政府出版物和( D ) A.电子邮件 B.新闻 C.博客 D.会议资料 Google检索框中的两个关键词之间用空格隔开则默认 的连接是( A ) A.“AND”(“与”运算) B.“OR”(“或“运算) C.“NOT”(“非”运算) D.“W”(位置运算) 下列哪个是Google指定文件类型检索(B) A.检索词site: B.检索词filetype: C.检索词insite: D.检索词innurl 百度搜索中能实现精确匹配查询的是(C) A.单引号‘’ B.中括号[] C.双引号“” D.逗号 下列开哪个开放存取学术资源利用平台的名称是正确 的(D) :中图链接服务 : OA资源一站式检索服务平台 :开放存取期刊仓库 J – GATE:开放存取期刊门户 论文摘要的文字必须十分简炼,内容亦需充分概括,字 数一般不超过论文字数的( B ) A.6%, %, %, % 制定检索策略首先要弄清用户的提问要求,并确定要查 找的文献学科范围、类型、文种和(C) A.地点 B.样式 C.时间 D.方位 搜索引擎的由哪几个部分组成(A) A.搜索器、索引器、检索器和用户接口 B.搜索器、编辑器、检索器和用户接口 C.搜索器、索引器、整理器和用户接口 D.查询器、索引器、检索器和用户接口 下列文献哪个“参考文献”的格式著录是正确的(D) A.[1]刘付芬. 黄银安,青少年网瘾对家庭经济危害的 分析及对策,《消费导刊》,2010年第8期,25-28页 B.(1)刘付芬. 黄银安,青少年网瘾对家庭经济危害 的分析及对策,消费导刊,2010(8):25-28 C.<1>刘付芬, 黄银安.青少年网瘾对家庭经济危害的 分析及对策.消费导刊,2010(8):25-28 D.[1] 刘付芬, 黄银安.青少年网瘾对家庭经济危害 的分析及对策.消费导刊,2010(8):25-28 每个被收录的网页,在百度上都存有一个纯文本的备 份,称为:(C) A.百度文档 B.百度相似搜索 C.百度快照 D.百度百科 在百度中如果在特定站点“新浪网中搜索关于“公司治 理”方面的文献信息的检索式为:(B) A. 公司治理intitle:公司治理site: 公司治理inurl: 公司治理filetype:开放存取期刊门户”的网址为:(C) 文献综述的写作步骤包括:选题、查阅文献资料、加 工处理,拟定提纲,撰写成文,反复修改和(A) A.定稿成文 B.定题名称 C.定稿打印 D.定稿腾写 判断一篇文献综述质量高下的分界线是:(D) A.评论 B.综合归纳 C.总结 D.描述 二、多项选择题 (在每小题的备选答案中,可能有一个或多个正确的答 案,请将其代码分别填在题干的括号内,多选、少选、 错选、均无分。) 信息是事物存在的方式和运动状态及其规律的表征,是 事物的一种普遍属性。信息的特征有(A、B、C、D、E) A.客观性 B.时效性 C.传递性 D、共享性 E.中介性 以信息所依附的载体为依据,信息可分为(A、C、D) A.文献信息 B.自然信息 C.口头信息 D.电子信息 E.社会信息 文献是记录有知识的一切载体。构成文献的要素为(A、 B、D、E) A.知识、信息内容 B.信息符号 C.信息类型 D.载体材料 E.记录方式 文献按出版形式区分,可分为十大文献情报源,除图书、 期刊和报纸外下列哪些文献属于十大文献情报源(C、D、 E) A.研究报告 B.宣传手册 C.会议文献 D.政府出版物 E.专利文献 下列属于四大科技报告的有(B、C、D、E) 报告 报告 报告 报告 报告 下列属于零次文献的有(A、B、C、D) A.书信 B.手稿 C.记录 D.笔记 E.研究报告 下列属于一次文献的有(B、C、E) A.论文手稿

文献检索复习题(名解-简答)

文献检索复习题(名解-简答)

文献检索复习题 一、名词解释 1.二次文献信息:二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务:指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书:以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法:引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。

6.书目数据库:是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务:又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索:指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法:专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。

信息检索模拟试题

《INTERNET信息检索》模拟试题(一) 一、填空 1.小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部 相关文档有25 篇。 2.INTERNET是基于TCP/IP 协议的。 3.文件ABC.001.TXT的后缀名是TXT 。文件类型是文本文件。 4.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。 5.目录型搜索引擎主要提供族性检索模式,索引型搜索引擎主要提供特性检索模 式。 6.在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。 7.根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型 搜索引擎。 8.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文 献。 9.定期(多于一天)或不定期出版的有固定名称的连续出版物是期刊。 10.检索工具具有两个方面的职能:存储职能、检索职能。 11.以单位出版物为著录对象的检索工具为:目录。 12.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。 13.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法, 又称为引文法。 14.已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是:Levitan 。 15.检索语言可分为两大类:分类语言、主题词语言。 16.LCC指的是美国国会图书馆分类法。 17.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。 18.主题词的规范化指的是词和概念一一对应,一个词表达一个概念。 19.国际上通常根据内容将数据库划分为:参考数据库、源数据库、混合数据 库。 20.查询关键词为短语"DA TA OUTPUT",可以用位置算符(W)改写为:DATA (W) OUTPUT 。 21.著录参考文献时,对于三个以上的著者,可以在第一著者后面加上et al. ,代表"等 人"的意思。 22.国家图书馆默认的检索方式是多库检索。 二、单项选择 使用PING命令探测远方主机时,得到的响应是"TIMED OUT",这个信息的含义是:【B】 A.无法解析DNS B.连接超时,在指定的时间内,远方主机没有响应 C.无法识别远方主机的响应信号 D.其他

文献检索期末考试复习题 (2)

文献检索期末考试复习题 一、名词解释 1.二次文献信息 二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务 指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书 以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献 是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法 引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。 6.书目数据库 是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务 又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索 指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源 网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库 指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。 12.情报调研 指图书馆根据某一特定任务的要求,广泛收集文献,必要时在实地考察的基础上,对收集来的文献资料进行分析对比、推断、归纳整理,掌握其内部变化的规律与周围事物的联系,了解它的过去、现状并预测未来发展的趋势,或提出解决问题的建议和措施等的研究过程。 13.多项双词逻辑组合检索 多项是指可选择多个检索项; 双词是指一个检索项中可输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合 14.引文 就是参考文献 15.开放获取 指用户可以通过网络免费阅读、下载、复制、传播、打印和检索作品,以及实现对作品全文的链接,为作品建立索引和将作品作为数据传递给相应软件,或者进行任何其他出于合法目的的使用。 16.核心期刊

《信息检索》模拟精彩试题

《信息检索》模拟试题(一) 一、填空 1.小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部 相关文档有 25 篇。 2.INTERNET是基于 TCP/IP 协议的。 3.文件ABC.001.TXT的后缀名是 TXT 。文件类型是文本文件。 4.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。 5.目录型搜索引擎主要提供族性检索模式,索引型搜索引擎主要提供特性检索模 式。 6.在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。 7.根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型 搜索引擎。 8.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文 献。 9.定期(多于一天)或不定期出版的有固定名称的连续出版物是期刊。 10.检索工具具有两个方面的职能:存储职能、检索职能。 11.以单位出版物为著录对象的检索工具为:目录。 12.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。 13.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法, 又称为引文法。 14.已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是: Levitan 。 15.检索语言可分为两大类:分类语言、主题词语言。 16.LCC指的是美国国会图书馆分类法。 17.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。 18.主题词的规范化指的是词和概念一一对应,一个词表达一个概念。 19.国际上通常根据内容将数据库划分为:参考数据库、源数据库、混合数据 库。 20.查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为: DATA (W) OUTPUT 。 21.著录参考文献时,对于三个以上的著者,可以在第一著者后面加上 et al. ,代表" 等人"的意思。 22.国家图书馆默认的检索方式是多库检索。 二、单项选择 1. 使用PING命令探测远方主机时,得到的响应是"TIMED OUT",这个信息的含义是:【B】 A.无法解析DNS B.连接超时,在指定的时间内,远方主机没有响应 C.无法识别远方主机的响应信号 D.其他 2. 一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】 A.关键词>标题>文摘>正文

文献检索期末复习要点

文献检索与科技论文写作复习 第一章科技文献检索概论 第一节信息、知识、文献 一、信息:信息是一种十分广泛的概念,它在自然界人类社会以及人类思维活动中普遍存在。不同事物有着不同的特征。这些特征通过一定的物质形式(如声波、电磁波、图象等)给人带来某种信息。例如,人的大脑通过感觉器官所接收到的有关外界及其变化的消息,就是一种信息。 信息:信息不是事物的本身,而是存在于事物当中,是事物运动的状态与方式,是对事物运动状态的抽象反应。 二、知识:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。 知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识,是人的大脑通过思维重新组合的系统化的信息的集合。 可见,知识是信息的一部分;知识依存于载体;知识是信息的内核 三、文献:是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。 文献不仅包括各种图书和期刊,而且包括下面介绍的会议文献、科技报告、专利文献、学位论文、科技档案等各种类型的出版物,甚至包括用声音、图象以及其他手段记录知识的全部现代出版物。 四、文献的基本要素 知识、信息内容 信息符号 载体材料 记录方式。 五、文献的类型 现代文献依照载体形式、加工程度和出版类型可以区分出以下一些类型:文献的载体类型 文献的级别 文献的出版类型及著录特征识别 六、文献的载体类型 1)印刷型(纸型) 2)缩微型 3)机读型 (电子型) 4)声像型(视听型) 七、文献的级别 依内容性质和加工程度的不同,文献可分为以上四个级别:

1)零次文献primary Literature/ info :未经出版发行的文献,包括手稿、个人通信、原始记录等。 2)一次文献secondary literature /info :首次出版的各种文献,也称原始文献。如期刊论文、科技报告、会议论文、专利说明书等。一次文献是以科研生产活动的第一手成果为依据而创作的文献,内容丰富,参考价值大,是我们利用的主要对象。 3)二次文献Tertiary literature/ info :报道和查找一次文献的检索书刊,如各种目录、题录和文摘等。 二次文献是图书情报工作者通过科学的方法,将大量的分散的无序的一次文献进行浓缩、整序、加工处理后,组织成系统的、有序的便于查找和利用的文献。——提供查找一次文献的线索,所以又称检索性文献,即检索工具,如:书目、文摘、索引、目录、题录 4)三次文献:利用二次文献提供的线索,选用大量一次文献的内容,经综合、分析和评述再度出版的文献,如各种述评、进展报告、动态综述、手册、年鉴和百科全书等。我们使用的各种教科书也属三次文献。 上述的零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不能作为我们利用的文献类型。而后三种文献是一个从分散的原始文献到系统化、密集化的过程。一般说,一次文献是基础,是检索利用的对象;二次文献是检索一次文献的工具,故又称之为检索工具;三次文献是一次文献内容的高度浓缩,也是我们利用的一种重要情报源。 第三节文献信息检索的途径、方法与步骤 一、检索方法 文献检索的方法(查找文献的方法)大致可以归纳为三种基本方法: 1.常用法(直接法):即直接利用文献检索工具或检索系统来查找文献的方法,是一种常规的科学检索方法。分为顺查法、倒查法和抽查法。 2.追溯法:又称引文法,是一种跟踪查找法。是利用文献(尤其是评述性论文或有关专著) 后面所附的参考文献,进行逐一地追踪查找原文。 3.循环法(分段法或综合法):1、2两种方法的综合。利用检索工具或检索系统进行常规检索,再利用文献后所附参考文献进行追溯检索,分期分段交替使用这两种方法,直到满足要求为止。可以查得较全面较准确,尤其适用于那些过去年代内文献较少的课题。 二.检索途径:三次文献二次文献一次文献 三、《中图法》的分类原则 根据当前社会科学和自然科学所包括的学科多、发展快等特点,按图书学科内容作为分类的主要标准与依据。将图书在五个基本部类的基础上分为22个大类,分别以拉丁字母A—Z表示。 示例:《中图法》

信息检索题库 答案(终极版)分析

四川师范大学信息检索课后作业 1.(第1章?单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。 A、信息素养 B、信息安全 C、信息检索 D、信息评价 2.(第1章?多选)信息素养的基本构成具体包括(ABCD) A、信息知识 B、信息意识 C、信息能力 D、信息伦理 3.(第1章?多选)信息意识具体包括(ABCD)。 A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题; B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案; C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求; D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主动的通过获取信息找寻答案。 4.(第1章?多选)关于信息素养教育,下列说法正确的是(ABCD)。 A、信息素养教育的第一个层次是拓展视野,使人们知道这个世界上原来还有这么多信息资源。 B、信息素养教育的第二个层次是训练信息获取能力,使人们知道如何获取所需要的信息。 C、信息素养教育的第三个层次是培养信息利用能力,使人们具有敏锐的信息意识和利用信息解决问题的能力。 D、信息素养教育的目标是培养终身学习能力,而信息素养教育自身也是一个终身学习的过程,信息素养教育与终身学习能力是一个相互促进、螺旋提升的关系。 5.(第1章?多选)信息素养是指:基于(ABC),通过确定、检索、获取、评价、管理、应用信息解决所遇到的问题并以此重构自身知识体系的综合能力和基本素质。 A、信息意识 B、信息知识 C、信息伦理 D、信息评价 6.(第1章?多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。下列属于5项标准的是(ABCD)。 A、具有信息素养的学生能够确定所需信息的性质和范围 B、具有信息素养的学生能够有效和高效地获取所需信息 C、具有信息素养的学生能评价信息及其来源并将选取的信息整合入其知识基础和价值体系中 D、具有信息素养的学生,不论是个人或作为小组成员,都能够有效地利用信息达到特定的目的 7.(第1章?单选)"information literacy "一般翻译为(B)。 A、信息检索 B、信息素养 C、信息安全 D、信息评价 8.(第1章?单选)(D)是指在信息的生产、存储、获取、传播和利用等信息活动各个环节中,用来规范相关主体之间相互关系的法律关系和道德规范的总称。 A、信息知识 B、信息能力 C、信息意识 D、信息伦理

文献检索复习题(名解 简答)

文献检索复习题 一、名词解释 1.二次文献信息:二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务:指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书:以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法:引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。 6.书目数据库:是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务:又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索:指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法:专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。 12.情报调研:指图书馆根据某一特定任务的要求,广泛收集文献,必要时在实地考察的基础上,对收集来的文献资料进行分析对比、推断、归纳整理,掌握其内部变化的规律与周围事物的联系,了解它的过去、现状并预测未来发展的趋势,或提出解决问题的建议和措施等的研究过程。 13.多项双词逻辑组合检索:多项是指可选择多个检索项; 双词是指一个检索项中可输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合。 14.引文:就是参考文献。

大学生信息检索习题以及答案

《大学生信息检索概论》模拟试题 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献 2、《中图法》有五个基本部类,分别是马克思主义、列宁主义、思哲 学;社会科学;自然科学和综合性图书,在此基础上又划分为_22_个大类。 3、按容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 6、国际标准化组织简称:ISO 、本标准每 5 年修订一次 二、选择题1、如果需要检索某位作者的文献被引用的情况,应该使用( C )检索。A.分类索引B.作者索引C.引文索引 D.主题索引 2、利用图书馆的数据库检索期刊论文时,可供选择的中文数据库是( D )。A.超星数字图书馆 B.万方学位论文 C.国研网 D.维普科技期刊 E.高校财经库 3、如果检索有关多媒体网络传播方面的文献,检索式为(A D)。A.多媒体and 网络传播 B.多媒体+网络传播 C.多媒体or 网络传播 D.多媒体*网络传播 4、如果对某个课题进行主题检索时,可选择的检索字段有( A D E )。A.关键词 B.作者 C.刊名 D.题名 E.文摘 5、二次文献又称检索工具,包括:( A C D )。A.书目B.百科C.索引D.文摘E.统计数据 三、名词解释题1、文献:用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。也可以理解为古今一切社会史料的总称。2、体系分类语言:是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按

文献检索课 复习知识点-推荐下载

第六章 一、定义 信息p147、知识p1449、文献(记录有知识的一切载体)p150 二、知识点 1、文献的类型 按载体形式:印刷型、缩微型、视听型、电子型 出版或加工形式:专著、报纸、期刊、专利文献、会议文献、产品样本、档案资 料、“灰色”文献和各种工具书 加工深度不同(重点!掌握含义、能区分、能举例):零次文献、一次文献、二 次文献及三次文献 2、现代文献的特征 外表特征(题名、作者、出版社等);内容特征(文献论述主题、观点、见解等)国际标准书号ISBN、国际标准连续出版物编号ISSN、国内统一刊号CN号 3、信息、知识、文献相互间的关系(会分析) 4、信息源的四个层次:一次信息源(本体论信息源)、二次信息源(感知信息源)、三 次信息源(再生信息源)、四次信息源(集约信息源)(能区分、能举例) 5、电子信息源(数据库、网络信息源)、实物信息源、口头信息源 6、信息服务业(政府信息系统、文献服务系统) 第七章 一、定义 信息检索p165、信息检索语言p167、文献检索工具p169、检索系统p176 二、知识点 1、信息检索的类型(按内容、组织方式、检索设备) 2、信息检索主要方法: 1)直接法:又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、倒查法和抽查法。顺查法(时间上,远→近)、逆查法(时间上, 近→远)、抽查法(抽查一定时期的资料) 2)追溯法:追溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大情报来源的方法。 (时间上,查找原文以前的文章) 3)循环法:又称分段法或综合法。它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。 3、检索语言:按基本属性分为 a分类检索语言(p167注意什么是类、种、属。在我国,分类检索语言以《中 国图书馆分类法》为代表) b主题检索语言 《中图法》知识:

信息检索模拟考试试题修订稿

信息检索模拟考试试题内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

《信息检索》模拟试题(一) 一、填空 1. 小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、 80%,则全部相关文档有 25 篇。 2. INTERNET是基于 TCP/IP 协议的。 3. TXT 。文件类型是文本文件。 4. 多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。 5. 目录型搜索引擎主要提供族性检索模式,索引型搜索引擎主要提供特性 检索模式。 6. 在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。 7. 根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网 络目录型搜索引擎。 8. 按文献的相对利用率来划分,可以把文献分为核心文献、相关文 献、边缘文献。 9. 定期(多于一天)或不定期出版的有固定名称的连续出版物是期刊。 10. 检索工具具有两个方面的职能:存储职能、检索职能。 11. 以单位出版物为着录对象的检索工具为:目录。 12. 将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。 13. 利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为 追溯法,又称为引文法。

14. 已知一篇参考文献的着录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是: Levitan 。 15. 检索语言可分为两大类:分类语言、主题词语言。 16. LCC指的是美国国会图书馆分类法。 17. 当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全 率较低。 18. 主题词的规范化指的是词和概念一一对应,一个词表达一个概念。 19. 国际上通常根据内容将数据库划分为:参考数据库、源数据库、 混合数据库。 20. 查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为: DATA (W) OUTPUT 。 21. 着录参考文献时,对于三个以上的着者,可以在第一着者后面加上 et al. ,代表"等人"的意思。 22. 国家图书馆默认的检索方式是多库检索。 一、 二、单项选择 1. 使用PING命令探测远方主机时,得到的响应是"TIMED OUT",这个信 息的含义是:【B】 A. 无法解析DNS B. 连接超时,在指定的时间内,远方主机没有响应 C. 无法识别远方主机的响应信号

文献检索实例

一检索课题概况 (一)检索课题名称(中英文)(说明:检索课题名称结合自己专业自拟) ARCH模型在金融时间序列分析中的应用 The ARCH model that is applied in the financial time series (二)课题简介及总体检索思路 简单介绍对本检索课题背景、目的、意义及检索思路(如根据检索需求准备利用哪些数据库或网络检索工具完成课题检索)。 所谓ARCH模型,就自回归条件异方差模型。粗略地说,该模型将当前一切可利用信息作为条件,并采用某种自回归形式来刻划方差的变异,对于一个时间序列而言,在不同时刻可利用的信息不同,而相应的条件方差也不同,利用ARCH 模型,可以刻划出随时间而变异的条件方差。 将ARCH模型作为一种度量金融时间序列数据波动性 的有效工具,并应用于与波动性有关广泛研究领域。包括政策研究、理论命题检验、季节性分析等方面。 ARCH模型能准确地模拟时间序列变量的波动性的变化,它在金融工程学的实证研究中应用广泛,使人们能更加准确地把握风险(波动性),尤其是应用在风险价值(Value at Risk)理论中,在华尔街是尽人皆知的工具。 本课题将首先利用中国期刊全文数据库和维普资讯的中国科技期刊数据库 进行检索了解国内对ARCH模型研究情况;再利用EBSCO-Host 和

Springer-Book 电子期刊两个外文数据库进行检索了解ARCH模型的研究情况;最后利用Google 和Baidu 进行相关搜索,了解有关信息 二检索过程记录该部分为综合检索报告的主体部分,包括对所选用的数据库、检索年限、检索词、检索策略(即逻辑检索表达式)以及检索结果等的记录。 1、潘省初. 计量经济学中级教程[M]. 北京:清华大学出版社,2009 2. 唐国兴. 计量经济学:理论·方法和模型[M]. 上海:复旦大学出版社,1988 3.张世英, 许启发, 周红.金融时间序列分析[M]. 清华大学出版社,2008 4. Ruey S.Tsay.金融时间序列分析[M].机械工业出版社 ,2006 5. 张世英, 樊智.协整理论与波动模型:金融时间序列分析及应用[M].清华大学出版社 2004 (一)检索馆藏书目的情况 (围绕课题查找本校图书馆的相关藏书,如词典、年鉴、最新教科书以及相关的新书进展等,依次列出所参考的书目信息。参考书目格式为:作者.书名.地点:出版社,年份。如:焦玉英.信息检索进展[M].北京:科学出版社,2003)杜建卫,王若鹏.数学建模基础案例[M].北京:化学工业出版社,2009 李德宜,李明.数学建模[M].北京:科学出版社,2009 严喜祖,宋中民,毕春加.数学建模及其实验[M].北京:科学出版社,2009 许洪范.数学建模教程[M].北京:国防工业出版社,2007 徐全智,杨晋浩. 数学建模[M].北京:高等教育出版社,2008 周义仓, 赫孝良.数学建模实验[M].西安:西安交通大学出版社,2007

医学文献检索复习考试重点总结

医学文献检索复习考试重点总结 第一章文献检索基础 本章要点 1.1 文献信息的基本概念 1.2 文献的类型和级别 1.3 医学文献的分布规律 重点 印刷型文献出版类型的识别方法 电子文献的文件格式和主要类型 文献信息的时间、地区和学科分布规律 第一节医学文献基础 信息、知识、情报和文献以及相互关系 信息 (Information) 信息是人体感官对事物存在或运动状态及其特征 的反应。 基本属性:客观性可塑性依附性共享性 知识 (Knowledge) 知识是系统化的信息,是人类不断接受信息经过大 脑加工得出的经验或总结。 情报(Information) 是满足特定用户的特定需要的动态知识。情报是知识的传递并起作用的部分。 基本属性:①知识性②传递性③用效性 文献(Literature) 我国国家标准 GB4898-85把文献定义为“记录有知识的一切载体”。 医学文献记录了千千万万医学工作者研究人类生命过程、同疾病斗争的科学知识。文献的构成包括四个要素 ①知识信息内容 ②信息符号:文字、图表、声音、图像等 ③载体材料:甲骨、竹简、纸张、胶卷、磁盘、光盘等 ④记录的方式及手段:刀刻、书写、印刷、录音、录像等 信息、知识和情报之间的逻辑关系可形象地用图来表示。

第二节文献的类型和级别 1.2.1 按载体形式区分 按文献载体物理类型分:印刷型文献;缩微型文献;视听型文献;数字化文献等。 印刷型文献(printed form) 各种印刷品,如:正式出版的图书、报刊及杂志等。 缩微型文献(microform) 缩微型文献是以感光材料为载体,以光学缩微技术为记录手段而产生的一种文献形式。视听型文献(audio-visual) 声像型文献又叫视听资料。是以磁性、感光材料为载体,直接记录声音、图像而形成的一种文献。 数字化文献(electronic form) 以数字的形式存贮在光盘、磁盘和U盘等介质上,并通过计算机阅读和利用。如:光

文献检索复习要点

文献检索复习要点

一.概念 1.信息:是事物存在或变化过程中产生的东西,如数据、新闻等。它具有客观性、普遍性、无限 性等。信息可分为两大类:自然信息与社会信息。社会信息是人类社会活动发出,信息检索主要指对社会信息的检索。 2. 文献:为“记录有知识的一切载体”。这个定义揭示了文献所包含的知识内容、信息符号、载体材料和记录方式4个基本要素。 3、按照文献的载体划分:印刷型:指印刷术发明后,以纸为载体,通过手写、油印、铅印、等手 种新兴文献类型。 4、文献手稿、个人通信、原始记录、听取经验交流、演讲、口头言论、); (图书、期刊论文、科技报告、会议论文、学位论文、专利说明书) 5 6 版社号、书序号和校验位。 7、出版社号:代表组内所属的一个具体出版者(出版社、出版公司)一个出版社只有一个唯一的一个号码,出版社的规模越大,出书越多,其号码就越短。 8、信息检索的类型手工检索、计 算机检索。 9、《七略》评价极高,是我国最早一部图书分类法;《别录》是我国最早的图书目录;《杜威十进分类法》是当代世界上影响最大,用户最多的图书馆分类法。 10、《中国图书馆图书分类法》简称《中图法》是新中国成立后编制出版的一部具有代表性的大型综合性分类法。 11、《中图法》在我国用的非常广泛,许多信息机构和图书馆纷纷放弃原有的分类法,据统计,全国90%以上的图书情报单位均使用它。它的类目体系也是一个层层展开的分类体系,但不是采用的“十分法”,首先将知识门类分作哲学、社会科学、自然科学三大类。同时根据马克思列宁主义、毛泽东思想的指导作用和文献分类的本身的需要,增设了马列主义、毛泽东思想和综合性图书两大部类,构成5大部类。类表将马列主义、毛泽东思想、哲学和综合性图书三个基本大类,同时将社

文献信息检索模拟试题

石河子大学文献信息检索模拟试卷 一、名词解释 1、信息素养 2、二次文献 3、核心期刊 4、影响因子 5、信息检索 6、检索语言 7、关键词 8、数据库 9、学术网站 10、搜索引擎 11、参考性工具 12、事实与数据检索 13、书目信息数据库 14、专利文献 15、分类途径 16、主题途径 二、单项选择题 1.、文献是记录有知识的( A ) A 载体 B 纸张 C 光盘 D 磁盘 2.、下列哪种文献属于一次文献( A )(考察零一二三此文献的表现形式) A 期刊论文 B 百科全书 C 综述 D 文摘 3、下列选项中属于连续出版物类型的选项有(C ) A 图书 B 学位论文 C 科技期刊 D 会议文献 4、下列选项中属于特种文献类型的有( D ) A 报纸 B 图书 C 科技期刊 D 标准文献 5、使用分类语言对信息进行描述和标引,主要是可以把( B )的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 6、《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类7、利用文献末尾所附参考文献进行检索的方法是( C ) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 8、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A ) A 数据库 B 记录 C 字段 D 文档 9、广义的信息检索包含两个过程(B ) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 10、中国国家标准的代码是( A ) A G B B CB C ZG D CG 11、期刊论文记录中的“文献出处”字段是指:( C ) A 论文的作者 B 论文作者的工作单位 C 刊载论文的期刊名称及年卷期、起止页码 D 收录论文的数据库 12、使用逻辑“与”是为了( A ) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 13、使用逻辑“或”是为了( B ) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 14、政府出版物主要包括两大类型的文献( B ) A、专利与标准 B、行政文件与科技文献 C、图书与期刊 D、档案与标准 15、ISBN是( B )的缩写 A、国际标准刊号 B、国际标准书号 C、连续出版物代码 D、国内统一刊号 16、美国《科学引文索引》是最具权威的国际性检索系统之一,其简称是(D) A:EI,B:CSSCI,C:SCI 17、哪种文献是科技工作者围绕某个课题研究所取得的成果的正式报告,或对某个课题研究过程中各个阶段进展情况的实际记录( C ) A:标准文献,B:专利文献,C;科技报告 18、利用著者姓名或机关团体名称进行检索的途径是( C ) A:题名途径,B:主题途径,C:著者途径 19、按照出版时间的先后,应将各个级别的文献排列成(C ) A.三次文献、二次文献、一次文献 B.一次文献、三次文献、二次文献 C.一次文献、二次文献、三次文献 D.二次文献、三次文献、一次文献 20、从文献的(C )角度区分,可将文献分为印刷型、缩微型等。 A.内容的公开次数 B.载体类型 C.出版类型 D.公开程度 21、具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为(D ) A.图书 B.会议文献 C.学位论文 D.期刊 22、中国图书馆图书分类法的分类号采用了( A ) A.拼音字母+数字 B.英语字母+数字 C.全部拼音字母 D.全部数字 23、( D )是报道文献出版或收藏信息为主要功能的工具。 A.题录 B.索引 C.文摘 D.目录 24、逻辑运算符包括( D ) A.逻辑与 B.逻辑或 C.逻辑非 D.A,B和C 25、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于( C ),在书目数据库中,一条记录相当于( B )

相关文档
相关文档 最新文档