文档库 最新最全的文档下载
当前位置:文档库 › 慕课信息检索第一次课后答案

慕课信息检索第一次课后答案

慕课信息检索第一次课后答案

第一次考试

1、最早公布的标题中有“青蒿素”的中国专利的申请日期是

(1/1分)

1985.3.11985.4.11986.3.11986.4.1查不到

2、中国知网数据库收录屠呦呦教授发表的期刊论文最早是哪一篇

(1/1分)

中医杂志,第6期:32-35.化学学报,第2期:129-143.药学学报,第5期:366-370.

中药通报,第9期:37-38.查不到

3、在国家图书馆的“馆藏中文电子图书数据库”中,着者名中包含“莫言“的着作有多少本?(0/1分)

<3030~4040~50>50不知道

4、雾霾天,小明同学戴了一款口罩,标有“GB 2626-2006”字样,该国家标准的规范效力是(0/1分)

强制执行推荐执行不知道

5、PMI泡沫塑料具有优异的力学性能,可用于风电叶片、航空航天、雷达、体育器材、医疗器材、轮船、车辆等领域。若想在世界范围内找到密度(density)小于

0.1[mathjaxinline]\rm{g/cm^3}[/mathjaxinline]且最大拉伸强度(tensile strength)大于等于1MPa的PMI泡沫塑料商品的供应商,你该选择哪种检索工具?

(1/1分)

百科全书年鉴手册教科书研究论着不会做

国科大信息检索作业

国科大2013年秋季《现代信息检索》第一次作业(第一章到第五章) 以下每题10分,共计100分。 1、习题1-4 a.时间复杂度O(x+y)。因为倒排记录表记录的文档号是按照从小到大排列的,在扫描Brutus对应的倒排表的时指针指向文档 号为x,扫描Caesar对应的倒排记录表的指针对应的文档号为y,如果xy,caesar指针后移。 b.时间复杂度是O(N),N是全部的文档数。因为结果集的大小取决于文档数N,而不是倒排记录表的长度。 2、习题1-7 对于原始的查询,按照倒排记录表的长度从小到大查询会节省查询复杂度 (tangerine OR trees) = O(46653+316812)=O(363465) (marmalade OR skies) = O(107913+271658) = O(379571) (kaleidoscope OR eyes) = O(46653+87009) = O(300321) 即顺序为:(kaleidoscope OR eyes) AND (tangerine OR trees)AND(marmalade OR skies) 3、习题1-10 UNION(p1,p2) answer ←{ } while p1!=NIL and p2!=NIL do if docID(p1)=docID(p2) then ADD(answer,docID(p1)) p1<- next(p1) p2<-next(p2) else if docID(p1)

四川师范大学信息检索课

四川师范大学信息检索课实验题目 1、举例说明搜索引擎中filetype、site、双引号这三个高级检索语法的功能。 要求: 1)请问上述语法的作用是什么?什么情况下用到这些语法? 2)自己设计一个或多个检索案例,体现这些语法的功能,说清楚检索意图和检索表达式, 并对检索效果进行评价。 filetype就是按照文件类型搜索,特定文件类型检索用filetype。 语法格式:检索词 filetype:文件格式(或ALL) 比如搜毕业论文,可以用:毕业论文 filetype:doc 。 例如:通过搜索引擎检索有关信息检索方面的幻灯片课件 检索表达式:信息检索 filetype:ppt。 site是指搜索某一个站点的,把搜索范围限定在特定站点中用site 语法格式:检索词 site:站点地址 比如只想看百度上的小说,可以用:玄幻小说 site:https://www.wendangku.net/doc/421001821.html, 例如:通过搜索引擎在中国教育网内检索wps2009软件 检索表达式:wps2009 site:edu.en site可以通过限定检索的站点范围来提高检索效率 双引号可以将关键词括起来。精确匹配用双引号。 语法格式:“检索词”。 例如:使用搜索引擎检索“爱意味着能够理解所爱的人”这句话的出处。 检索表达式:“爱意味着能够理解所爱的人”。 如果不想让搜索引擎对检索词进行拆分或者去词,可以对检索词加上双引号。 https://www.wendangku.net/doc/421001821.html,/bp-cc233a31s8fafab06qdc02qq-1.html 参考:https://www.wendangku.net/doc/421001821.html,/search/page_feature.html#09 2、查询本专业经典书籍。 要求: 1)查询确定本专业必读的书籍{要包括外文书籍}。(自己查询后,最后能向专业课老师请 教,听听他们的意见) 2)选择其中3本,国内哪些图书馆有这3本书?(任选国内211高校{没听说过211?百度 一下!}图书馆3个) 3)通过四川师范大学图书馆网站上的书生之家数据库和超星数据库查询这些书的全文。如果 有,告诉我这些书第X页最后一行的内容(X为你学号最后两位数)。

信息检索题库+参考答案(终极版)

四川师范大学信息检索课后作业 1.(第1章?单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。 A、信息素养 B、信息安全 C、信息检索 D、信息评价 2.(第1章?多选)信息素养的基本构成具体包括(ABCD) A、信息知识 B、信息意识 C、信息能力 D、信息伦理 3.(第1章?多选)信息意识具体包括(ABCD)。 A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取 4.(第1 A、 B、C、D、 5.(第1 A、 6.(第1《高 ABCD)。A、 7.(第1 A、 8.(第1 A、信息知识 B、信息能力 C、信息意识 D、信息伦理 9.(第1章?单选)(C)是指人类对信息需求的自我意识,是人类在信息活动中产生的认识、观念和需求的总和。 A、信息知识 B、信息能力 C、信息意识 D、信息伦理 10.(第1章?判断)以“走向具有信息素养的社会”为主题的《布拉格宣言》认为,作为一种适应社会的基本能力和参与社会的先决条件,信息素养能够确定、检索、评估、组织和有效地生产、使用和交流信息,并解决所遇到的问题,是终身学习的一种基本人权。√ 11.(第1章?判断)作为信息素养的基本构成,信息知识、信息意识、信息能力和信息伦理四个要素相辅相成、不可分割。其中,信息意识是先导,信息知识是基础,信息能力是核心,信息伦理是保障,四个要素共同构成了一个统一的整体。√ 12.(第1章?判断)2005年北京高教学会图书馆工作研究会提出了《北京地区高校信息素质能力指

标体系》。这个指标体系从信息意识、信息知识、信息能力、信息伦理四个方面提出了高校学生应具有的信息素养要求,具体由7个一级指标,19个二级指标,61个三级指标组成。√ 13.(第1章?判断)以“信息社会在行动:信息素养与终身学习”为主题的《亚历山大宣言》指出,信息素养和终身学习是信息社会的灯塔,照亮了通向发展、繁荣和自由的道路。-------T 14.(第1章?判断)信息素养是终身学习的核心。------T 15.(第1章?判断)信息检索能力也就是确定信息的能力,即把遇到的问题转换为具体信息需求的能力。------F 16.(第1章?判断)信息素养教育的目标是培养终身学习能力。具体而言,就是能够想到而且能够做到通过获取和利用信息解决所遇到的问题,并且能够把所获取的信息融入自身的知识结构,把获取信息的过程和经历内化为自身的学习能力。------T 17.(第2章?多选)信息的属性包括(ABCD) A、 *18.(第 A、 19.(第 A、 20.(第 A、 21.(第 A、 22.(第 A、 23.(第 有(AD A、、使用 24.(第 A、 25.(第 A、 26.(第 A、 27.(第 A、 28.(第2章?多选)网络检索系统的特点是(ABC)。 A、资料丰富 B、检索方便 C、费用低廉 D、资源共享 29.(第2章?多选)使用逻辑“或”是为了(AC)。 A、提高查全率 B、提高查准率 C、扩大检索范围 D、缩小检索范围 30.(第2章?多选)截词检索中,常用的截词符号有(CD)。 A、+ B、- C、* D、? 31.(第2章?多选)下列哪种情况下检索人员需要修改检索策略(AB)。 A、检索结果中无关信息量过多 B、检索结果中输出的信息量太少 C、网速太慢,检索过程中需要的时间过长 D、检索结果文献大部分比较陈旧 32.(第2章?多选)影响检索效果的因素主要来自两个方面(CD)。 A、查全率 B、查准率 C、检索系统本身 D、检索人员的检索水平

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

文献检索课的课程性质和目的doc资料

课程简介 文献检索课是培养学生掌握文献信息的检索与利用,不断提高自学能力和科研能力的一门科学方法课,由国家教委统一命名。1984年原教育部颁布(84)高教一字004号文件,文献检索课被正式列入我国高校文理工科各专业的教学计划。20余年来,数以百万计的大学生修完或正在选读这门课程,发展十分迅速。 开设本课程的目的是有效提高人们检索信息和利用信息的效率。使学生了解各自专业及相关专业文献检索的方法,树立自觉捕捉、获取信息的意识,具有主动获取更深、更广、更新知识的技能,提高利用信息的能力,增强自学能力和研究能力。 学习文献检索课的意义 第一,信息激增的现实要求我们学习文献检索。我们的时代是一个信息量激增的时代。据估计,世界每天有1.3 ~1.4 万篇新的科学论文问世,每小时有20项新的发明,每分钟出一本新书。互联网数据流量自1988年以来以平均每年翻两番的速度增长,近两年这个数字接近每年翻三番。互联网网页数已接近40 亿,并以每天10万页速度递增。信息激增不仅使“读不完,接受不了”的矛盾越来越尖锐,而且

使如何从浩如烟海的文献中寻找合乎要求的信息变得越来越困难。 第二,信息知识的更新要求我们学习文献检索。人类知识的更新速度在加快,信息知识的有效期在缩短,例如:10 年前发展起来的新兴工程技术,今天约有30%已经过时。有专家认为,一个人在大学阶段只能获得一生中所需知识10 %左右,而90%的知识是要在工作中通过不断学习获得的。知识的频繁更新,清楚地说明,我们必须通过科学的文献检索技能不断地汲取新知识,这样才能跟上时代前进的步伐。 第三,文献检索的专门化要求我们学习文献检索。现代文献信息的载体类型、出版类型、传播手段、组织形式十分复杂,近年日益普及的计算机检索,尽管在通信和网络技术的扶持下,已经使获取信息的手段变得更为方便、有效,然而,各种类型数据库的迅速增长,数据库理论、检索软件、检索策略等知识日益深化,迅速、准确、完整地获取所需的信息文献已经成为一项综合性的专门化的技术。那种“只要会上网,谁都会检索”的看法是外行人的一种错觉。 第四,文献信息检索是现在,更是未来科技人员的一项基本功。对于一个科研工作者来说,文献信息检索贯穿于科研工作的始终,是科研工作的重要组成部分。任何一项科研

大学生信息检索习题以及答案

大学生信息检索概论》模拟试题 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献 2、《中图法》有五个基本部类,分别是马克思主义、列宁主义、毛泽东思想 、哲学;社会科学;自然科学和综合性图书,在此基础上又划分为22 个大类。 3、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事 实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法 和综合法。 6、国际标准化组织简称:ISO 、本标准每5 年修订一次 二、选择题1、如果需要检索某位作者的文献被引用的情况,应该使用(C )检索。 A. 分类索引 B.作者索引C?引文索引D ?主题索引 2、利用图书馆的据库检索期刊论文时,可供选择的中文数据库是( D )。 A.超星数字图书馆B ?万方学位论文 C ?国研网D ?维普科技期刊E. 高校财经库 3、如果检索有关多媒体网络传播方面的文献,检索式为( A D)。 A.多媒体and网络传播B ?多媒体+网络传播 C ?多媒体or网络传播 D.多媒体*网络传播 4、如果对某个课题进行主题检索时,可选择的检索字段有( A D E )。 A.关键词B .作者C .刊名D .题名E .文摘 5、二次文献又称检索工具,包括:(A C D )。 A.书目 B.百科 C.索引 D.文摘 E.统计数据 三、名词解释题 1、文献 用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一 定物质载体上的知识。也可以理解为古今一切社会史料的总称。 2、体系分类语言 体系语言是以科学分类为基础,运用概念的划分与概括的逻辑方法,形成一个概念等级体系,按知识门类的逻辑次序,按照从总到分,从一般到具体,从低级到高级,从简单到复杂的原则进行概念的综分,层层划分,累累隶属,逐步展开而形成的一个等级体系。 3、引文语言 引文语言是根据文献所附参考或引用文献的特征进行检索的语言。 4、事实检索 以事项为检索内容的文献信息检索 5、二次文献 对一次文献进行加工整理后的产物,即对无序的一次文献的外部特征如题名、作者、出处等进行著录,或将其内容压缩成简介、提要或文摘,并按照一定的学科或专业加以有序化而形成的文献形式,如目录、文摘杂志(包括简介式检 索刊物)等

中国科学院大学现代信息检索课后习题答案

《信息检索导论》课后练习答案 王斌 最后更新日期 2013/9/28 第一章布尔检索 习题1-1 [*] 画出下列文档集所对应的倒排索引(参考图1-3中的例子)。 文档 1 new home sales top forecasts 文档 2 home sales rise in july 文档 3 increase in home sales in july 文档 4 july new home sales rise 习题1-2 [*] 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; 解答: breakthrough 1 0 0 0 drug 1 1 0 0 for 1 0 1 1 hopes 0 0 0 1 new 0 1 1 1

patients 0 0 0 1 schizophrenia 1 1 1 1 treatment 0 0 1 0 b. 画出该文档集的倒排索引(参考图 1-3中的例子)。 解答:参考a。 习题1-3 [*] 对于习题1-2中的文档集,如果给定如下查询,那么返回的结果是什么? a.schizophrenia AND drug 解答:{文档1,文档2} b.for AND NOT (drug OR approach) 解答:{文档4} 习题1-4 [*] 对于如下查询,能否仍然在O(x+y)次完成?其中x和y分别是Brutus和Caesar所对应的倒排记录表长度。如果不能的话,那么我们能达到的时间复杂度是多少? a.Brutus AND NOT Caesar b.Brutus OR NOT Caesar 解答: a.可以在O(x+y)次完成。通过集合的减操作即可。具体做法参考习题1-11。 b.不能。不可以在O(x+y)次完成。因为NOT Caesar的倒排记录表需要提取其他所有词项对应的倒 排记录表。所以需要遍历几乎全体倒排记录表,于是时间复杂度即为所有倒排记录表的长度的和 N,即O(N) 或者说O(x+N-y)。 习题1-5 [*] 将倒排记录表合并算法推广到任意布尔查询表达式,其时间复杂度是多少?比如,对于查询 c.(Brutus OR Caesar) AND NOT (Antony OR Cleopatra) 我们能在线性时间完成合并吗?这里的线性是针对什么来说的?我们还能对此加以改进吗? 解答:时间复杂度为O(qN),其中q为表达式中词项的个数,N为所有倒排记录表长度之和。也就是说可以在词项个数q及所有倒排记录表长度N的线性时间完成合并。由于任意布尔表达式处理算法复杂度的上界为O(N),所以上述复杂度无法进一步改进。 习题1-6 [**] 假定我们使用分配律来改写有关AND和OR的查询表达式。 a. 通过分配律将习题1-5中的查询写成析取式; 12 b. 改写之后的查询的处理过程比原始查询处理过程的效率高还是低? c. 上述结果对任何查询通用还是依赖于文档集的容和词本身? 解答: a. 析取式为:(Brutus And Not Anthony And Not Cleopatra) OR (Caesar AND NOT Anthony AND NOT Cleopatra) b. 这里的析取式处理比前面的合取式更有效。这是因为这里先进行AND操作(括号),得到的倒排记录表都不大, 再进行OR操作效率就不会很低。而前面需要先进行OR操作,得到的中间倒排记录表会更大一些。 c. 上述结果不一定对,比如两个罕见词A和B构成的查询 (A OR B) AND NOT(HONG OR KONG),假设HONG KONG一 起出现很频繁。此时合取方式可能处理起来更高效。如果在析取式中仅有词项的非操作时,b中结果 不对。 习题 1-7 [*] 请推荐如下查询的处理次序。 d. (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)

信息检索课后答案

作业习题 《信息检索》思考题及参考答案 (根据新编教学大纲内容选答) 第一讲信息检索基础知识 1.简述大学图书馆的地位和作用。 大学图书馆是大学的文献信息中心,是为教学和科研服务的学术性机构,是学校信息化和社会信息化的重要基地。高等学校图书馆的工作是学校教学和科学研究工作的重要组成部分。现代化的大学图书馆与学校高水平的教师队伍、先进的教学实验设备,共称为现代化大学的三大支柱。大学图书馆既是是学校的文献信息中心又是学习资源中心,是培养人才的重要基地,是自学深造的场所,是学生构建合理知识结构的第二课堂。 2.简述信息、知识、文献的概念及相互关系。 答:信息的概念:一般来说,信息是指与客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。从本质上说,信息是反映现实世界的运动、发展和变化状态及规律的信号与消息。 知识的概念:知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人的大脑通过思维重新组合的系统

化的信息的集合。知识是人类在改造客观世界的实际中所获得的认识和经验的总和,是信息的一部分,是一种特定的人类信息。 文献的概念:文献是记录有知识的一切物质载体。具体地说是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。 信息、知识和文献之间的关系是:信息是事物发出的消息,信息经过人脑加工形成知识。只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。知识信息被记录在载体上就形成文献。 3.何谓信息资源?网络信息资源有何特点? 所谓信息资源,就是信息的来源。各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源。网络信息资源具有数量大、类型多、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。 4.试述《中图法》的体系结构及其在文献信息检索中的作用。 《中图法》将人类知识分为马列主义及毛泽东思想、哲学、社会科学、自然科学和综合性图书5大基本部类、22个大类。采用汉语拼音字母与阿拉伯数字相结合的混合号码,基本采用层累制编号法,用一个字母代表一个大类,以字母顺序反映大类的次序,在字母后用

高校信息检索课程开设现状调查分析

龙源期刊网 https://www.wendangku.net/doc/421001821.html, 高校信息检索课程开设现状调查分析 作者:戴庆林洁梅熊馨 来源:《学习导刊》2014年第04期 摘要:本文以问卷形式调查了全国35所各类型、各层次的高等院校信息检索课程的开设情况。 包括课程名称及学时,教学内容,教材与教学大纲,教师队伍等情况。旨在探索当前信息检索课程的开设及发展情况,为高等院校信息检索课程教学的完善与创新提供参考。 关键词:信息素质,信息检索,高等院校 高校的文献检索课从无到有,从尝试到成熟,经历了近30年的历程。随着计算机和网络技术的发展,文献信息载体越来越多样,文献信息的利用呈数字化态势。为适应这种新环境,文献检索课的课程名称、教学内容、教学形式、教师队伍也需要调整。本文以全国各类型、各层次高等院校为调查对象,采用问卷调查的方式调查了目前高校文献检索课的开设现状,以探索当前文献检索的发展,为文献检索课教学的完善与创新提供参考。 1. 课程名称及学时 在被调查的35所院校中,除1所院校外,其余34所院校均开设了信息检索课程,课程名称除传统的“文献检索与利用”、“文献管理与信息分析”外,更多的改用“信息检索”、“信息检索及应用”、“信息检索与网络应用”等名称。大部分院校将“信息检索”课程设置为必修课,有部 分院校课根据学校专业情况将其设为选修课。学时情况各院校也不尽相同,最少的为8个学时,最多的为54个学时。信息检索课的开课性质、学时情况详见表1、表2。 表1 信息检索课开课情况表 课程性质选修课必修课 院校数 16 18 所占比例 47.06% 52.94% 表2 信息检索课学时情况表 学时数 40

信息检索导论-王斌-第三次课后作业(13-21)

信息检索导论第三次课后作业 1、习题13-2 答:(i)贝努利模型:三个文档具有相同的模型表示 (ii)多项式模型:文档1和文档2相同,文档3与它们都不同。文档1和文档2中“Lodon”都出现了两次,文档3中只出现了一次。 2、习题13-5

3、习题14-6 在图14-14 中,3 个向量→a、→b及→c中哪一个满足:(i) 采用内积计算的情况下与→x最近?(ii) 采用余弦相似度计算的情况下与→x最近?(iii) 采用欧氏距离计算的情况下与→x最近?

4、习题15-1一个数据集里支持向量的最小数目是多少(此时的数据集每个类别中都包含实例)? 答:一个数据集里支持向量的最小数目是2个。因为SVM分类模型希望得到在特征空间上间隔最大的分类器,即对于距离超平面最近的实例点,也希望能有足够的确信度将其分开,确定这样的超平面需要的支持向量最小数目是2个。5、习题16-5 K-均值算法的两个停止条件为:(i) 文档的分配不再改变;(ii) 簇质心不再改变。请问这两个条件是否等价? 答:这两个停止条件是等价的。当连续两次迭代之后,若文档的分配不再改变,则据此计算出的簇质心也不会再改变;当簇质心不再改变的时候,则K-均值算法计算出的文档的分配也就不再改变。

6、习题17-7 a. 考虑在一个两种语言组成的文档集上进行2-均值聚类,你预期的结果是什么? b. 当使用HAC 算法时,预期的结果是否仍然一样? 答:a.预期的结果:文档根据语言的大致分成两类。 b.预期的结果不一样。HAC是自底向上的聚类方法,最开始的时候每一篇文档都是一个簇,然后不断对簇进行两两合并,直到所有文档都聚为一簇。层次聚类不需要实现确定簇的数据,如果要按照不同的语言将文档进行分类,则需要在层次结构中某处进行截断,在合适的位置截断也可以将文档大致分为两类。 7、习题18-11假定有一个文档集合,其中每篇文档可以是英文或者是西班牙文。整个文档集如图18-4所示。图18-5 给出了与图18-4 相关的英语和西班牙语的术语表。当然,该术语表只用于帮助理解,对检索系统来说是不可见的。 答:(1)词项-文档矩阵: d1 d2 d3 d4 d5 d6 hello 1 0 0 0 0 1

信息检索课的心得体会.doc

信息检索课的心得体会 信息检索课的心得体会1 一、对科技信息检索的认识 科技信息检索能帮助人们快捷、准确、全面地获取所需知识,最大限度地节省查找时间,使我们的信息检索过程变得事半功倍,更使信息能够得到充分的利用。 我们目前面临的是一个崭新的信息社会。信息技术迅速发展,信息高速公路的飞快建设,使得信息产品已经渗透到各个学科领域,信息的产出量呈指数级增长,信息技术已经成为人类认识世界和改造世界不可缺少的手段。 在当今社会生活的人,几乎每天每时每刻都与信息打交道。可能我们已经感觉到有的人做事往往容易成功,而有些人则不易成功,这在很大程度上是因为前者有较强的信息意识,能够掌握较多的信息,对所做的事情能够作出正确的判断,因而他们的成功率也就比较高。反之若信息意识差,不能及时收集信息,作出的决策往往会有偏差,成功率也就不会很高。 信息检索方法是为实现检索目的而采取的具体操作方法或手段。检索信息的方法主要有两种,即直接检索和间接检索。事实上,现在的许多图书馆仍然在使

用这样的分类层次来对收藏的资料进行分类。现在,计算机技术的发展使得自动构建大型索引成为可能。也就产生了两种不同的检索策略,既以计算机为中心的和以人为中心的信息检索。在现在人们的生活中,计算机已是普遍,人们用计算机网络检索的多些。 信息检索的发展是随着科学技术进步而发展的。信息检索的发展阶段可分为四个阶段:初级阶段我国最早出现的检索工具书是汉代的《别录》,而当时检索工具书主要是以图书目录为主,而且只为极少一部分人服务。第二是手工检索阶段,信息检索的真正发展是在18世纪以后。科学技术不断发展,各种信息大量增加,同时产生了各种类型的文献,如图书、报纸、期刊、会议纪录等等。以后随着社会的发展需要,逐渐形成了完整的手工检索工具——目录、索引和文摘。第三是计算机检索阶段,随着科学技术的发展,信息检索也在发生变革。1946年第一台电子计算机诞生以后,不久就被用来进行信息的存储和检索。第四阶段是网络检索时代,网络的出现,使我们的学习、工作及生活都发生了变化,使人们真正进入了信息社会。 二、对科技信息检索的收获 信息检索是查找信息的方法和手段,它能使人们在浩如烟海的信息海洋中迅速准确全面地查找所需信息。可以说信息检索对于人们的学习、生活和工作等各方面都是非常有用的。它可以充分发挥人类知识宝库的作用,有利于开发智力资源;信息检索可提高效率,节省科研人员的时间,减少人力或投资方面的费用;获

大学—医学信息检索——考试题库与答案

单选题 1、下列哪个文献的类型是属于零次文献:B 2、我国首次开通国际联机情报检索是在(C)。 3、我国首次开通国际联机情报检索是在(A)。 4、下列属于文献的外表特征的选项是(D)。 5、下列哪个文献的类型不属于三次文献( A)。 6、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是( A)。 7、用Google准确搜索重庆医科大学应用技术学院有关资料应使用(C) 8、下列哪一过程是文献检索过程的最后一步(A)。 9、中文医学文献文摘式检索工具是(D)。 10、通用载体通常指的是(A)。 11、关键词可帮助读者在检索中:(D ) 12、下列属于二次文献的是:(A) 13、下列属于文献内容特征的是(B )。 14、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是:(A ) 15、用Adobe Reader可以阅读下列哪种格式的文章。A 16、下列哪一过程是文献检索过程的最后一步:(C) 17、下列属于文献内容特征的是:(A ) 18、下列哪一个是供读者使用的查阅IM的指南(D) 19、利用《中文科技资料目录》(医药卫生)查找有关“中药治疗高血压”方面的文献,如果从主题途径查找,本课题的检索策略是(A)。 20、下列属于三次文献的是:(D ) 21、下列哪个文献的类型不属于一次文献(C )。 22、属于文献内容特征的选项是(D) 23、某护士检索有关“哮喘患者自理行为”方面的文献,她从现在的开始往前逐年进行文献24、查找,此种检索方法称为:(A) 25、不属于文献外部特征的是(B)。 26、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现以下哪个字段代表的是文献的“著者”? :(D) 27、在《中文科技资料目录》(医药卫生)中,护理学的分类号为(D)。 28、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是(A )。 29、使用搜索引擎进行信息检索时,下列措施中对提高查全率没有帮助的是D 30、CBMdisc35个字段中AF代表的是(A)。 30、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是:(A ) 31、下列哪个文献的类型是属于零次文献(B )。 32、下列属于文献的外表特征的选项是(C )。 33、利用综述文献后面所附的参考文献进行文献查找的方法称为(C)。 34、在中国生物医学文献光盘数据库(CBM disc)的记录中出现的“AB”字段代表的含义是:(A) 35、选项中哪一种文献属于一次文献(C )。 36、使用搜索引擎进行信息检索时,下列措施中对提高查准率有帮助的是D 37、下列哪个数据库是全文数据库?A 38、检索有关脑卒中康复效果及影响因素研究的中文相关文献,下列检索策略中,较好的检索式应为(C)

《信息检索导论》课后习题答案

《信息组织与检索》作业答案 第一章布尔检索 习题1-2 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; b. 画出该文档集的倒排索引(参考图1-3中的例子)。 Term-Documentmatrix: 1234 approach0010 breakthrough1000 drug1100 for1011 hopes0001 new0111 of0010 patients0001 schizophrenia1111 treatment0010 Inverted Index: approach -> 3 breakthrough ->1 drug ->1->2 for ->1->3->4 hopes ->4 new ->2->3->4 of ->3 patients ->4 schizophrenia ->1->2->3->4 treatment >3 注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便

于查找。这里我们暂不考虑词的正规化处理(如hopes->hope)。 补充习题1 写出AND查询的伪代码 ●面向过程风格的伪代码: 给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。 这里应用了“化归”思想(将新问题转化归为旧问题来解决)。这里,比较两排序列表的首元素,排除较小的docId(不可能有匹配)后,我们构造出新的剩余列表,再次进行两列表的首元素的比较。 While p1 != null AND p2 != null If p1->docId==p2->docId //对两(剩余)列表的首元素进行比较 insert(answer, p1); p1=p1->next;//构造新的剩余列表,迭代执行 p2=p2->next;// Else if p1->docId < p2->docId p1=p1->next;//p1->docId不可能有匹配;构造新的剩余列表 Else p2=p2->next;//p2->docId不可能有匹配;构造新的剩余列表 End ●面向对象风格的伪代码: 注:为一个数据结构(对象)定义方法,通过方法操作自己的内部数据(List对象里隐含包含了一个成员变量,它是真正的链表或变长数组)。 While list1.currentItem() != null AND list2.currentItem() != null If list1.currentItem().getDocId() == list2.currentItem().getDocId() answer.insert(list1.currentItem()); list1.moveToNext(); list2.moveToNext(); Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() list1.moveToNext(); Else list2.moveToNext(); End

信息检索课期末考试试题库(复习题) - 安徽工业大学

信息检索课期末考试试题库(复习题) 一、单项选择题 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 知识是指人类对客观世界的认识。知识可分为(C) A.有用知识和无用知识 B.基础知识和高级知识 C.感性知识和理性知识 D.理论知识和实践知识 文献按载体形式可分为:印刷型、缩微型、声像型和(D) A.甲骨型 B金石型 C.电脑型 D.机读型 信息检索系统的功能为:报道文献信息、存储文献信息和(B) A.揭示文献信息 B.检索文献信息 C.宣传文献信息 D.介绍文献信息 检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D) A.目次 B.题录 C.附图 D.正文(主文档) 为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述

是正确的(A) A.TI是题名的标识符 B.AB是关键词的标识符 C.AU是摘要的标识符 D.AF是著者的标识符 以下不是布尔逻辑算符的是(B) A.AND B.Near C.OR D.NOT 布尔逻辑算符通常的运算顺序是(A) A.有括号时,括号内的先执行;无括号时NOT>AND>OR B.有括号时,括号内的先执行;无括号时NOT>OR>AND C.有括号时,括号内的先执行;无括号时AND>NOT>OR D.有括号时,括号内的先执行;无括号时AND>OR>NOT 限定词“in”是为了缩小检索范围,提高检索速度和命中率的。下列检索表述式正确的是(B) A.“信息in OCLC” B.信息in AB” C.信息in CNKI” D.信息in Calis” 我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A) A.《中国图书馆图书分类法》 B.《国际十进分类法》 C.《人大法》 E.《科图法》 信息检索的方法有追溯法、综合法和(C)

2019年第一次信息检索课作业及答案

2013年第一次信息检索课作业 一、文献检索课基础知识练习题 1.具有相近含义的同义词或同族词在构成检索策略时应该使用( B )算符予以组配。 A.逻辑“与” B.逻辑“或” C.逻辑“非” D.位置 2.若想排除某概念,以缩小检索范围,可使用(B)算符。 A.逻辑“与” B.逻辑“非” C.逻辑“或” D.位置 3.当某些检索词词干相同、词义相近,但词尾有变化时,可采用( B )方法表示。 A.逻辑“与” B.截词 C.位置算符 D.字段限定 4.切分课题“当前商业银行经营体系的特点”的概念,并用布尔逻辑算符构成检索策略。(无需扩展概念,无需使用英语) 商业银行 AND 经营体系 AND 特点 5.切分课题“当前数理统计模型研究的趋势”的概念,并用布尔逻辑算符构成检索策略。(无需扩展概念,无需使用英语) 数理统计模型 AND 趋势 二、Google搜索引擎练习题 1.用Google的“手气不错”功能,,选择检索下面国家某所大学的网站,写出该大学的名称及其主页的网址。 (1)英国的大学。(2)美国的大学。(3)加拿大的大学。(4)澳大利亚的大学。(5)新加坡的大学。(6)香港大学 牛津大学;.uk/ 2. Google学术搜索引擎练习 (1) 请写出Google学术搜索网址。 (2) 利用Google学术搜索引擎,检索《僧帽牡蛎三倍体的研究》从维普或CNKI数据库中写出该文献前两篇引文的作者,并写出CNKI数据库用户名与密码。 第一篇:曾志南; 陈木; 林琪; 陈朴贤; 刘伟斌 第二篇:赵荣涛; 何建瑜; 刘慧慧 用户名:db0185 密码:dlscxy 3.李阳是著名的英语教育专家,请用google检索标题中包含“疯狂英语”的中国商业类网站的文献,并写出有效的检索式。 李阳or疯狂英语 4.采用google的高级语法(filetype:pdf),搜索有关“信息检索”方面的doc\pdf\ppt格式的文献,给出检索式。

信息检索导论王斌译第一章课后习题答案

习题1-1 forecasts 1 1 home 4 1 2 3 4 in 2 2 3 increase 1 3 july 3 2 3 4 new 2 1 4 rise 2 2 4 sales 4 1 2 3 4 top 1 1 把所有文档中的词抽取,按顺序排序。倒排记录也要按顺序排列,文档频率(几个文档中出现该词)要写 习题1-2 A题 1 2 3 4 approach 0 0 1 0 breakthrough 1 0 0 0 Drug 1 1 0 0 For 1 0 1 1 Hope 0 0 0 1 New 0 1 1 1 Of 0 0 1 0 Patient 0 0 0 1 Schizophrenia 1 1 1 1 Treatment 0 0 1 0 矩阵行是词,按顺序排列;列方向是文档编号。某文档出现某词,相应位置填1,否则填0 B题 Approach 1 3 Breakthrough 1 1 Drug 2 1 2 For 3 1 3 4 Hope 1 4 New 3 2 3 4 Of 1 3 Patient 1 4 Schizophrenia 4 1 2 3 4 Treatment 1 3 习题1-7 1.Kaleidoscope OR eyes 87009+213312 2.Marmalade OR skies 107913+271658

3.Tangerine OR trees 46653+316812 按估计的记录个数,从小到大的顺序 1 2 4 11 31 45 173 174 P 2 31 54 101 Q 1 1 2 4 11 31 45 54 101 173 174 相等把文档编号添加到结果集,两个一起往后移;不相等小的往后移 习题1-10 Answer <- <> While p1!=Nil or p2!=Nil Do if docID(p1)=docID(p2) Then Add(answer,docID(p1)) P1<-next(p1) P2<-next(p2) Else if docID(p1)

信息检索课

练习题 1.请利用中国知网的期刊子库查找哈尔滨师范大学李庆霞老师在核心期刊上发表的论文篇数,并记录其中2篇文章的信息,包括论文题目、作者、刊名及年期。

2.利用CNKI的期刊子库查找1997年以来在齐齐哈尔大学学报上发表的主题包含素质教育的论文有多少篇,请记录其中两篇论文的篇名、作者、刊名和年期。 3.检索课题“数字化校园建设”的相关资料,请写出逻辑检索式,并根据检索式在CNKI的期刊库中进行检索,写出检索结果数目,并记下一篇文章的篇名、作者、刊名和关键词。\ 答:在期刊库高级检索中,主题框输入“数字化校园”,在并含框输入“建设”,在进行检索,检索出3327条

4.在CNKI的期刊库中任意下载一篇CAJ格式论文,并在新建word文档中进行编辑。请叙述由原文档转换成word文档的方法。 答:下载一篇论文后点击工具栏左上方的T字标的符号,选择文本,再单击右键选择复制,之后再粘贴到word文档里即可。 5.请在CNKI的博硕论文数据库中查找2000年以来厦门大学本专业的硕士学位论文,请记录其中一篇硕士论文的篇名、作者姓名、导师姓名和学科专业名称;并查找该导师指导完成的学位论文有多少篇?列举其中两篇学位论文的题目和作者。

6.在CNKI“中国学术期刊网络出版总库”中分别用篇名、关键词、主题、摘要、全文字段查找本专业某一课题的论文,比较各字段检索结果的数量有什么不同,哪个字段最多,哪个字段最少,你认为使用哪个字段检索查准率最高? 答:先用篇名搜索,从图中能看出,搜索结果里的标题和搜索框内容相同的地方有红色字体。

关键词搜索:在搜索结果里刊名部分用其他颜色标出,关于经济类的都标出来。 摘要搜索的结果刊名也用其他颜色标出,但刊名部分并没有直接提到关于搜索框里的内容 主题只要标题里有就显示红色

相关文档
相关文档 最新文档