文档库 最新最全的文档下载
当前位置:文档库 › 信息检索导论-王斌 第三次课后作业(13-21)

信息检索导论-王斌 第三次课后作业(13-21)

信息检索导论-王斌 第三次课后作业(13-21)
信息检索导论-王斌 第三次课后作业(13-21)

信息检索导论第三次课后作业

1、习题13-2

答:(i)贝努利模型:三个文档具有相同的模型表示

(ii)多项式模型:文档1和文档2相同,文档3与它们都不同。文档1和文档2中“Lodon”都出现了两次,文档3中只出现了一次。

2、习题13-5

3、习题14-6

在图14-14 中,3 个向量→a、→b及→c中哪一个满足:(i) 采用内积计算的情况下与→x最近?(ii) 采用余弦相似度计算的情况下与→x最近?(iii) 采用欧氏距离计算的情况下与→x最近?

4、习题15-1一个数据集里支持向量的最小数目是多少(此时的数据集每个类别中都包含实例)?

答:一个数据集里支持向量的最小数目是2个。因为SVM分类模型希望得到在特征空间上间隔最大的分类器,即对于距离超平面最近的实例点,也希望能有足够的确信度将其分开,确定这样的超平面需要的支持向量最小数目是2个。5、习题16-5K-均值算法的两个停止条件为:(i) 文档的分配不再改变;(ii) 簇质心不再改变。请问这两个条件是否等价?

答:这两个停止条件是等价的。当连续两次迭代之后,若文档的分配不再改变,则据此计算出的簇质心也不会再改变;当簇质心不再改变的时候,则K-均值算法计算出的文档的分配也就不再改变。

6、习题17-7a. 考虑在一个两种语言组成的文档集上进行2-均值聚类,你预期的结果是什么?

b. 当使用HAC 算法时,预期的结果是否仍然一样?

答:a.预期的结果:文档根据语言的大致分成两类。

b.预期的结果不一样。HAC是自底向上的聚类方法,最开始的时候每一篇文档都是一个簇,然后不断对簇进行两两合并,直到所有文档都聚为一簇。层次聚类不需要实现确定簇的数据,如果要按照不同的语言将文档进行分类,则需要在层次结构中某处进行截断,在合适的位置截断也可以将文档大致分为两类。

7、习题18-11假定有一个文档集合,其中每篇文档可以是英文或者是西班牙文。整个文档集如图18-4所示。图18-5 给出了与图18-4 相关的英语和西班牙语的术语表。当然,该术语表只用于帮助理解,对检索系统来说是不可见的。

答:(1)词项-文档矩阵:

d1 d2 d3 d4 d5 d6

hello 1 0 0 0 0 1

open 0 1 0 0 0 0 house 0 1 0 0 0 0 profess0 0 0 1 0 0 and 0 0 0 0 0 1 welcom0 0 0 0 0 1 mi 0 0 1 0 0 0 case 0 0 1 0 0 0 hola 0 0 0 1 1 0

y 0 0 0 0 1 0 bienven0 0 0 0 1 0

(2)经过SVD分解,得到:

U2= 0.00000 0.70711

0.00000 0.00000

0.00000 0.00000

-0.27639 0.00000

0.00000 0.50000

0.00000 0.50000

0.00000 0.00000

0.00000 0.00000

-0.72361 0.00000

-0.44721 0.00000

-0.44721 0.00000

Σ'2= 1.90211 0

0 1.84776

V2 = -0.00000 0.38268 -0.00000 -0.00000 -0.00000 -0.92388 -0.00000 -0.00000 1.00000 -0.00000 -0.00000 -0.00000

2-秩逼近矩阵为:

C2 = 0.00000 0.00000 1.30656 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000

0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 -0.20119 0.00000 0.00000 0.00000 0.48571 0.00000 0.00000 0.92388 0.00000 0.00000 0.00000 0.00000 0.00000 0.92388 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 -0.52672 0.00000 0.00000 0.00000 1.27161 0.00000 -0.32553 0.00000 0.00000 0.00000 0.78590 0.00000 -0.32553 0.00000 0.00000 0.00000 0.78590 (3) C C T 的元素(i,j)代表了文档i 和文档j 的相似度。

(4) 22C C T

的元素(i,j)代表了在新的2维空间中文档i 和文档j 的相似度。

与22C C T

中的(i,j)元素不同,是因为在新的低秩表示空间中,将共现上相似的词

项合在一起,隐含地参照了英语与西班牙语的术语对照表。

8、习题19-5Goto 方式根据报价的高低来对广告进行排序,出价最高的广告商获得最高的位置,出价第二高的次之,其余以此类推。如果出价最高的广告商给出的广告与查询无关时会出现什么问题?为什么会出现这样的情况?

答:无关的广告永远不会被用户点击,由此生成的搜索引擎也就没有收入。广告商可以推送这样的广告,在推广自己品牌的同时而没有任何花费。

9、习题20-1在分布式采集系统中,为什么按照主机进行划分会比按照每个URL 进行划分要好?

答:有两个好处:其一,使得更容易跟踪同一主机的连续请求之间经过的时间;其二,主机的robots.txt 文件可以在爬行的节点处被缓存和重新利用。 10、习题21-3对某个Web 网页x ,假设给定了指向它的所有锚文本短语组成的集合,请给出某种启发式方法来从这个集合中选出针对x 的最具描述性的词项或短语。

答:若要从锚文本短语组成的集合中选出针对x 的最具描述性的词项或短语,需要进行特征选择。特征选择即从训练集合出现的词项中选出一部分子集,特征选

择的指标包括互信息,2χ统计量及词项频率。以2χ统计量为例,检测锚文本短语与Web网页x之间的独立性,2χ值越大则意味着独立性假设不成立。

如果某词项或者短语更能描述x,则两者的存在是相互依赖的,表现为2χ值越大。

文献检索第一次作业参考答案

第一次作业 1、什么是文献?科技文献包括有哪些类型的出版物(十大文献源)? 文献是记录知识的一切载体。具体地说,文献是将知识、信息用文字、符号、图像、音频等记录在一定的物质载体上的结合体。 科技文献按出版形式划分:连续出版物(期刊、报纸)、图书、科技报告、会议文献、标准文献、专利文献、学位论文、政府出版物、产品资料、档案文 献十大类型。 2、专利申请须具备哪“三性”,请简要说明。并简述我国的专利审查制度。 专利申请必须具备的三星“新颖性、创造性、实用性”。 新颖性:是指在专利申请日以前没有同样的发明或实用新型,在国内外出 版物上没有公开发表过,这是第一个标准,第二标准,是指在国内没有公开使 用或者说以其他方式为公众所知。 创造性:根据中国专利法对创造性的定义,是指同申请日以前已有的技术 相比,发明有突出的实质特点和显著的进步。 实用性:是指发明或者实用新型能够创造或者使用,并且能够产生积极效果。能够制造或者使用,就是它能够工业批量地制造出来。 我国专利法规定:发明专利、实用新型专利和外观设计专利。依据《专 利法》,发明专利申请的审批程序包括:受理、初步审查阶段、公布、实审 以及授权5个阶段,实用新型和外观设计申请不进行早期公布和实质审查, 只有3个阶段。 受理阶段 专利局收到专利申请后进行审查,如果符合受理条件,专利局将确定申 请日,给予申请号,并且核实过文件清单后,发出受理通知书,通知申请人。如果申请文件未打字、印刷或字迹不清、有涂改的;或者附图及图片未用绘 图工具和黑色墨水绘制、照片模糊不清有涂改的;或者申请文件不齐备的;或 者请求书中缺申请人姓名或名称及地址不详的;或专利申请类别不明确或无 法确定的,以及外国单位和个人未经涉外专利代理机构直接寄来的专利申请 不予受理。 初步审查阶段 经受理后的专利申请按照规定缴纳申请费的,自动进入初审阶段。初审 前发明专利申请首先要进行保密审查,需要保密的,按保密程序处理。 在初审是要对申请是否存在明显缺陷进行审查,主要包括审查内容是否 属于《专利法》中不授予专利权的范围,是否明显缺乏技术内容不能构成技 术方案,是否缺乏单一性,申请文件是否齐备及格式是否符合要求。若是外 国申请人还要进行资格审查及申请手续审查。不合格的,专利局将通知申请 人在规定的期限内补正或陈述意见,逾期不答复的,申请将被视为撤回。经

河工大文献检索第三次作业+答案+指导

第三次上机检索实习指导书 外文数据库 (二) 一、使用美国ASP+BSP数据库检索: 中美双方关于中国参加世贸组织的谈判成功以后,美国企业对中国市场越发关注。在着名期刊《哈佛商业评论》2000年的某一期中,有一篇文章重点介绍了美国柯达公司是如何在中国建立西方模式的股份公司的。请你在Business Source Premier数据库中找到这篇文献,并回答: ①这篇文章的题目、作者、发表的卷期号、页数是什么? 答:题目:A Better Way to Crack China. 作者:Vanhonacker, Wilfried R. 发表的卷期号:Jul/Aug2000, Vol. 78 Issue 4 页数:p20-22 ②柯达公司目前有几家中国公司,分布在什么地方? 答:两家。?1:柯达(中国):厦门?汕头?2:柯达(无锡):无锡 ③柯达公司在这些公司中所占股份是多少? 答:柯达(中国)占有80%;柯达(无锡)占有70% 登陆图书馆主页:,在“电子资源栏”中选择“西文数据库”:

图1 在西文数据库列表中找到“美国ASP+BSP数据库”,点击地址链接进入主页: 默认进入Academic Search Premier(ASP)数据库,如图所示,点击“选择数据库”链接:

只勾选Business Source Premier(BSP),点击确定进入BSP数据库: 根据题目要求,在BSP的检索界面中按下图所示输入,检索限定也如图,出版日期限定为2000年,单击搜索。

根据题意,在检索结果列表中找到第一条结果符合,单击其篇名。文章题目:A Better Way to Crack China.作者:Vanhonacker, Wilfried R.;卷期号: Jul/Aug2000, Vol. 78 Issue 4 ;页数:p20-22。 点击全文链接(HTML或PDF格式都可)So far, Kodak has created two FISCs: Kodak (China), in which it holds an 80% share, and Kodak (Wuxi), in which it holds a 70% share.”如下图红框圈中部分所示。

文献检索作业答案带图

1.信息、知识、情报、文献 1.信息:物质存在或运动方式与状态的表现形式或反映 2.知识:人类在认识和改造客观世界实践中获得的对事物本质的认识 和经验的综合,是人们通过实践对客观事物及其运动过程和规律的认识。 3.情报:定义:人们以各种方式传递与交流的具有一定目的与时效 的信息,是人们为一定目的搜集的有使用价值的知识或信息。 属性:传递性、知识性、效用性 4.文献:指以文字、图像、公式、声频、视频、代码等手段将信息、 知识记录或描述在一定的物质载体上,并能起到存储和传播信息情报和知识作用的一切载体。 “记录有知识或信息的一切载体” 2.简述文献的构成。 答:现代文献由四要素构成:文献信息、文献载体、符号系统和记录方式。 2.简述医学文献的特点。 答:数量庞大、载体多样化、多文种化、学科交叉出版分散、知识信息更新加快、交流传播速度加快、电子化发展趋势。 3.简述文献检索的概念和类型。 答:概念:广义的文献检索包括信息的存储和检索两个过程,是指将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。 狭义的信息检索即从检索工具或检索系统中,通过一定的检索途径或检索方式查找出需要的信息的过程。 类型:①按照检出结果的形式划分:书目检索、全文检索、引文检索。 ②从情报检索角度划分:文献检索、数据检索、事实检索。 ③按照线索手段划分:手工检索、计算机检索。 4.简述文献检索系统的评价因素。

答:报道信息的准确性、报道信息的及时性、索引体系的完善程度、对信息标引的深度、查全率和查准率。 5.什么事查全率和查准率,二者之间有何关系? 答:查全率(R)和查准率(P)是检索系统最为流行和重要的两个性能和效果评价指标。 R=检出的相关信息量/检索工具中相关信息总量X100% P=检出的相关信息量/检出的信息总量X100% 两者之间存在互逆关系,即如果检索工具的查全率较高,则其查准率将相对下降;反之查准率高,则查全率低;而且查全率和查准率只能相对提高,二者永远不可能同时达到100%。 6.试述文献信息的类型。 答:①按文献信息表现形式划分:文字型、视频型、音频型、数字型 ②按文献信息的出版类型划分:图书、期刊、政府出版物、科技报告、专利文献、会议文献、学位论文、标准文献、产品样本说明书、技术档案 ③按文献信息的载体形式划分:书写型、印刷型、缩微型、视听型、电子型 ④按文献信息的加工程度划分: ⑴零次文献信息:书信、手稿、实验数据、观察记录、笔记、内部档案等。特点:内容新颖,但不成熟,难以查询。 ⑵一次文献信息:期刊论文、专利说明书、会议论文、学位论文、科技报告等。特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。创造性、原始性、分散性 ⑶二次文献信息: 目录、索引和文摘等。特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。汇集性、工具性、综合性、系统性 ⑷三次文献信息:综述、进展、年鉴和百科全书等。 7.试述电子文献资源的概念与特点。

信息检索导论-王斌-第三次课后作业(13-21)

信息检索导论第三次课后作业 1、习题13-2 答:(i)贝努利模型:三个文档具有相同的模型表示 (ii)多项式模型:文档1和文档2相同,文档3与它们都不同。文档1和文档2中“Lodon”都出现了两次,文档3中只出现了一次。 2、习题13-5

3、习题14-6 在图14-14 中,3 个向量→a、→b及→c中哪一个满足:(i) 采用内积计算的情况下与→x最近?(ii) 采用余弦相似度计算的情况下与→x最近?(iii) 采用欧氏距离计算的情况下与→x最近?

4、习题15-1一个数据集里支持向量的最小数目是多少(此时的数据集每个类别中都包含实例)? 答:一个数据集里支持向量的最小数目是2个。因为SVM分类模型希望得到在特征空间上间隔最大的分类器,即对于距离超平面最近的实例点,也希望能有足够的确信度将其分开,确定这样的超平面需要的支持向量最小数目是2个。5、习题16-5 K-均值算法的两个停止条件为:(i) 文档的分配不再改变;(ii) 簇质心不再改变。请问这两个条件是否等价? 答:这两个停止条件是等价的。当连续两次迭代之后,若文档的分配不再改变,则据此计算出的簇质心也不会再改变;当簇质心不再改变的时候,则K-均值算法计算出的文档的分配也就不再改变。

6、习题17-7 a. 考虑在一个两种语言组成的文档集上进行2-均值聚类,你预期的结果是什么? b. 当使用HAC 算法时,预期的结果是否仍然一样? 答:a.预期的结果:文档根据语言的大致分成两类。 b.预期的结果不一样。HAC是自底向上的聚类方法,最开始的时候每一篇文档都是一个簇,然后不断对簇进行两两合并,直到所有文档都聚为一簇。层次聚类不需要实现确定簇的数据,如果要按照不同的语言将文档进行分类,则需要在层次结构中某处进行截断,在合适的位置截断也可以将文档大致分为两类。 7、习题18-11假定有一个文档集合,其中每篇文档可以是英文或者是西班牙文。整个文档集如图18-4所示。图18-5 给出了与图18-4 相关的英语和西班牙语的术语表。当然,该术语表只用于帮助理解,对检索系统来说是不可见的。 答:(1)词项-文档矩阵: d1 d2 d3 d4 d5 d6 hello 1 0 0 0 0 1

信息检索与利用作业答案

《信息检索与利用》试题(本科) 一、单项选择题(每题分,共30分) 1. 人类社会的三大资源是( B ) (A)物质、能源、信息(B)物质、人力、资本 (C)物质、能源、管理(D)信息、管理、人力 2. 就信息与物质、能量的关系而言( B ) (A)信息是一种物质(B)信息是一种物质,同时具有一定的能量 (C)信息是一种能量(D)信息既非物质,也非能量 3. 信息论的创始人是( D ) (A)美国数学家哈特莱(B)美国数学家维纳 (C)中国数学家华罗庚(D)美国数学家香农 4.信息资源的本质特征是( D ) (A)依附性与可传递性(B)知识性与共享性 (C)共享性与价值不定性(D)可传递性与共享性 5. 如果分别以检索词a、b、c在某数据库的关键词字段进行检索都能得到相应的检索结果,结果不为0,下面哪个检索式表示检索结果数最少( C ) (A)a and b and c (B)a and b or c (C)a or b or c (D) a or b and c 6. 根据加工深度来划分文献,学位论文属于( B ) (A)零次文献(B)一次文献 (C)二次文献(D)三次文献 7. CNKI 是以下哪一种称谓的简称( C ) (A)清华同方(B)重庆维普 (C)中国知识基础设施(D)中国期刊全文数据库 8. 扩大检索范围的方式是( B ) (A)使用“逻辑与”(B)使用“逻辑或” (C)使用“逻辑非”(D)使用优先运算符 9. 下列能够检索图书信息的数据库是( B ) (A)维普《中文科技期刊数据库》(B)万方数据资源系统 (C)人大复印报刊资料全文数据库(D)超星数字图书馆

文献检索作业答案带图

文献检索作业答案带图.简述文献的构成。1答:现代文献由四要素构成:文献信息、文献载体、符号系统和记录方式。 .简述医学文献的特点。2答:数量庞大、载体多样化、多文种化、学科交叉出版分散、知识信息更新 加快、交流传播速度加快、电子化发展趋势。 3.简述文献检索的概念和类型。答:概念:广义的文献检索包括信息的存储和检索两个过程,是指将文献按 并按照文献用户需求查找出有关文献或文献中照一定方式集中组织和存储起来,包含的信息内容的过程。狭义的信息检索即从检索工具或检索系统中,通过一定的检索途径或检 索方式查找出需要的信息的过程。类型:①按照检出结果的形式划分:书目检索、全文检索、引文检索。②从情报检索角度划分:文献检索、数据检索、事实检索。 ③按照线索手段划分:手工检索、计算机检索。 .简述文献检索系统的评价因素。4答:报道信息的准确性、报道信息的及时性、索引体系的完善程度、对信息 标引的深度、查全率和查准率。.什么事查全率和查准率,二者之间有何关系?5)是检索系统最为流行和重要的两个性能和效)和查准率(P 答:查全率(R 果评价指标。X100% 检索工具中相关信息总量检出的相关信息量/X100% /检出的相关信息量检出的信息总量 则其查准率将相即如果检索工具的查全率较高,两者之间存在互逆关系, 对下降;反之查准率高,则查全率低;而且查全率和查准率只能相对提高,二者100%。永远不可能同时达到 6.试述文献信息的类型。1 / 40 文献检索作业答案带图答:①按文献信息表现形式划分:文字型、视频型、音频型、数字型②按文献信息的出版类型划分:图书、期刊、政府出版物、科技报告、 专利文献、会议文献、学位论文、标准文献、产品样本说明书、技术档案 ③按文献信息的载体形式划分:印刷型、缩微型、声像型、电子型④按文献信息的加工程度划分:书信、手稿、实验数据、观察记录、笔记、内部档⑴零次文献信息: 特点:内容新颖,但不成熟,难以查询。案等。⑵一次文献信息:期刊论文、专利说明书、会议论文、学位论文、科 因而是文献信息的最主要来源和检索对象,内容新颖、详尽,技报告等。特点:但其量大、分散而无序,对其查找与利用带来不便。特点:报道性和检索性,⑶二次文献信息: 目录、索引和文摘等。 主要作用是提供查找文献信息的线索,故又称为检索工具。⑷三次文献信息:综述、进展、年鉴和百科全书等。.试述电子文献资源的概念与特点。7答:电子文献资源是以电子数据的形式,把文字、声音、图像、视频、等多光信号的形式传以电信号、种形式的文献存储在光、磁等非印刷纸质的载体中,计算机或终端和其他外部设备等方式再表现出来的一种新并通过网络通信、播,型文献资源。特点:1.存储介质和传播形式的改变 2.信息的表现形式多样化 3.文献资源类型多样化 多层次的信息服务功能 4. 5.更新速度快、时效性强

2011年春季学期文献检索与应用第三次作业

2011年春季学期文献检索与应用第三次作业 一、名词解释题(共3题、总分15分、得分15分) 1. 数字信息资源检索 (本题分数:5 分, 即用于记录、传输、积累和保存信息的实体。包括以能源和介质为特征,运用声波、光波、电波传递信息的无形载体和以实物形态记录为特征,运用纸张、胶卷、胶片、磁带、磁盘传递和贮存信息的有形载体。 2. 引文索引 ( 利用文献引证关系检索相关文献的索引 3、学位论文 学位论文是指为了获得所修学位,按要求被授予学位的人所撰写的论文。 4、 二、简答题 1、简述计算机信息检索及其必要性 计算机信息检索系统可分为:一次性信息检索系统和二次性信息检索系统。前者适合于单个条目,即信息量不大而需要经常修改的情况,如航空公司订票系统。后者适合于信息条目本身信息量较大而不常修改的情况。 必要性: 计算机信息检索系统的保密性是通过对信息条目的存取控制机构来实现的。计算机信息检索系统的可靠性与计算机系统的可靠性密切相关。计算机信息检索系统的效能通常根据漏检索、误检率、检全率、检准率和响应时间(对联机检索)等来衡量。关键词本身错误或使用的查找算法不对会引起漏检。关键词的二义性会造成误检。检全率和检准率主要针对二次信息检索系统而言的。检全率指检出的相关信息条目数与信息库中的相关条目数之比。检准率指检出的相关条目数与所有检出的条目数之比。这二者是相互制约的。一般认为一个系统检全率在60%~70%,检准率在40%~50%即能满足需要。响应时间的快慢不仅与软件设计的好坏有关,而且与硬件的性能有关。 2、请简述电子期刊的服务形式 任何以电子形式存在的期刊皆可称为电子期刊,涵盖通过联机网络可检索到的期刊和以CD-ROM形式发行的期刊。更严格地讲,电子期刊是以电子媒体形式产生的,而且仅能以此媒体获得的期刊。 都有初级检索、高级检索、跨库检索等功能; 都有按正题、作者、来源、日期等等检索功能。 3、什么是电子期刊?常用的中文电子期刊系统有哪几个? 电子期刊是以电子媒体形式产生的,而且仅能以此媒体获得的期刊。 中国知网,中国期刊全文数据库,万方数据库,龙源期刊网,维普网,中国期刊网,等等 4、列举5个专业性全文数据库,并对他们做简单介绍. 专业性全文数据库有国研网数据库、万方数据库、中国资讯行数据库、中国经济信息网、法律事务应用系统。 国研网数据库:中国知名的大型经济类专业网站。经济决策平台--“国务院发展研究中心信息网”。 万方数据库:是国内最大的数字资源库系统,由中国科技信息研究所直属的万方数据公司开发,最重要的5个镜像系统,分别为科技信息系统、学位论文数据库、数字化期刊、学术会议数据库、商务信息系统。

南京工业大学-信息检索作业

南京工业大学 电子与信息工程学院文献检索作业报告 姓名: XXXXXX 班级: XXXXXXXX 学号: XXXXXXXXXX 指导老师:XXX

一、作业要求 结合自己感兴趣的领域,自拟课题(与专业相关,可以是课程论文,最好是毕业论文课题),根据检索的一般程序,完成课题分析、检索词确定、检索策略制定、及检索实施的过程(注意检索策略转变的过程)。 作业要求: ①搜索引擎的检索(必检) ②电子图书的检索:读秀学术搜索(必检);书目查询系统、超星 电子图书、方正电子图书、 google图书(四选二检索)。 ③主要以CNKI系列资源(尤其是期刊资源)、VIP(维普)中文科 技期刊数据库为检索源(二选一检索) ④写清每种数据库的检索步骤和相关的检索结果条数,注意检索 策略的调整 ⑤写一段1000字左右的描述性文字:通过检索文献阅读之后,你 所拟课题的研究背景、检索阅读后的进一步思考等。 ⑥最后写检索体会及对本课程的建议,尤其从检索结果对你的检 索课题的帮助角度进行描述。 ⑦作业形式:制作成“一个word文档”,并打印出来,在最后一 次课的时候去教室交打印稿

二、课题名称:基于USB的数据通信的研究与设计 三、课题分析及检索目的: USB(Universal Serial Bus,通用串行总线)接口是由Compaq、IBM、Microsoft等多家公司于1994年底联合提出的接VI标准,其目的是用于取代逐渐不适应外设需求的传统串、并口。1996年业界正式通过了USBl.0标准,但是直到1998年USBl.1标准确立和win 98内核正式提供对USB接口的直接支持之后,USB才真正开始普及,到今天已经发展到USB3.0标准。第一版USB 1.0是在1996年出现的,速度只有1.5Mbps;两年后升级为USB 1.1,速度也大大提升到12Mbps,至今在部分旧设备上还能看到这种标准的接口;2000年4月,目前广泛使用的USB 2.0推出,速度达到了480Mbps,是USB 1.1的四十倍;如今10个年头过去了,USB 2.0的速度早已经无法满足应用需要,USB 3.0也就应运而生,最大传输带宽高达5.0Gbps,也就是640MB/s,同时在使用A型的接口时向下兼。 USB总线协议定义了4条信号线,其中两条负责供电而另外两条负责数据的传输。USB 通信模型是一种Host Slave(主机一外设)主从式结构,因此经由USB总线进行通信的双方必有一方在通信控制中担当主机(Host)的角色。 目的: 通过本次检索,我希望能更全面的了解USB的工作原理及相关理论,全面了解在数据通信中USB的地位及工作情况。并了解USB在现在生活中的应用前景和发展。 四、检索策略: 1、检索关键字确定:USB、数据通信 2、扩展关键字:数字信号处理、电子通信、通用串行总线、数据传输 3、制定检索式: (USB or 通用串行总线) and (数据通信 or 数据传输)or 数字信号处理 在下面检索过程中的检索式将在此基础上进行修改 4、检索工具: (1)、利用“百度”“Google”搜索引擎搜索相关资料 (2)、利用“读秀学术搜索”“超星数字图书馆”“google图书”搜索电子图书 (3)、利用“VIP(维普)中文期刊数据库”搜索相关期刊资料

文献检索平时作业答案带图(温医)

1.简述文献的构成。 答:现代文献由四要素构成:文献信息、文献载体、符号系统和记录方式。 2.简述医学文献的特点。 答:数量庞大、载体多样化、多文种化、学科交叉出版分散、知识信息更新加快、交流传播速度加快、电子化发展趋势。 3.简述文献检索的概念和类型。 答:概念:广义的文献检索包括信息的存储和检索两个过程,是指将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。 狭义的信息检索即从检索工具或检索系统中,通过一定的检索途径或检索方式查找出需要的信息的过程。 类型:①按照检出结果的形式划分:书目检索、全文检索、引文检索。 ②从情报检索角度划分:文献检索、数据检索、事实检索。 ③按照线索手段划分:手工检索、计算机检索。 4.简述文献检索系统的评价因素。 答:报道信息的准确性、报道信息的及时性、索引体系的完善程度、对信息标引的深度、查全率和查准率。 5.什么事查全率和查准率,二者之间有何关系? 答:查全率(R)和查准率(P)是检索系统最为流行和重要的两个性能和效果评价指标。 R=检出的相关信息量/检索工具中相关信息总量X100% P=检出的相关信息量/检出的信息总量X100% 两者之间存在互逆关系,即如果检索工具的查全率较高,则其查准率将相对下降;反之查准率高,则查全率低;而且查全率和查准率只能相对提高,二者永远不可能同时达到100%。 6.试述文献信息的类型。

答:①按文献信息表现形式划分:文字型、视频型、音频型、数字型 ②按文献信息的出版类型划分:图书、期刊、政府出版物、科技报告、专利文献、会议文献、学位论文、标准文献、产品样本说明书、技术档案 ③按文献信息的载体形式划分:印刷型、缩微型、声像型、电子型 ④按文献信息的加工程度划分: ⑴零次文献信息:书信、手稿、实验数据、观察记录、笔记、内部档案等。特点:内容新颖,但不成熟,难以查询。 ⑵一次文献信息:期刊论文、专利说明书、会议论文、学位论文、科技报告等。特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。 ⑶二次文献信息: 目录、索引和文摘等。特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。 ⑷三次文献信息:综述、进展、年鉴和百科全书等。 7.试述电子文献资源的概念与特点。 答:电子文献资源是以电子数据的形式,把文字、声音、图像、视频、等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传播,并通过网络通信、计算机或终端和其他外部设备等方式再表现出来的一种新型文献资源。 特点:1.存储介质和传播形式的改变 2.信息的表现形式多样化 3.文献资源类型多样化 4.多层次的信息服务功能 5.更新速度快、时效性强 6.具备检索系统或功能 7.检索访问不受时空限制 8.试述医学电子文献资源的类型。

网络信息检索第三次作业

一元搜索 元搜索引擎又称多搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。(搜索引擎分类:全文搜索引擎、目录索引、元搜索引擎) 元搜索引擎的另外一个定义:元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(The mother of searce engines)”。在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为“源搜索引擎”(source Engine),或“搜索资源”(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(Meta-searching technique),元搜索技术是元搜索引擎的核心。 一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。 主要元搜索引擎列表 国内: ·搜魅网(someta)集合了百度、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。·比比猫(Bbmao)独创国际领先的聚类和去重技术。搜索结果汇集各大搜索引擎结果,搜索结果智能分类整理,去掉重复搜索结果,并拥有直接搜寻文档和强大网络收藏夹等多元功能。对于记者、教授、高管等知性、高端且惜时如金的人群比较适用,支持中英文搜索。·全博元搜索(QOOPOO)聚合搜索的力量,已经运行多年,2006年格林斯潘曾接触这家公司,后劲比较强劲。·Xooda元搜索引擎支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新的优化排序。·佐意综合搜索(Chinazss)集主流搜索引擎为一体,分类详细,强大的搜索功能。让搜索变得更方便! 国外: Vivisimo:是美国Vivisimo公司最新开发的一个具有对搜索结果自动进行分类功能的搜索引擎!它能非常快速地将不同类型的网站进行分类整理并将结果呈现在你眼前!它在搜索结果页面左侧增加了一个搜索结果目录栏。不足之处在于搜索结果精准度不是很高。ProFusionProFusion:是并行式元搜索引擎,拥有智能化的搜索技术、对查询的实用提示和非常宝贵的个人化搜索服务,它是目前很优秀的元搜索引擎,可同时调用9个独立万维网搜索引擎—AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、Webcrawler和Yahoo。MetaCrawlerMetaCrawler:是独立万维网搜索引擎WebCrawler的姐妹引擎,也是一个并行式元搜索引擎,它条理清晰,组织结构完美,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立引擎,是简单搜索或中度复杂搜索的最佳网点。DogpileDogPile:是目前性能较好的并行式元搜索引擎之一,它可以同时调用Web 搜索引擎、Usenet搜索引擎和FTP搜索引擎等25个搜索引擎,其中,Web搜索引擎14个。DigisearchDigisearch:是目前能同时调用独立搜索引擎较多的并行式元搜索引擎,它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo、OpenText和Magellen 等18个独立万维网搜索引擎,DejaNews等3个Usenet搜索引擎和Fourll等3个个人信息和商界信息搜索引擎。Highway61Highway61:是并行式元搜索引擎,可以同时调用

兰大信息检索与利用13春在线作业3答案

兰大信息检索与利用13春在线作业3答案 一、单选题(共 10 道试题,共 40 分。) V 1. 国内出版的规模最大的一部综合性辞典是() A. 《辞源》 B. 《辞海》 C. 《汉语大字典》 D. 《中国大百科全书》 E. 《汉语大词典》 满分:4 分 2. 一般来说,文献工作者把那些不正式出版,但也非秘密文献的非公开出版物,称之为 ()。 A. 黑色文献 B. 灰色文献 C. 科技图书 D. 连续出版物 E. 参考工具书 满分:4 分 3. ( )是一种最丰富、最自由、最具开放性的网络信息资源。 A. Telnet信息资源 B. FTP信息资源 C. Web信息资源 D. 网络论坛 满分:4 分 4. 出版周期最短的定期连续出版物是() A. 报纸

B. 期刊 C. 图书 D. 年鉴 满分:4 分 5. 文献计量方法中研究最活跃、发表文章最多的一个领域是() A. 内容分析 B. 引文分析 C. 文献统计 D. 聚类分析 满分:4 分 6. 《中图法》分为()个基本部类。 A. 5 B. 7 C. 9 D. 22 满分:4 分 7. 数据库是由()构成的。 A. 记录 B. 索引 C. 文档 D. 数据 满分:4 分 8. 信息检索的概念最早是由()提出的。 A. V.布什恩 B. S. C.布拉德福 C. C.N.穆尔斯

D. D.普赖斯 E. H.P.卢恩 满分:4 分 9. 信息素质这一概念最早是由美国信息产业协会主席()于1974年在给美国 政府的报告中提出来的。 A. PaulZurkowsky B. V.Bush C. C.N.Mooers D. F.W.Horton E. C.E.Shannon 满分:4 分 10. ( )反映的是信息的确定度,指的是符号与其他符号的关系。 A. 语法信息 B. 语义信息 C. 语用信息 D. 全信息 满分:4 分 二、多选题(共 5 道试题,共 20 分。) 1. 主题索引的类型主要有() A. 语词索引 B. 链式索引 C. 挂接主题索引 D. 保留上下文索引 满分:4 分 2. 按文摘的内容或信息量,可将文摘分为() A. 报道性文摘 B. 指示性文摘

文献检索答案.

《信息检索与利用》课程实习作业单片机在智能仪表方面的应用 班级: 姓名: 学号: 任课教师:

完成日期:二〇一五年四月26 日 实习二中文期刊全文数据库 1. 实习目的 掌握初级检索、高级检索、二次检索方法以及基本、辅助字段的概念。 掌握汉语词语切分、概念扩展的方法。 掌握检索结果的查看存盘方法,全文下载阅读方法。 2. 实习要求 1)进入中国期刊网(CNKI)后,浏览界面和相关分类专辑。 2)根据课题要求,分析检索概念,要求至少有一个概念扩展出二个检索词。 3)根据课题内容,选择总分类目录(专辑)、子分类目录(专业)和数据库的年份。 4)通过初级检索、高级检索,运用汉语词语切分、概念扩展和二次检索方法,分别换用不同的字段,检索与课题相关的文献,记录检索策略和所获的文献篇数,选择密切相关的一篇文献。 5)将密切相关的一篇全文的第一页粘贴在文件相应位置处。 3.实习思考题 .高级检索和初级检索相比较有哪些主要优点? 答、初级检索是直接输入检索词进行单条件检索,而不进行检索条件之间的逻辑匹配。它得到的检索结果数搜索量比较多,但相对高级检索而言不够精确。高级检索是进行多个检索条件之间的逻辑匹配来进行检索。它得到的检索结果比较精确,但相对简单检索而言数量较少。 ·关键词字段、主题词字段的关键词和主题词各出自何处,有什么区别? 答、主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。而关键词是属于自然语言的范畴,未经规范化处理,也不受主题词表的控制。主题词与关键词最大的区别就是主题词经过了规范化处理。

文献检索作业考试答案

名词解释: 1.文献检索:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。广义的文献检索包括文献的存储和文献的检索两个过程。狭义的文献检索就是找出自己所需的文献。 2.检索语言:是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门化的标识系统。检索的匹配就是通过检索语言的匹配来实现的。 3.后组织式语言:是指在检索前检索系统中的检索标识是独立的,实施检索后,才根据检索需要进行组配的检索语言。如叙词语言、单元词语言、关键词语言属此类型。 4.电子文献资源:电子文献资源是以电子数据的形式,把文学、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。 5.参考数据库:是指包括各种数据、信息或知识的原始来源和属性的数据库。数据库的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般来说,参考数据库主要针对印刷型出版物而开发的,它包括书目数据库和指南数据库两种。 6.OPAC:是英文Online Public Access Catlogue的首字母缩写,可以译为“联机公共书目查询系统”,是一个基于网络,供读者查询图书馆藏书目信息的联机检索系统。它是图书馆自动化的基础,也是未来数字图书馆的有机组成部分。 7.电子图书:又称为数字图书或Ebook,是随着电子出版、互联网以及现代通信电子技术的发展应运而生的一种新的图书形式。电子图书应具有三要素:(1)电子图书内容。(2)电子图书的数字存储设备。(3)电子图书的阅读软件。 8.网络电子图书:是以电子形式出版发型,以互联网为流通渠道、以数字内容为流通介质、以网上交易为主要支付手段的图书。 9.前方一致检索:也称为后截断检索,是指在某一检索项内容中,检索前方与检索字/词完全一致的文献。前方一致检索适用于数值索引的检索项。 10.多项双词逻辑组合检索:多项是指可以选择多个检索项;双词是指一个检索项中可以输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合:并且、或者、不包含、同句、同段,每个检索项中的两个检索词可以分别使用词频、最近词、扩展词;逻辑是指个检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合。 11. 双词频控制检索:是指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 12. 引文:所谓引文就是参考文献

信息检索作业3

现代信息查询与利用综合报告在校大学生创业问题 -- 姓名:韩 东林学号:20105837 班级:行政1002班 在校大学生创业问题一、研究主题的确立与分析1、需求分析根据5W法对课题进行需求分析,首先是外部特征的分析:在校大学生创业问题(1)全面性/专深性:全面地查找介绍研究方面的文献。在校大学生创业问题(2)本课题的目的:完成一篇方面的综述章。(3)文献类型:图书、期刊、学位论文、网络信息。(4)相关文献的时间范围:时间范围确定在2005—2012年。(5)相关文献的文献加工深度:选择一次文献中的论文、译文、专著;二次文献中的文摘、搜索引擎信息;三次文献中的综述文献。(6)

相关文献的作者:主要来自于各大高校、研究所、从事在校大学生创业问题、教育研究工作的专业人士,并在该领域发表了多篇论文。(7)相关文献质量:主要为核心期刊上,被引用率较高的文献。(8)语种:定所查的相关文献语种为简体中文。内容特征的分析:现状如何为什么如何改善在校大学生创业为什么需要创在校大学生创业水平目的(Why)的目的是什么?业?能否有所改进?全国所有大学生为什么要选择这如何针对不同地区在对象(What)还是有代表的学个对象?校大学生创业有特色 生?改进?在何种场合?公为什么要选择这应该选择在什么场场所(Where)开?私密?个场所?所?什么时期创业比为什么要选择这应该选择在什么时期时间(When)较好?个时期?创业由哪学生承担在为什么要由他们应该由哪种学生来承人员(Who)校创业任务?做?担?有没有更好的手段方创业的手段段、方为什么要那么手段(How)法?做?法? 2、关键词分析直接从课题中提取的关键词:大学生、创业、问题关键词

信息检索作业(一)

单选题:(共30道试题,每题2分) 1.二次检索的检索主题与一次检索的检索主题的关系不包含()关系。 A.包含关系 B.下位关系 C.并列关系 D.完全不相关 2.《说文解字》中的部首数量是()。 A. 540 B. 542 C. 214 D.189 3.在CAJ-CD规范中,符号“N”表示的参考文献类型是() A.专著 B.论文集 C.报纸文章 D.期刊文章 4.下列哪项工具书是资料性工具书() A.字典 B.书目 C.年鉴 D.索引 5.电子化的检索工具是以()的形式出现的。 A.数据库 B.资料库 C.电子版 D.印刷版 6.利用布尔逻辑检索技术来检索包含司马迁但不包含《史记》的文章,输入的检索条件是()。 A.司马迁+《史记》 B.司马迁—《史记》 C.司马迁*《史记》 D.司马迁and《史记》 7.下列哪项工具书是语言性工具书。() A.手册 B.图录 C.字典 D.表谱 8.手册的基本特点是()。 A.侧重揭示文献内部特征 B.内容新颖,连续出版 C.著录内容标明出处 D.所收资料侧重基础知识,注重实用性 9.三次文献包括() A.目录 B.索引 C.文摘 D.综述

10.在CAJ-CD规范中,符号“D”表示的参考文献类型是() A.专著 B.论文集 C.学位论文 D.期刊文章 11.主要用来解释汉字的形、音、义的工具书是()。 A.类书 B.字典 C.词典 D.百科全书 12.索引数据库主要提供的是() A.一次文献 B.二次文献 C.三次文献 D.零次文献 13.布尔逻辑运算符中表示逻辑“或”的符号是()。 A. + B.- C. * D./ 14.搜索引擎中常用的结果输出限定方法不包括()。 A.信息线索级别限定 B.类聚方法限定 C.时间限定 D.字体编码限定 15.二次文献包括() A.目录 B.述评 C.手册 D.综述 16.二次文献具有的特点是() A.原创性 B.检索性 C.综合性 D.参考性 17.利用布尔逻辑检索技术来检索费孝通所写的关于“东方文化”的著作,输入的检索条件是()。 A.费孝通+东方文化 B.费孝通*东方文化 C.费孝通or东方文化 D.费孝通—东方文化 18.下列哪项工具书不是参考性工具书。() A.手册 B.图录 C.词典 D.年鉴

文献检索作业参考答案

2011年上机习题 姓名:邵荣凯学号:109208010130 系:经贸系班级:09国贸本(2)班 说明: ①上机习题为平时作业,总分100分,计入平时成绩当中。 ②要求认真审题,独立完成,抄袭者和被抄袭者均不得分。 ③可先在电脑上做好后再打印出来,注意排版整洁清晰。 1.在中国知识基础设施工程(CNKI)系列资源库的中国期刊全文数据库中检索篇名为《聚合硫酸铁的制备》发表在《四川师范大学学报》上的论文。(6`) 1)给出检索策略。 2)给出该文的题录信息。 答:(1)检索策略:登录江西蓝天学院图书馆主页,点击中国知网“CNKI系列资源库”,点击“https://www.wendangku.net/doc/587671603.html,/grid2008/index/ZKCALD.htm ”,在文献出版来源中填“四川师范大学学报”,主题栏填“聚合硫酸铁的制备”,单击“检索文献”。 (2)题名:聚合硫酸铁的制备 作者:向群 作者单位:四川轻化工学院 文献来源:四川师范大学学报(自然科学版) 发表时间:1997-01-28 2.检索有关“社保基金进入资本市场风险和收益”的研究文献。要求在CNKI中的《中国优秀硕博士学位论文全文数据库》、《中国期刊全文数据库》检索,无时间范围限制,检索词提示:“社保基金”、“资本市场”、“风险”、“收益”。请在跨库检索中选择相应的数据库后,确定检索词出现的字段及其组配关系,使检索结果不至于过少,要求写出该检索式。(6`) 答:检索词:社保基金、资本市场、风险、收益 检索策略: 登录江西蓝天学院图书馆主页,点击中国知网“CNKI系列资源库”,点击“ https://www.wendangku.net/doc/587671603.html,/grid2008/index/ZKCALD.htm ”,点击“高级检索”,在“选库”中选择《中国优秀硕博士学位论文全文数据库》、《中国期刊全文数据库》检索。在“检索范围条件”中选择“主题”,再输入检索词“社保基金、资本市场、风险、收益”,点击“检索文献”得出检索结果: 检索式举例:社保基金+资本市场+风险+收益

南通大学信息检索第三次作业资料

研15机械、电气第三次作业 提示:请同学们新建一个word文档,将word文档的文件名以你的“班级学号姓名第三次作业”的格式命名,然后按照题目顺序依次在word文档里作答,注意随时保存你的作业内容,待检查无误后以e-,邮件的主题处也须注明你的“班级学号姓名第三次作业”。(注意:发送邮件之前请在自己的邮箱中保存一份,以便留底备查。) 一、请利用我校图书馆主页上的Elsevier ScienceDirect数据库进行检索: 1、通过主题浏览方式(Browse publications by subject),查找你所学专业的图书和期刊,任选其中一种期刊,选择其近三年的某一期,复制其中你感兴趣的一篇论文的题录、摘要及正文第一段。 答: 2014 AASRI Conference on Circuit and Signal Processing (CSP 2014) Three-Dimensional Reconstruction from Projections Based On Incidence Matrices of Patterns Zakharov Alexei, Zhiznyakov Arkady* Murom Institut, Vladimir State University, Murom, 602264, Russian Federation Abstract Task of automatic reconstruction of three-dimensional objects by drawing views presented. The algorithm based on a boundary representation of three-dimensional models. The algorithm consists of the following steps: automatic separation of the drawing per the views, determination of three-dimensional coordinates of vertices, definition and marking of wire model primitives, reconstruction of model faces and model elements. The fundamental concept of the algorithm is to find the structural elements of three-dimensional model with usage of pre-specified patterns. The templates are described by means of matrices. Matching algorithm uses invariants: the number of vertices, type of edges. 2014 Zakharov A.A., Zhiznyakov A.L. Published by Elsevier B.V. Selection and/or peer review under responsibility of American Applied Science Research Institute Keywords: three-dimensional reconstruction, CAD-system, incidence matrix. 1. Introduction For the moment, a large number of the technical drawings, submitted in both paper and electronic form are accumulated in the archives of the enterprises. An additional point is that the development of many objects often begins with the drawing instead of three-dimensional model usage. Two-dimensional

相关文档
相关文档 最新文档