文档库 最新最全的文档下载
当前位置:文档库 › 网络信息资源检索与利用第二次作业

网络信息资源检索与利用第二次作业

网络信息资源检索与利用第二次作业
网络信息资源检索与利用第二次作业

《网络信息资源检索与利用》课程实验第2次实验报告

实验内容及基本要求:

实验项目名称:网络搜索引擎的应用

实验类型:验证

每组人数:1

实验内容及要求:

1.请分别针对网络资源目录使用的分类方法进行举例。

2.在 yahoo 的分类目录中找到一条路径指向网站论文:

https://www.wendangku.net/doc/0513058633.html,/Summer98/koumoutsakos.pdf。

3.在新浪网的分类目录中找到一条路径指向学校的网站:https://www.wendangku.net/doc/0513058633.html,

4.在 sohu 的分类目录中找到一条路径指向网页:https://www.wendangku.net/doc/0513058633.html,/newbook/

5.请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

6.请了解 google 和 baidu 在进行关键词检索中语法的异同,并说明这两者在针对某一主题进

行检索时检索结果的差异以及对检索意图理解准确度的差异。

实验结果:

1.请分别针对网络资源目录使用的分类方法进行举例。

(1)主题分类法

(2)学科分类法

(3)图书分类法

(4)分面组配法

2.在 yahoo 的分类目录中找到一条路径指向网站论文:

https://www.wendangku.net/doc/0513058633.html,/Summer98/koumoutsakos.pdf。

3. 在新浪网的分类目录中找到一条路径指向学校的网站:https://www.wendangku.net/doc/0513058633.html,

4. 在 sohu 的分类目录中找到一条路径指向网页:https://www.wendangku.net/doc/0513058633.html,/newbook/

5. 请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

(一) Yahoo( https://www.wendangku.net/doc/0513058633.html,)

Yahoo 是世界上最著名的网络资源目录。Yahoo 的魅力,就在于它的可浏览式等级主题目录。Yahoo 按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,成为

网络检索工具的佼佼者和等级式风络资源目录的典型代表。Yahoo 采用多标准高类、多维展开的方式,能够为某一信息源在其巨大的分类等级结构中提供不同的路径分支入口,保证了从不同的路径,为检索相同内容的不同用户提供服务。对于交替类目,Yahoo 利用了符号“@”来表示,起到了类似于相关参照的作用,能够指引用户由某一子类目进入Yahoo的浏览性等级结构的其他分支中。

(二) Open Directory(https://www.wendangku.net/doc/0513058633.html,)

Open directory 是手工编辑的目录导航式搜索引擎,它由四万多名志愿者编辑标引加工数据

并组织类目,自称为世界上最权威的人工编辑的搜索引擎。大多数志愿者都对自己负责的部

分相当感兴趣,有的就是该领域的专家权威,因此Open directory 中有不少分类的内容,特

别是一些边缘学科或冷门学科,要比Yahoo 提供的全面得多,有的甚至在Yahoo 中根本找不到对应的分类。Open Directory - 开放目录专案提供了一种以互联网自我组织与管理的方

式进行发展用来满足快速增长的网站数量。随着互联网的增长,网民数量也随之增加。这些网民能够编辑管理一小部分网站,并且提供负责更多的编辑工作,整理清除没有用的信息内容,只保留最好的内容。

Open directory 也提供关键词检索,分为简单检索和高级检索。在简单检索中,支持布尔逻

辑检索。在高级检索中提供了相关的选择,包括选择只检索类目、只检索站点等。同时它还提供了与其他搜索引擎的链接。

Open directory 是一个非常有前景的网络资源目录,它可无限扩展的编辑人员,为其今后的

发展注入了极大的活力,它的资源收录的增长速度,内容的更新频次,都是其他网络资源目

录所无法比拟的。同时,它详尽的类目体系,开放的管理体制,都形成了其独用的特色,成

为用户获取网络信息资源的重要门户网站。

(三)搜狐( https://www.wendangku.net/doc/0513058633.html,)

搜狐的网络资源目录堪称是我国第一部系统的网站分类法,对其他中主文网络资源目录的发

展起到了积极的促进作用。搜狐网络资源目录的分类体系的编制,基本上坚持了在符合科学

性原则的前提下,充分考虑网站资源和用户的查询习惯的原则。在搜狐的分类体系结构中包

括18 个大类,涵盖了 50000 多个不同层次的子类目,形成了一个十分庞大的树状结构,几

乎涉及所有的行业或者领域。它采用了“纵向成枝、横向成网”、“主题法与分面组配法结合”

的分类方式,根据网站的主题,首先把网站分为18 个大类,再按细分主题层层分下去。然

后,再根据不同用户的使用习惯,以及不同的分类标准,把不同类目下“相关”的类目“链接”

起来,从而形成搜狐的“网状”分类体系。搜狐的网站分类法以主题分类为主设立了娱乐休闲、

工商经济、电脑网络、分司企业、教育培训、文学、艺术、体育健身、新闻媒体、卫生健康、科学技术、生活服务、旅游交通、社会文化、政法军事、社会科学、个人主页17 个大类,

另外结合分面组配的方法设立“国家与地区”类目,把其他 17 个大类下的所有网站又按所属

地域进行分类,因为大多数网站都具有地域性,也便于用户直接查找。搜狐的网站资源目录

同样是按照信息所属的类别,层层点击查找信息,所以用目录时首先要考虑清楚想要查找的

信息属于哪个类别。

6.请了解 google和 baidu 在进行关键词检索中语法的异同,并说明

这两者在针对某一主题进行检索时检索结果的差异以及对检索意图理

解准确度的差异。

百度搜索引擎使用了高性能的“网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性

的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。

百度搜索引擎的特点

1.基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的

准确性和查全率。

2.支持主流的中文编码标准。包括 GBK( 汉字内码扩展规范 )、GB2312( 简体 )、BIG5( 繁体 ),并且能够在不同的编码之间转换。

3.智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够

客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。

4.检索结果能标示丰富的网页属性 (如标题、网址、时间、大小、编码、摘要等 ),并突出用户的查询串,便于用户判断是否阅读原文。

5.百度搜索支持二次检索 (又称渐进检索或逼进检索 )。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自

己真正感兴趣的内容。

6.相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找

更相关的结果,统计表明可以促进检索量提升10-20%。

7. 运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最

快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5 秒)

8. 可以提供一周、二周、四周等多种服务方式。可以在7 天之内完成网页的更新,是目前

更新时间最快、数据量最大的中文搜索引擎。

9.检索结果输出支持内容类聚、网站类聚、内容类聚 +网站类聚等多种方式。支持用户选择时间

范围,提高用户检索效率。

10.智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中

文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。

11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩

展性、高性能和高稳定性。

12.高可配置性使得搜索服务能够满足不同用户的需求。

13.先进的网页动态摘要显示技术。

14.独有百度快照,

15.支持多种高级检索语法,使用户查询效率更高、结果更准。已支持“ +” (AND)、“-”(NOT)、“ | ” (OR)、“ site:、“”link:,还”将继续增加其它高效的搜索语法。

Google 作为全球最大的多语言搜索引擎 ,在国际上占有的市场越来越大,成为互联网最具潜力

的企业,以下就介绍下 GOOGLE 搜索引擎的主要特点:

1.特有的 PR 技术, PR 能够对网页的重要性做出客观的评价。PR 是 GOOGLE 评价一个网

站质量高低的重要标准, PR 分为十个等级,从容不 1 至 10, PR 越高代表网站质量和权威性越高,排名也就越靠前。

2.更新和收录快, GOOGLE 收录新站一般在十个工作日左右,是所有搜索引擎收录最快的,

更新也比较稳定,一般一个星期都会有大的更新。

3.重视链接的文字描述和链接的质量,链接的文字描述也就是做链接用的文字,这个文字对GOOGLE 排名起一定作用,因此我们建议如果网站要做某些关键词,在交换链接时要用这

个关键词做链向你网站,链接的质量与链接网站的权威性和与你站是否相关有关,权威越高侧你站获得的排名越好,

4.重视Description描述,多次研究发现,那些在GOOGLE排名好的网站在描述中匀含有关

键词,而且有些重复二次,因此可推断其对描述还是相当重视。

五、超文本匹配分析 :Google 的搜索引擎同时也分析网页内容。并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本 ) 的方式 ,而是分析网页的全部内容以及字体、分区及每

个文字精确位置等因素。同时还会分析相邻网页的内容 ,以确保返回与用户查询最相关的结果。

他们的搜索排序方式与广告展现也有不同,百度有竞价排名,而Google是机器程序自动排序,完全按照预先设计的机器程序来处理,没有人为的干预来操纵其排名。

成绩评定:

该生对待本次实验的态度□认真□良好□一般□比较差。

本次实验的过程情况□很好□较好□一般□比较差

对实验结果的分析□很好□良好□一般□比较差

文档书写符合规范程度□很好□良好□一般□比较差

综合意见:

成绩指导教师签名日期

网络信息检索期末作业

期末作业 一、读书心得 1、结合《世界是平的》、《理解媒介》,谈谈有关网络新时代特征的看法。 小谈网络新时代特征 今时不同往日,今天的世界是以往的人类所不能想象的,就像我们不能够想象到几百年后这个世界是怎么样的一样。不过,有一点是可以肯定的,那就是这个世界会变得越来越小,因为这是一种趋势------全球化的趋势。 托马斯·弗里德曼在《世界是平的》一书中谈到,由于市场的全球化,特别是资本市场的全球化,整个世界经济呈现出两个特点:一是各国经济发展趋势的一体化,即世界各国的经济联系越来越紧密,千丝万缕,越来越荣辱与共,就像“蝴蝶效应”和“卡特尼娜”飓风;二是全球经济的敏感度更快更迅猛了,经济危机的负面作用将比流感来的还快,比禽流感的传播还要迅猛。确实,如今的世界各国经济联系越来越千丝万缕,越来越荣辱与共。 就以08年美国次贷危机为例,由于全球资本市场的一体化,美国这个全球最大经济体的一次感冒引发了整个世界经济的巨大震动。给他国经济造成了难以估量的巨大经济损失,甚至导致诸如冰岛一样的国家破产发生。在这样的一个世界中生活着,或许某一天你仰天长叹一口气,就引起了“卡特尼娜”飓风。你跺一跺脚,就引发了“东南亚海啸”。 在书中,弗雷德曼把这个世界描述为平的,称我们现在正处于为“全球化3.0”时代。“托马斯弗里德曼以他独特的视角讲述了世界正在变平的过程,他在书中援引了很多热点话题,介绍了诸多令人瞩目的市场和炙手可热的行业。开发源代码、外包、离岸生产、供应联合搜索技术等被描述成为铲平世界的10 大动力,而中国、印度等国家和一些站在全球顶尖位置的公司和机构,则被描述成为变平的世界中举足轻重的角色。他把所有的这一切编织在一起的时候,却揭示了一个正在发生的深刻而又令人激动的变化——全球化的趋势。它正随着那些动力,在地球各处勇往直前、势不可挡,世界也因此从一个球体变得平坦。” 从球体世界到平坦的世界的过程,我们周围的一切都在发生着天翻覆地的变化。在这个所谓的平坦的世界中,人与人,人与社会,人与自然之间的联系更加紧密不可分。人们常认为一个人死了对于这个世界是没有关系的,地球照样绕太阳转。但如若死一个爱因斯坦,那么虽然我们的地球还是会照样绕太阳转,但是我们的生活环境的改善工程就得往后给推迟个几十年,甚至是几百年。于是我们可以得出,人才是让世界变得平坦的一个重要因素之一。 全球化是资本、技术和信息超越国界的结合,这种结合创造了一个单一的全球化市场。国与国,企业与企业之间的竞争愈演愈烈。科学技术的进步和企业管理理念的转变,为我们提供了先进的经营(运营)手段和难得的机遇。随着互联网技术愈来愈渗透到社会发展的各个方面,数字的、移动的、个人的和虚拟的电子网络技术在经济全球化、企业经营从命令和控制向合作和联系转变过程中发挥着愈来愈重要的作用。在此过程中各种技术和工具共同创造了一个全新的平台,伴随着这个新平台的建立,商家和个人开始接受新的习惯、技术和流程,从一个垂直的命令和控制的价值创造模式转换到更

网络信息检索作业

网络信息检索作业 1.网络信息资源检索常用的检索技术有哪些? 答:网络信息资源检索常用的检索技术有 (1)布尔逻辑检索(Boolean search) (2)截词检索技术(Truncation search) (3)短语检索 (4)临近检索 (5)加权检索技术(Weigh search) 2.搜索引擎主要分几类,例举各代表性的搜索引擎。 答:(一)按检索方式、方法可划分为:目录型搜索引擎、索引型搜索引擎 (1)目录型搜索引擎有代表性的目录型搜索引擎有:Yahoo! 、Galaxy、Look Smart、中文雅虎、新浪、搜狐、网易等。 (2)索引型搜索引擎有代表性的索引型搜索引擎:中英文Google、Hotbot、AltaVista、Ask Jeeves、百度、天网等。 (二)按搜索功能可划分为:独立型搜索引擎、元搜索引擎 (1)独立型搜索引擎大多数网络检索工具都是独立型的。 (2)元搜索引擎常用的元搜索引擎有:Dogpile、Metacrawler、Vivisimo、万纬搜索、搜乐搜索等。 (三)按检索内容、主题可划分为:综合型搜索引擎和专业型搜索引擎 (1)综合型搜索引擎常用的Yahoo!、百度、Google等。 (2)专用型搜索引擎如医学领域、化学领域、专利信息查询等专门性的网络检索工具。 3.什么是开放存取? 答:含义:对某文献的开放存取是指它在 Internet公共领域里可以被免费获取,并允许任何用户阅读、下载、复制、传递、打印、搜索、超链接,也允许用户为之建立索引,用作软件的输入数据或其他任何合法用途。用户在使用该文献时不受财力、法律或技术的限制,而只需在存取时保持文献的完整性,对其复制和传递的惟一限制,或者说版权的惟一作用应是使作者有权控制其作品的完整性以及作品被正确接受和引用。 4.网络参考信息有哪些类型? 答:(1)百科知识检索网站

网络信息检索及其检索工具

摘要 进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。 网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。 关键字:网络信息检索;检索工具;因特网;web资源检索

目录 摘要 .......................................................................................................................................... I 1 信息检索的定义. (1) 2网络信息检索简介 (1) 2.1网络信息检索定义 (1) 2.2 网络信息检索的原理 (1) 2.3网络信息检索与传统信息检索的区别 (2) 2.4网络信息检索技巧 (2) 3网络信息检索工具类型 (3) 3.1非web资源检索工具 (3) 3.2web资源检索工具 (3) 4网络信息检索工具的功能 (4) 5网络信息检索展望 (5) 5.1网络信息检索的展望 (5) 5.2网络信息检索工具展望 (5) 参考文献 (6)

浅谈网络信息检索及其检索工具 1 信息检索的定义 什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。 信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2网络信息检索简介 随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。 2.1网络信息检索定义 网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。 2.2 网络信息检索的原理 网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。 (1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询

文献信息检索第二次作业

文献信息检索与利用第二次作业 一、当你利用数据库有困难时,可以从哪些途径获得检索帮助?并以某一个数据库为例,举例说明。 答:可以再数据库帮助页面获得数据使用问题的解答。比如在读秀中,点击下方的常见问题就可以进入帮助页面,不仅有常见问题的文字解答,更有视频介绍,非常的清晰易懂。 二、查找外文全文可以利用哪几种数据库?明自己拟定一个本专业相关的英文选题,至少提炼两至三个关键字,利用wiley或ebsco数据库高级检索功能,查找这个论文选题需要的参考文献。(将检索策略、结果截图) 答:查找外文全文可以利用的数据库有:(如图)

我拟出的题目是:Research on existing problems in Chinese engineering measurement 关键字:Engineering measurement Metrology Project quota (wiley) (ebsco) 三、web of science 检索平台包含哪三大引文索引?JCR是什么? 答:Basic Search,Cited Reference Search,Advanced Search JCR是ISI每年出版《期刊引用报告》,在报告中,JCR对8000多种期刊之间的引用和被引用数据进行统计、运算,并针对每种期刊定义了影响因子等指数加以报道。一种刊物的影响因子越高,也即其刊载的文献被引用率越高,一方面说明这些文献报道的研究成果影响力大,另一方面也反映该刊物的学术水平高。因此,JCR以其大量的期刊统计数据及计算的影

响因子等指数,而成为一种期刊评价工具。图书馆可根据JCR提供的数据制定期刊引进政策;论文作者可根据期刊的影响因子排名决定投稿方向。 四、什么是CSSCI?请通过CSSCI的来源刊,了解所学专业的核心期刊。并列出至少五钟核心期刊刊名。选择一位你感兴趣的老师,检索这位老师进5年在CSSCI 的收录、被引情况,将检索结果截图。 答:CSSCI是“中文社会科学引文索引”,由南京大学中国社会科学研究评价中心开发研制而成。CSSCI遵循文献计量学规律,采取定量与定性评价相结合的方法,从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为其来源期刊。 我的专业属于管理学。我列出的期刊有:管理工程学报、经济管理、管理学报、经济管理、南开管理评论。 我选择的老师是:金融学院的卢建新副教授 五、学习完《文献信息检索与利用》课程后,你认为你的信息意识增强了吗?信息搜索能力提高了吗?何以见得?(500-1000字)

网络信息资源检索与利用第二次作业

《网络信息资源检索与利用》课程实验第2次实验报告 实验内容及基本要求: 实验项目名称:网络搜索引擎的应用 实验类型:验证 每组人数:1 实验内容及要求: 1.请分别针对网络资源目录使用的分类方法进行举例。 2.在 yahoo 的分类目录中找到一条路径指向网站论文: https://www.wendangku.net/doc/0513058633.html,/Summer98/koumoutsakos.pdf。 3.在新浪网的分类目录中找到一条路径指向学校的网站:https://www.wendangku.net/doc/0513058633.html, 4.在 sohu 的分类目录中找到一条路径指向网页:https://www.wendangku.net/doc/0513058633.html,/newbook/ 5.请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内) 6.请了解 google 和 baidu 在进行关键词检索中语法的异同,并说明这两者在针对某一主题进 行检索时检索结果的差异以及对检索意图理解准确度的差异。 实验结果: 1.请分别针对网络资源目录使用的分类方法进行举例。 (1)主题分类法 (2)学科分类法 (3)图书分类法 (4)分面组配法 2.在 yahoo 的分类目录中找到一条路径指向网站论文: https://www.wendangku.net/doc/0513058633.html,/Summer98/koumoutsakos.pdf。

3. 在新浪网的分类目录中找到一条路径指向学校的网站:https://www.wendangku.net/doc/0513058633.html, 4. 在 sohu 的分类目录中找到一条路径指向网页:https://www.wendangku.net/doc/0513058633.html,/newbook/ 5. 请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

网络信息检索与利用参考试题与答案

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借 助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。www:信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一 种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的 比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定 主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。 All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类 型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。联 合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单 位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工 作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1. 网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP(2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一

计算机网络信息检索作业2

1.检索课题 (1).所学专业或专科情况? 人力资源管理是一项极为重要的工作领域,前途十分光明。国内的许多企业对人力资源管理的定位是错误的,往往把过去的人事部门换块牌子就成了人力资源部门。其实,人事部门与人力资源管理部门最大的差别在于人力资源部门除了负责招聘、管理人事档案之外,一个重要的工作就是核算人力成本,为财务部门提供人力成本的依据,并根据自己所掌握的数据对人员进行绩效考核;此外,员工培训也是人力资源部门的一项重要工作。在人才竞争趋于全球化的今天,人力资源开发与管理的工作显得格外重要,做好人的工作已经成为赢得整个世界的前提,而对人力资源管理者的能力开发,则成为一项关乎发展整个国家伯乐人才的重要工程。人力资源管理者主要负责着企业的人力资源规划,员工招聘选拔,绩效考核,薪酬福利,培训开发,劳动关系协调等工作。判断其是否合格的标准是:懂得人力资源的专业知识,能够完成人力资源的实际管理工作,还能不断开发人力资源并且创造价值。 就业方向 企事业单位及其咨询机构人力资源管理相关岗位,从事招聘、人力资源开发、考核、薪酬管理、员工培训、办公室文秘工作。 (2).国内外排名情况、前三甲是那个院校? 辽宁大学排在第十五位 国内(前三甲排名) 1 四川大学、 2 首都经济贸易大学、 3 武汉大学 国外(前三甲排名) 哈佛大学、曼彻斯特大学、多伦多大学 (3).举出一位著名院校学者、检索一下你的同名者。 人大的彭剑锋(国人民大学劳动人事学院教授、博士生导师,华夏基石管理咨询集团董事长,中国企业联合会管理咨询业委员会副主任委员。曾任中国人民大学劳动人事学院副院长,曾获第二届中国人力资源管理大奖“十佳人物”

网络信息资源检索利用作业及答案

作业ID: 69924 1. 检索词A和B是并列关系,表示同时包含检索词A和B 的布尔逻辑检索符是()鼓励独立完成作业,严禁抄袭!! A. A. 逻辑“与” B. B. 逻辑“或” C. C. 逻辑“非” D. D. 逻辑“亦或” 正确答案:A 2. 中国历史上第一部系统地分析字形、解释字义的字书是() A. A. 《辞源》 B. B. 《尔雅》 C. C. 《说文解字》

D. D. 《汉语大字典》 正确答案:C 3. 下列哪个不属于十三经 A. A. 《周易》 B. B. 《孟子》 C. C. 《新元史》 D. D. 《尔雅》 正确答案:C 4. 查考1911~1949年间国内出版图书的总结性书目的工具书是() A. A. 《中国国家书目》 B. B. 《中国古籍善本书目》 C. C. 《民国时期总书目》 正确答案:C

5. 下列逻辑运算次序最优先的是 A. A. 逻辑“与” B. B. 逻辑“非” C. C. 放入符号“()”(半角)中 D. D. 逻辑“或” 正确答案:C 6.年鉴容纳内容的基本单元是 A. A. 栏目 B. B. 条目 C. C. 纪事 D. D. 标题 正确答案:A 7. 在年鉴标题制作的技术方法上,一般遵循-----------原则

A. A. 中心词前置 B. B. 中心词后置 C. C. 中心词倒置 正确答案:A 8. 工具书 正确答案: 工具书是一种汇集、编著或译述的材料,按特定的方法加以编排,以供解疑释难时查考之用的图书。 9. 相关度 正确答案: 所谓“相关度”,是指检索结果与输入的检索语词在内容上关联的疏密程度,由计算机根据词语主题关联分析技术自动处理完成。

文献信息检索第二次作业

杏林会计专业作业二 一、馆藏书目检索 结合自己的专业背景查询南通大学图书馆书目检索系统,说明你的检索方法、检索结果,并列举密切相关的图书两本(包括书名、索书号、馆藏地)。 检索方法:通过“普通检索”,选择文献类型中文图书,选择检索字段主题词“会计”; 检索结果:340项命中主题词会计; 图书:《成本与管理会计》索书号:F234.3-43/1029=2 主校区社会科学书库《会计学概论》索书号:F230-43/1123 主校区社会科学书库 二、电子图书检索 1、下载安装超星图书阅览器,可利用“图书馆网站-中文数字资源-超星电子图书”,或利用“图书馆网站-读者服务-软件下载”进行软件下载。 2、在超星数字图书馆中分别利用快速检索、高级检索以及分类浏览三种方式检索自己所学专业的电子图书,写出每种检索方式的步骤及检索结果,列举其中密切相关的图书一册,记录其名称、作者、出版信息等。 快速检索:检索步骤:在“图书检索”框内直接输入需要检索的“书名”、“作者”或“主题 词”,点击“检索“按钮; 检索结果:输入“会计学”,可共查到1526本图书,每页显示10条记录等。 高级检索:检索步骤:在检索项- 书名”、“作者”或“主题词”等对应的框内输入需要检索 的资料,点击“检索”按钮; 检索结果:相应输入“会计学基础”、“郭徐咸”、“出版年代从1994年到2010年”,共查到 2 本图书; 分类浏览:检索步骤:经济图书馆-经济计划与管理会计-各种会计和簿记; 检索结果:共检索到1948本图书,每页显示10条记录等 图书:名称:《会计学基础》,作者:郭徐咸,出版信息:出版日期::1994年08月第2版,主题词:会计高等学校教材 3、打开该书的全文,利用文字识别功能将其中一段信息识别为文本格式,复制粘贴到作业文件中。 〔二)会计工作的内容经历了由对经济过程的广泛计其记录到对经济过程特定方面——价值运动计算记忌舶发展。最初的会

《网络信息检索》作业二

学院轻工与食品学院专业(班级)食品科学与工程2班 姓名付诗尧学号201130360129 判断题 1. 核心期刊是指经常使用的期刊。(√) 2. 专利是受法律保护的,其中发明专利的保护期限是10年。(╳) 3. 所有学术性中文或外文数据库都是可以免费检索获取原文的。( ╳) 4. 电子型文献将越来越受欢迎,印刷型文献慢慢就没有用武之地了。( ╳) 5. 会议文献通过会议形式的交流可以最早在同行们中迅速传播,一般比在期刊上发表的论文要早。( √) 6. 针对一定深度、研究性的信息问题,主要利用搜索引擎获取网络信息。( ╳) 7. Google和百度搜索中均不严格区分英文字母大小写。( √) 8. 高校图书馆为广大读者提供原文传递服务。( ╳) 9. 信息素养包括信息意识、信息知识、信息能力和信息道德四个方面。( √) 10. OR 或“+”运算符实现逻辑“与”组配,用来组配不同的概念的检索词。其基本作用是对检索范围加以限定,逐步缩小检索范围,提高检索结果的查准率。(╳) 11. 在Google搜索过程中,点击【手气不错】将自动进入Google 查询到的第一个网页。(√) 12. 狭义的专利文献是指专利说明书。(╳) 13. 特种文献是指记录在特殊材料上的出版物,一般单独成册。(╳) 二.选择题 1. 我国专利的种类有(A) A. 发明专利、实用新型专利和外观设计专利 B. 发明专利、实用新型专利 C. 新颖性、创造性、实用性 D. 发明专利、使用新型专利和外观设计专利 2.我国专利法中,授予专利权的发明和实用新型,必须具备(ABD) 新颖性 B. 实用性 C. 独占性 D. 创造性 3. 于欣.低温等离子体-催化协同降解甲苯[D]. 天津:天津大学,2006.89. 该文献属于以下文献源:(C) A. 期刊论文 B. 专利文献 C. 学位论文 D. 会议论文 4.查找治疗心脏病药物的生产厂家的名称、电话、地址、公司规模等信息,可以使用的数据库是:(A) A.万方数据资源系统 B.国家知识产权局数据库 C.中国知网 D.维普数据库 5. 中国国家标准的代码是(A) A G B B CB C ZG D CG 6.如果a和b为同义词,c用来限制a和b,那么正确的布尔逻辑表达式是(C)。 A.a OR b OR c B.a AND c OR b C.(a OR b) AND c D.a AND b AND c 7. 查找我国人口数字等统计资料的检索属于(B),可使用()来获取这类信息。 A.文献检索,年鉴 B.数据检索,年鉴 C.事实检索,手册

网络信息资源检索实习作业

山东师范大学 网络信息资源检索实习作业 提交作业前把作业文件名改为“姓名-院系专业班级.doc”(例如:李华-传播学院教育技术09.doc)。 作业提交要求与方法:将作业复制并粘贴至ftp://210.44.1.35/作业提交目录下。 实习考查题一信息检索基础知识 (一)《中国图书馆分类法》(提示:本题可以通过百度输入检索词:中国图书馆分类法,找到网络版的《中国图书馆分类法》,网上有很多,如: https://www.wendangku.net/doc/0513058633.html,/,进行查询。) 1.根据《中国图书馆分类法》分类号,给出所属主题类目。(选做2题)

2.根据下列主题类目,给出《中国图书馆分类法》分类号。(选做2题) 实习考查题二电子图书的检索 拟检索的课题:与“信息检索”有关的图书 (二)电子图书 1.读秀检索 检索与自己专业相关的图书/期刊/学位论文/会议论文(中外文均可),并分别列出任意2篇。 图书: 期刊:

学位论文: 会议论文: 实习考查题三电子期刊的检索 (一)利用中国知网或万方或重庆维普期刊全文数据库 1.检索2007年以来山东师范大学的老师发表的论文,并列出2篇: 2. 通过“期刊导航”,查找你所学专业的核心期刊有:、等。 (二)使用本馆购买的外文电子资源检索与自己专业相关的文献资源,给出2条密切相关的检索步骤 你的专业方向:(_________________)选择使用的外文数据库: (________________) 检索结果: 1)文献类型(选填图书、期刊论文、学位论文、会议论文)________,文献题名:______________ 2)文献类型(选填图书、期刊论文、学位论文、会议论文)________,文献题名:______________

信息检索第二次大作业(西南交大,高凡图书馆长)

第二次大作业 一、使用《中图分类法》中查找你所在专业的分类号,并使用图书馆的书目查询系统查找该分类下的一本图书,写出该书的书名、作者、出版社、出版年、索书号、馆藏复本数、馆藏地等信息。 《中图法》的标记符号采用汉语拼音字母与阿拉伯数字相结合的混合号码。即用一个字母表示一个大类,以字母的顺序反映大类的序列。字母后用数字表示大类以下类目的划分。数字的编号使用小数制。现将五个基本部类及下设的二十二个大类列表如下:

我所在的机械设计专业按中图分类法是:TH机械、仪表工业 ANSYS 10.0机械设计高级应用实例 王庆五;左昉;胡仁喜 北京:机械工业出版社,2006.1 书目号:484948 索书号:TH122 Z452-2 馆藏副本数:7 馆藏地犀浦馆基本藏书阅览室(501室),九里馆中文书库(202室),犀浦馆中文图书借阅室(301室) 二、用超星数字图书馆检索并打开与你所学专业相关的图书,并分别以图像和 文本两种形式采集该书的一段文字。

第一章推土机 第一节概述 一、用途 推土机是一种在履带式拖拉机或轮胎式牵引车的前面安装推土装置及操纵机构的自行式施工机械,主要用来开挖路堑、构筑路堤、回填基坑、铲除障碍、清除积雪、平整场地等,也可完成短距离松散物料的铲运和堆积作业。推土机配备松土器,可翻松级以上硬土、软石或凿裂层岩,以便铲运机和推土机进、行铲掘作业,也可利用推土机的铲刀直接顶推铲运机以增加铲运机的铲土能力(即所谓推土机助铲),还可协助平地机或铲运机完成施工作业,以提高这些机械的作业效率。推土机用途十分广泛,是铲土运输机械中最常用的作业机械之一,在土方施工中占有重要地位。但由于铲刀没有翼板,容量有限,在运土过程中会造成两侧的泄漏,故运距不宜太长,大型推土机的运否则会降低生产效率。通常中小型推土机的运距为距一般不应超,推土机过的经济运距为 三、使用CNKI期刊导航,查找你所在专业的2种核心期刊,写出刊名、主办 单位、ISSN号和CN号。

【9A文】文献检索课后作业

第二次上机课“每课一练” (每个学生必须要做的) 注: 1.进入图书馆主页“信息检索与利用课程”(https://www.wendangku.net/doc/0513058633.html,/RRjsk/fzkt1.asp)观看理工信息检索与利用第二次的教学课件与视频,请大家重点观看第二单元中的3,4,5,6四个课件与视频,并完成以下作业。 2.11月21日之前做好,修改文件名发给小组长,文件名格式:学号+班级+姓名。 3.小组长打包发到老师QQ邮箱。打包文件注明:专业班级+小组名称,如机械1301-第1组。 1WebofScience数据库(观看“4.WebofScience的检索与利用”教学课件完成该部分作业) (1)WebofScience包括SCI、SSCI和CPCI等子库,这三个子库的英文全称及中文名称是什么? SCI:科学引文索引(ScienceCitationIndeR) SSCI:社会科学引文索引(SocialSciencesCitationIndeR)CPCI:数据库分为两个子库:ConferenceProceedingsCitationIndeR –Science,简称CPCI-S ConferenceProceedingsCitationIndeR– SocialSciences&Humanities,简称CPCI-SSH (2)什么是施引文献?引文检索语言的作用是什么? 施引文献:是指引用或参考文献的文献 作用: ①可以用一篇文章、一个专利号、一篇会议文献或者一本书作为 检索词,检索这些文献被引用的情况,了解引用这些文献的论文所做的研究工作。 ②可以回溯某一研究文献的起源与历史或者追踪其最新的进展,既 可以越查越广,也可以越查越新,越查越深入。

网 络 资 源 与 信 息 检 索 课作业

网络资源与信息检索课 综合实习报告 一、报告概况 1.课题名称: “传感器应用” 2.检索人员: 3. 反映课题内容的关键词以及相似词、同义词关键词(3-5个中英文): 关键词: 传感器应用 相似词:传感器法氧传感器硅传感器点传感器软传感器 主传感器热传感器双传感器微传感器力传感器 4. 中图法类号、类目: T工业技术 5.简要分析课题的主题内容: 传感器是一种物理装置或生物器官,能够探测、感受外界的信号、物理条件(如光、热、湿度)或化学组成(如烟雾),并将探知的信息传递给其他装置或器官。 二、课题检索报告 (一)利用百度查找与课题相关的信息

1、检索表达式:关键词=传感器应用 2、记录相关结果2条(包括网页标题、网页URL、主要内容): 结果1: 网页标题:百度百科 网页URL:https://www.wendangku.net/doc/0513058633.html,/view/2601562.htm 本书是以面向中职教育为准则,以职业岗位对人才的需求为出发点编写的。全书共10章,内容包括传感器基本知识、温度传感器、气敏和湿敏传感器的应用、力敏传感器、液位和流量传感器、位置及位移传感器、新型传感器、传感器接口技术、常用检测仪表、传感器综合应用等。本书在编写中力求简化传感器原理,突出传感器的应用,强调通俗易懂,着眼于学生在应用能力方面的培养。本书可作为中等职业学校机电技术、仪器仪表、自动控制、电子技术等专业的教材,也可供从事检测、控制技术等相关专业的工程技术人员参考。 结果2: 网页标题:https://www.wendangku.net/doc/0513058633.html,豆丁网 网页URL: https://www.wendangku.net/doc/0513058633.html,/p-189308288.html 主要内容:

网络信息检索期末考试试卷及答案

绵阳师范学院历史文化与旅游管理学院 第一部分(基础知识部分,共三大题,共60) 一、填空题(每空1分,共30分) 1 ?信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2. 知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3. 情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4. 文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5 ?会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6 ?学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8 ?数据检索是指特定的数值型数据为对象的检索。 9. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。 10. Internet 是基于TCP/IP协议的网络。 11. 二级域名https://www.wendangku.net/doc/0513058633.html,是指教育机构。 12. 目前WW环境中使用较多的网页浏览器有Microsoft公司的IE浏览器和360公司的360安全浏览器。 13. 每种网络信息检索工具一般由信息米集子系统、数据库和检索代理软件三部分组成。 14. 大多数搜索引擎允许用户使用布尔逻辑运算符,以及与之对应的: “ +”表示限定搜索结果中必须包含的词汇,“-”表示限定搜索结果中 不能包含的词汇。 15. 一些搜索引擎提供了按链接和网域等进行搜索范围的限制,比如, 用site表示搜索结果局限于某个网站。比如,用in title 表示到某个URL地址指定的网页标题内进行检索。比如,用UnJ表示到某个URL地址指定的地址内进行检索。 16. 搜索引擎中,在普通查询词前面加一个filetype 表示对文档类型限定。或例如:访问百度文档的地址也可以达到此效果,它的网址是: https://www.wendangku.net/doc/0513058633.html,/ 17. CNKI数据库下载的全文格式很多,如:caj,pdf,nh,caa,kdh 需要下载安装CAJViewer全文浏览器软件或亚全文浏览器软件才能阅读这些资源。 18 .维普资讯网的高级检索中,查询语句“ K= (CAD+CAM*R=a械”表示的意思是查找文献或文摘中含有“机械”,并且关键词中含有CAD或CAM勺文献或文摘 19. OPAC中文或者英文的解释是联机图书馆公共检索目录 20. 国内提供电子图书服务的网络站点很多,常用的有书生之家数字图书馆、方正Apabi数字图书馆、中国数字图书馆等。 二「单项选择题(每题1分,共20 分) 1. 下面哪项不是情报构成的三 要素之一( D ) B .经过传递 D.通过购买获取 B?最主要的信息资源 D.按知识门类或专题组织、浓缩而 A ) o A. 期刊文献 B.科技报告 C?专利文献 D.学位论文 4. 报纸区别于其它文献的特征是( B )o A. 创新性 B.及时性 C.学术性 D.全面性 5. 有法律约束力和一定的时效性,经权威机构批准的规章性文献是 (A )o A.标准文献 B.学位论文 C?档案文献 D.科技报告 6. 一般存在相应二次文献的是( A ) A.期刊 B.产品样本 A.本质是知识 C?经过用户使用产生效益 2. —次文献是(A )0 A.最原始的信息资源 C.对文献的集中提炼和有序化 成 3. 下面哪一项是白色文献(

网络信息检索试题及答案

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C)特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是(A)。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面(B)是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的(D)信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 含义:信息是反映一切事物属性及动态的消息、情报、指令数据和信号中所包含的内容。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?(A) A.文摘 B.会议文献 C.辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于(A)。 A.零次文献 B.一次文献 C.二次文献 D.三次文献 9、下列选项中哪一项属于“国内统一刊号”(C)。 A.ISBN7-04-014623-1 B.ISSN0254-4164 https://www.wendangku.net/doc/0513058633.html,11-2127/TP D.0254-4164/TP 10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C)参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19)[2002-04-15].http:∥www.….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B)参考文献的著录条目描述。 昂温G,昂温P S.外国出版史[M].陈生铮,译.北京:中国书籍出版社,2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》

网络信息检索的工具

致力于打造高品质文档 网络信息检索的工具 [摘要] 搜索引擎是人们使用Internet信息资源的重要工具。本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。[关键词] 信息检索中文搜索引擎存在的问题发展方向 随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。一、搜索引擎的概念和及类型 搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。 目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。 1.目录式搜索引擎。目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。国内著名的新浪、搜狐、中文雅虎都属于这种类型。 2.机器人搜索引擎。这是一种目前运用较广泛的搜索引擎。国内以百度,google、天网为代表。它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。 机器人搜索引擎具有庞大的全文索引数据库。其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。 3.元搜索引擎。元搜索引擎是一种调用其他搜索引擎的引擎。它是通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索。中文元搜索引擎开发较少,较成熟的则更少,万纬搜索是目前有一定影响的中文元搜索引擎。 二、现阶段中文搜索引擎存在的主要问题 1.信息覆盖面有限。现阶段搜索引擎所覆盖的数据库的规模是非常有限的,据美国科学期刊Natures一篇报告中称,全球最大的搜索引擎也只能覆盖现有网页的16%。中文搜索引擎因起步慢、中文信息所占互联网全部信息的比例小(只占全部网络信息的5%)等原因在这方面尤为突出。 2.查全率不高。查全率是指检索出的相关信息量与存储在检索系统中的全部相关信息量的百分比,是判断检索系统质量的度量之一。

信息检索作业

一、信息检索方向的经典图书、教材和精品课程网站 1.经典图书 1)贝泽-耶茨(Ricardo Baeza-Yates)、里贝罗-内特(Berthier Ribeiro-Neto). 现代信 息检索.机械工业出版社,2011 2)曼宁(Christopher D .Manning)、拉哈万(Prabhakar Raghavan)、舒策(Hinrich Schutze). 信息检索导论. Cambridge University Press, 2010 3)Ricardo. 现代信息检索. 机械工业出版社,2006 4)王立清. 信息检索教程.中国人民大学出版社,2008 5)W.Bruce Croft、Donald Metzler、Trevor Strohman、刘挺. 搜索引擎:信息检索 实践.机械工业出版社,2010 6)陈雅芝. 信息检索(计算机应用).清华大学出版社,2006 7)格罗斯曼(David A.Grossman)、弗里德(Ophir Frieder)、张华平、李恒训. 信息 检索:算法与启发式方法(第2版).人民邮电出版社,2010 8)黄如花. 信息检索.武汉大学出版社,2010 9)布切尔(Stefan Buttcher)、Charles L.A.Calrke、Gordon V.Cormack、陈健. 信 息检索:实现和评价搜索引擎.机械工业出版社,2012 10)沈固朝、储荷婷、华薇娜. 信息检索(多媒体)教程.高等教育出版社,2009 11)刘挺、秦兵、张宇.信息检索系统导论.机械工业出版社,2008 12)夏立新、金燕、方志、邱均平.信息检索原理与技术.科学出版社,2009 13)卢小宾、李景峰、卢小宾. 信息检索.科学出版社,2002 14)谢德体、陈蔚杰. 信息检索与分析利用.科学出版社,2010 15)杨克虎. 生物医学信息检索与利用.人民卫生出版社,2009 16)王细荣、韩玲、张勤. 文献信息检索与论文写作.上海交通大学出版社,2009 17)蒋永新. 人文社会科学信息检索教程.上海大学出版社,2007 18)李志义. Web信息检索系统的设计及应用.清华大学出版社,2011 2.精品课程网站 1)南京大学 信息检索:https://www.wendangku.net/doc/0513058633.html,/jingpin2004/xxjs/ 2)云南大学 信息检索:https://www.wendangku.net/doc/0513058633.html,/index.html 3)中南大学 信息检索:https://www.wendangku.net/doc/0513058633.html,/jpkc2006/xiaoji2006/XXJS/Teach_Content/ 4)中南大学 文献信息检索:https://www.wendangku.net/doc/0513058633.html,/JPKC2008/Hunan/xixijiansuo/zzcl03.html 5)山东理工大学 信息检索与利用:https://www.wendangku.net/doc/0513058633.html,/wxjs/kcgs/about.htm 6)济宁医学院 医学信息检索:https://www.wendangku.net/doc/0513058633.html,/jpkc/yxxx/jxdg/jxdg-xl.htm 7)西南交通大学 信息检索:https://www.wendangku.net/doc/0513058633.html,/C42/kcms-5.htm 8)华北煤炭医学院

网络信息检索第三次作业

一元搜索 元搜索引擎又称多搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。(搜索引擎分类:全文搜索引擎、目录索引、元搜索引擎) 元搜索引擎的另外一个定义:元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(The mother of searce engines)”。在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为“源搜索引擎”(source Engine),或“搜索资源”(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(Meta-searching technique),元搜索技术是元搜索引擎的核心。 一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。 主要元搜索引擎列表 国内: ·搜魅网(someta)集合了百度、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。·比比猫(Bbmao)独创国际领先的聚类和去重技术。搜索结果汇集各大搜索引擎结果,搜索结果智能分类整理,去掉重复搜索结果,并拥有直接搜寻文档和强大网络收藏夹等多元功能。对于记者、教授、高管等知性、高端且惜时如金的人群比较适用,支持中英文搜索。·全博元搜索(QOOPOO)聚合搜索的力量,已经运行多年,2006年格林斯潘曾接触这家公司,后劲比较强劲。·Xooda元搜索引擎支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新的优化排序。·佐意综合搜索(Chinazss)集主流搜索引擎为一体,分类详细,强大的搜索功能。让搜索变得更方便! 国外: Vivisimo:是美国Vivisimo公司最新开发的一个具有对搜索结果自动进行分类功能的搜索引擎!它能非常快速地将不同类型的网站进行分类整理并将结果呈现在你眼前!它在搜索结果页面左侧增加了一个搜索结果目录栏。不足之处在于搜索结果精准度不是很高。ProFusionProFusion:是并行式元搜索引擎,拥有智能化的搜索技术、对查询的实用提示和非常宝贵的个人化搜索服务,它是目前很优秀的元搜索引擎,可同时调用9个独立万维网搜索引擎—AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、Webcrawler和Yahoo。MetaCrawlerMetaCrawler:是独立万维网搜索引擎WebCrawler的姐妹引擎,也是一个并行式元搜索引擎,它条理清晰,组织结构完美,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立引擎,是简单搜索或中度复杂搜索的最佳网点。DogpileDogPile:是目前性能较好的并行式元搜索引擎之一,它可以同时调用Web 搜索引擎、Usenet搜索引擎和FTP搜索引擎等25个搜索引擎,其中,Web搜索引擎14个。DigisearchDigisearch:是目前能同时调用独立搜索引擎较多的并行式元搜索引擎,它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo、OpenText和Magellen 等18个独立万维网搜索引擎,DejaNews等3个Usenet搜索引擎和Fourll等3个个人信息和商界信息搜索引擎。Highway61Highway61:是并行式元搜索引擎,可以同时调用

相关文档