文档库 最新最全的文档下载
当前位置:文档库 › 03-1网检-门户网站搜索引擎.ppt.Convertor

03-1网检-门户网站搜索引擎.ppt.Convertor

03-1网检-门户网站搜索引擎.ppt.Convertor
03-1网检-门户网站搜索引擎.ppt.Convertor

第二部分门户网站和搜索引擎

一、中国三大门户网站

二、门户搜索引擎

三、搜索引擎检索实例

内容提交

一、中国三大门户网站

- 在因特网上有着数以万计的网站,而且你自己也可以免费在网上设立一个。但我们在因特网上漫游,总要有个出发点,这个出发点就是浏览一些比较大的、服务功能完善的,所谓“门户网站”。

- 我们常用的中国三大门户网站是:新浪、搜狐和网易。之所以他们被称为中国最大的三大门户网站,除了信息丰富、服务周到以外,就是因为他们都有很好的搜索引擎。

*1998年2月25日,中国首家大型分类查询搜索引擎横空出世,搜狐品牌由此诞生

*1999年2月2日新浪网推出新一代中文搜索引擎"新浪搜索"(SinaSearch)测试版

*2000年9月,网易正式推出了全中文搜索引擎服务。

- 搜索引擎(Search Engines)是一个对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。

什么是搜索引擎

- 包括如下三个过程:

1.在互联中发现、搜集网页信息

2. 对信息进行提取和组织整理,建立索引库

3. 接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。

搜索引擎的工作过程

1.在互联中发现、搜集网页信息;

搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页链到其他网页中的超链接,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接,机器人便可以遍历绝大部分网页。

2. 对信息进行提取和组织整理,建立索引库;

搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。

3. 接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。

搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,进行文档与查询关键字的相关度评价,在极短时间内找到用户需要的资料,对将要输出的结果进行排序,并返回给用户。

目前,搜索引擎返回主要是以网页链接的形式提供的,通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮

助用户判断此网页是否含有自己需要的内容。

- 搜索引擎按其工作的方式分为两类:

·一类是分类目录型的检索,把因特网中的资源收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类,人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。

分类目录下收录的网站都是经过编辑审核后确认的,所以一般只收录某个网站的主页,不会将网站中的所有页面都收录进来。

·另一类是基于关键词的检索,这种方式用户可以用逻辑组合方式输入各种关键词(Keyword),搜索引擎计算机根据这些关键词寻找用户所需资源的地址,然后根据一定的规则反馈给用户包含此关键字词信息的所有网址和指向这些网址的链接。

搜索引擎是通过spider程序自动在互联网上运行,持续对网络上浩瀚的内容进行逐页扫描,将所有相关的信息自动存储下来。一般情况下,在搜索引擎中搜索时,所得到的结果是基于与该关键词的相关性,也就是按照所搜索的关键词在页面中出现的频率和位置来排序。在网站搜索中,搜索结果网站的排序与网站名称、描述、网址以及网站所在的类目有关。

·搜狐公司成立于1996年8月,是由公司创办人张朝阳博士在美国依靠风险投资的支持创办的。2000年,搜狐公司在美国纳斯达克挂牌上市(NASDAQ:SOHU),从一个国内知名企业发展成为一个国际品牌。2000年9月14日搜狐收购国内最大的年轻人社区网站ChinaRen, 建立中国最大的门户网站。

二、搜狐网站及其搜索引擎

·“搜狐”由北京爱特信(ITC)公司于1998年2月推出,是根据中国人的文化传统专门为中国用户设计的简体中文版网络分类查找工具。“搜狐”目前已连接了5万个中文网页,全部采用人工精选分类,根据网页内容将所有的网页分为地区、工商经济、教育、科学与技术、社会与文化、新闻与媒体等18大类,各大类下又分成许多小类。同时,“搜狐”也提供了简单的关键词检索功能。

搜狗是搜狐公司于2004年8月3日推出的完全自主技术开发的全球首个第三代互动式中文搜索引擎,是一个具有独立域名的专业搜索网站--“搜狗”(https://www.wendangku.net/doc/248261422.html,)。以一种人工智能的新算法,分析和理解用户可能的查询意图,给予多个主题的“搜索提示”,在用户查询和搜索引擎返回结果的人机交互过程中,引导用户更快速准确定位自己所关注的内容,帮助用户快速找到相关搜索结果,并可在用户搜索冲浪时,给与用户未曾意识到的主题提示。·SOHU搜索引擎的特点:

搜狐的目录导航式搜索引擎完全是由人工加工而成,相比机器人加工的搜索引擎来讲具有很高的精确性、系统性和科学性。分类专家层层细分类目,组织成庞大的树状类目体系。利用目录导航系统可以很方便的查找到一类相关信息。

·用SOHU搜索引擎可以查找什么?

SOHU的搜索引擎可以查找网站、网页、网址、新闻、软件、音乐等信息。网站和网页这两类信息的区别就象是一本书和书中的每一篇文章一样。

·如何使用搜狐中文检索系统

如果你很清楚你要找的网站(或新闻)主题,你可以在检索框内键入关键字(Keyword),并单击旁边的搜索按纽,搜狐中文检索引擎会返回多个方面的检索结果。你可以在以下不同分类中任意切换,得到你需要的检索结果。

1. 如果你从搜狐目录中检索:检索结果页列出相关的搜狐中文检索类目。

2.如果你从新闻搜索中检索:检索结果页列出三个月内出现在搜狐新闻库中,包含你输入的关键字的相关新闻。

3. 如果你从搜狐网站中检索:检索结果页列出网站名称或网站简介或网站关键字中含有与你键入的关键字相匹配的内容的相关网站。

4.如果你从网页搜索中检索:除了相关检索的一些链接之外,检索结果页列出整个Internet上与你键入的关键字相匹配的内容的所有相关网页。

*请注意,如未特别指定,系统默认你从网页搜索中进行检索。

搜狐中文检索的默认检索方式是精确查询方式,查询包含完全符合关键字串的网站。例如:键入“中国北京”,会找出包含“中国北京”的网站、但是会忽略包含“中国首都北京"的网站。

Sample:

木管乐器都是木材制作的吗?

在关键词对话框中输入“木管乐器”检索词,搜索引擎即会列出检索结果,从中可以浏览挑选最合适的结果:

木管乐器大多数由坚实耐用的木材制作(新式木管乐器也有用金属材料和有机材料,甚至用上玻璃的,比如长笛)。

·SOHU的搜索引擎使用说明

- 关键词查找,用户可以在搜索框中直接输入自己想查找信息的关键词,找到相关信息。这种方法对网站、网页、新闻、网址、软件等信息都适用。

- 网站高级检索:

1 可使用逻辑“与”的组合搜索,用空格、“+”组合。例如,计算机病毒,计算机+病毒,计算机&病毒

2 逻辑“或”的组合搜索,用“|”组合,比如计算机|电脑;

3 多条件逻辑组合,比如计算机|电脑+病毒;

4 中英文数字混检,比如mp3歌曲。

5 网页高级检索,链接到https://www.wendangku.net/doc/248261422.html,/advanced/advanced.html

·如何使用搜狐的高级检索

1. 搜狐中文检索系统目前支持的运算符有:-、&、|、()、空格。

a. 使用空格、&,来指定查询串必须出现在结果中

例如:输入“modem 鼠标”,搜索结果是包含“modem”,并且包含“鼠标”的所有网页b. 使用-,来限定-后的查询串不出现在结果中。

例如:输入“国家名称-美国”,会找到仅包含“国家名称”的所有网页,且不包含“美国”的网页。

*必须注意:用-之前,要先加上一个空格,意思就是要搜索:

“国家名称”“与”不是“美国”,即

“国家名称-美国”

的内容。

c. 使用|,来指定|两边的查询串中有一个一定出现在结果中

例如:输入计算机|软件,搜索结果是含有“计算机”或“软件”的所有网页

d.使用()或“”,来指定()或“”内的表达式是一个整体单元

例如:输入"软件硬件" ,会查询到包含“软件”与“硬件”的所有网页

2. 目录导航,用户层层点击想查找信息的类目,通过这种方法可以找到相关的一类信息。这种方法只适用于网站搜索。

·新浪网搜索引擎是面向全球华人的网上资源查询系统。提供网站、网页、新闻、软件、游戏等查询服务。网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。目前共有3

大类目录,一万多个细目和二十余万个网站,是互联网上最大规模的中文搜索引擎之一。

二、新浪网站及其搜索引擎

·查询时逻辑操作符的使用说明:

a. 表示“且”的关系(同时匹配多个关键词的内容);

使用空格、逗号(,)、加号(+)和&。

例如要查找赵薇的照片,请输入:赵薇照片。

b. 表示“非”的关系(查询某个关键词的匹配内容,但又不包含其中的一部分);

使用减号(-)搜索。

例如想查询彩票,但不包含体育彩票,则输入“彩票-体育彩票”。

c. 表示表达式是一个整体单元:

使用字符" " 。

例如想查找包含“软件”与“硬件方面的网页或新闻,输入关键词"软件硬件" 。·爱问(https://www.wendangku.net/doc/248261422.html,)是新浪用两年时间研发的新型搜索引擎。

爱问有:

·目前唯一的中文自然语言搜索技术

·第一个中文用户互动型问答平台--爱问知识人(https://www.wendangku.net/doc/248261422.html,)

·检索互联网上亿万网页的网页搜索

·信息最丰富、最准确,功能更贴近生活的本地搜索(https://www.wendangku.net/doc/248261422.html,)

·实用性、趣味性俱强的收藏工具--VIVI收藏夹(https://www.wendangku.net/doc/248261422.html,)

三、网易有道搜索引擎使用说明

1. 多个关键词之间只需用空格分开;

2. 没有空格切割的关键词相当于或者;

3. 在结果中再搜索;

4. 英文字母不区分大小写;

5. 网页查询时可以直接用网址进行查询;

6. -号可以排除无关信息,帮你搜索到更准确的内容;" "使搜索结果绝对忠实于你的检索提问;

7. 在英文关键词搜索中,一些标点符号如“_”、“\”、“+”、“=”、“,”“'”也可作为短语连接符;

三、搜索引擎检索实例

1. 金瓶梅中"好男不吃分时饭"下一句是什么?

A: 好女不作粗劳活

B: 好女不穿嫁时衣

C: 为有努力赴京场

D: 唯有把酒看天高

答案分析:很多初级用户喜欢整句的复制内容来搜索答案,比方此题. 这里可以直接按入:[好男不吃分时饭], 就可以得到答案了.

2. 以下哪项不是被列为"世界文化遗产"之一?

A: 北京故宫B:承德避暑山庄

C: 西藏布达拉宫D:九寨沟风景区

3. 有"玫瑰之邦"之称的是以下哪一个国家?

A:保加利亚B:百慕达

C:英国D:捷克

4.哪一位历史人物与友人割席绝交?

A:管宁B: 姜尚

C: 鲍叔牙D: 李斯

5. "中国铁路之父"詹天佑毕业于哪一间大学?

A: 耶鲁大学B: 北京大学

C: 剑桥大学D: 康奈尔大学

答案分析:只用[詹天佑]去让它搜索, 出来的结果前几项都不能找到我们想要的答案. 所以要根据问题, 试试键入[詹天佑毕业于], 显然, 答案可以找到了.

6. 以下哪一类动物不属于两栖动物?

A: 企鹅B: 河马

C: 斑马D: 蟾蜍

答案分析:这道题可以从两方面入手,一种是从问题入手搜索关键词[两栖动物]找到答案;另一种是从答案出发,搜索关键词[两栖动物企鹅]等一个个去验证,最后发现斑马是哺乳动物.

相关文档