文档库 最新最全的文档下载
当前位置:文档库 › 语义韵研究20年概述

语义韵研究20年概述

语义韵研究20年概述
语义韵研究20年概述

中外搜索引擎研究的现状与发展

中外搜索引擎研究的现状与发展 夏旭李健康 (第一军医大学图书馆广州510515) 摘要: 以WWW网络搜索引擎的发展历程为基础,综述了WWW网络搜索引擎的定义、检索机制、检索规则、词表应用、分类研究、比较研究等方面取得的新进展,探讨搜索引擎发展走向与思路。同时就目前中外搜索引擎普遍存在的问题进行分析,希能对国内中文搜索引擎的开发和准确、快速、全面检索WWW网络乃至因特网信息资源有所启示。 关键词:搜索引擎研究进展综述信息资源管理 由于因特网上信息资源内容广泛、时效性强、访问快速、网络交互搜寻、动态更新,而且还提供快速访问网上信息资源的各种搜索引擎(Search Engines),用于快速搜索WWW网络乃至因特上的有用信息,使得通过WWW网络获取网络信息资源成为国内外研究的一大热点。基于网络的搜索引擎的研制与开发应用成为当前网络信息资源开发应用研究领域的热点。英文搜索引擎“GOOGLE”和中文搜索引擎“百度搜索”的推出,拉开了搜索引擎核心技术争夺战的序幕。可以预言,在今后一段相当长的时间里,搜索引擎还将有长足的发展和进步,检索功能将更趋向于集成化和更具亲和力、更显人性化。 1 搜索引擎的定义、检索机制、检索规则和词表应用 1.1 定义 搜索引擎,Search engines,又称搜索机,Web搜索器,是伴随WWW网络出现的检索网上信息资源的新工具。实质上是一种网页网址检索系统,有的提供分类和关键词检索途径,有的仅提供关键词检索途径。它根据检索规则和从其他信息服务器上得到数据并对数据进行加工处理,自动建立索引,并通过检索接口为用户提供信息查询服务,能够自动对WWW资源建立索引或进行主题分类,并通过查询语法为用户返回匹配资源的系统。搜索引擎主要是由Crawler、Spider、Worm、Robot等计算机软件程序自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万甚至上亿条记录的数据库。它是通过采集标引众多网络站点来提供全局性网络资源控制与检索机制、将全球WWW网络中所有信息资源作一完整的集合、整理和分类、方便用户查找所需信息的网络检索软件。具有检索面广、信息量大、信息更新速度快,特定主题的检索专指性强等特点。 1.1.1 常规搜索引擎和元搜索引擎 自带索引数据库的搜索引擎通常被称为常规搜索引擎或独立搜索引擎,相应地,集多种常规搜索引擎于一体的搜索引擎则称为(多)元搜索引擎。元搜索引擎是国外搜索引擎开发者新设计的一种集成型搜索引擎,与独立搜索引擎的区别在于:它是通过一个统一的用户界面帮助用户在多个独立搜索引擎中选择和利用合适的搜索引擎,甚至是同时利用多个搜索引擎来实现检索操作。元搜索引擎没有自己独立的数据库,却更多地提供统一界面,形成一个由多个搜索引擎构成的具有独立功能的虚拟逻辑体,通过元搜索引擎的功能实现对这个虚拟逻辑体中各搜索引擎数据库的查询等一切操作。由于元搜索引擎预先配置好多个搜索引擎,每条检索指令都自动通过预先配置的搜索引擎执行,免去了用户逐一记忆和单独使用每个搜索引擎的麻烦。主要的元搜索引擎有ALL-IN-ONE、CUSI、Fun City Web Search、HyperNews、Linksearch、Savvysearch、Metacrawler、Best Search、W3Search Engines、WebSearch、Profusion、Mamma、Avenuesearch、Dogpile、Kwikseek、Findspot、Bytesearch、Webferret、Bluesquirrel Webseeker等。Metacrawler (http://www. https://www.wendangku.net/doc/4b17139779.html,)能同时调用6个搜索引擎;Savvysearch (http://www. https://www.wendangku.net/doc/4b17139779.html,)可有选择地调用21个独立的搜索引擎,检索Web、Usenet 新闻组、软件、参考工具、技术报告等信息,每次最多并行检索5个搜索引擎的数据库。Profusion (http://www. https://www.wendangku.net/doc/4b17139779.html,)最多同时调用9个独立的搜索引擎,调用方式有全部调用、系统自动选择最好的3个、系统自动选择最快的3个、用户从中选取任意个搜索引擎。最新出现的桌面型离线式搜索引擎如Webcompass、WebSeeker、WebFerret、Echosearch、Copernic98等也是元搜索引擎。 1.1.2 集中式搜索引擎和分布式搜索引擎

基于语料库的语义韵研究在大学英语词汇教学中应用

2012年第·2期 太原城市职业技术学院学报Journal of TaiYuan Urban Vocational college 期 总第 127期 Fe b2012 [摘要]论文试图将语义韵研究应用于大学英语课堂教学,并通过实验来验证其能否提高学生的词汇搭 配能力并激发学生的学习热情。实验结果显示,语义韵在大学英语词汇教学中的应用对于学生的词汇学习具有积极作用,能提高学生的词汇搭配能力,提高语言输出的质量,并能激发学生的学习热情。 [关键词]语义韵;在线BNC 语料库;词汇教学[中图分类号]G642 [文献标识码]A [文章编号]1673-0046(2012)2-0136-03 附表:2005年至2010年高考江苏卷完形填空题考点效度统计 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 基于语料库的语义韵研究在大学英语词汇教学中应用 张瑞芳 (山西师范大学临汾学院,山西临汾041000) 教育部于2007年7月27日公布《大学英语课程教学要求》,在教学模式方面提出如下要求:“各高等学校应充分利用现代信息技术,采用基于计算机和课堂的英语教学模式,改进以教师讲授为主的单一教学模式。新的教学模式应以现代信息技术,特别是网络技术为支撑,使英语的教与学可以在一定程度上不受时间和地点的限制,朝着个性化和自主学习的方向发展。”因此,基于在线BNC 语料库的语义韵研究在大学英语词汇教学中的应用正是积极响应了这一教学要求而进行的。 一、语义韵理论简介 语义韵理论是近十年来才引入国内的一种基于语料库研究的语言机制。语义韵是指词汇习惯性地吸引某一类具有相同或相似语义特点的搭配词,其语义互相感染、相互渗透,在特定语境内形成一种特定语义氛围的语言现象。对于本族人来说,语义韵信息是隐性的,不是 刻意学习获得的,但对于非本族人的英语学习者来说,由于缺乏语言环境,这种信息只能通过学习获得。利用语料库学习词汇,学习者可以了解词汇不易察觉的语义韵特点。 S tubbs 将语义韵分为三类:积极语义韵(po sitive pro so dy)、中性语义韵(neutral prosody)和消极语义韵(ne g ative pros ody)。在消极语义韵里,关键词所吸引的词 汇几乎都带有强烈的或鲜明的消极语义特征,它们使整个语境呈现出一种强烈的、负面的、消极的语义氛围。积极语义韵的情况正好相反,所研究的词项吸引的几乎都是些具有积极语义特点的词项,由此形成一种积极语义氛围;在中性语义韵里,搭配词语的语义特点既不消极,也不积极。也可以说,既有一些消极涵义的词项,也有一些积极涵义的词项,呈现出一种错综语义特点。绝大多数英语词的搭配行为呈现中性语义韵,而一些词项具有 136--

语义韵与语义偏好的关系及对外语教学的启示

第29卷第4期韩山师范学院学报Vo.l 29No .42008年8月Journa l of Hanshan N or m alU niversity Aug 2008 收稿日期:2007-09-27 作者简介:樊斌(1979-),女,湖北黄冈人,集美大学外国语学院教师,硕士。 语义韵与语义偏好的关系及对外语教学的启示 樊 斌,韩存新 (集美大学外国语学院,福建厦门 361021) 摘要:语义韵和语义偏好是词语搭配研究中一组相关但不相同的概念。目前在国内专门介绍二者及 其关系的相关文献还比较少。该文综合国内外研究,简要介绍了二者的理论背景、关系以及对外语教学的 启示。 关键词:语义韵;语义偏好;关系;启示 中图分类号:H 319.3 文献标识码:A 文章编号:1007 6883(2008)04 0078 04 一、引 言 语义韵(se m antic prosody)是当代语料库语言学的重要研究对象之一。语义韵研究在国外早已形成规模,而在中国才刚刚起步。由于它是一个新兴的课题,在国内自然也受到了不少研究者的关注。国内学者分别对语义韵理论的来源、理论框架、研究方法及意义都作了比较好的阐述,然而对于词语搭配行为当中的另一重要现象 语义偏好(se m anti c preference),人们似乎重视不够。语义韵与语义偏好是一组密切相关但又不相同的概念。目前在国内专门介绍二者及其关系的相关文献还比较少。本文综合国内外研究,简要介绍了二者的理论背景、关系以及对外语教学的启示。 二、什么是语义韵 语义韵这个概念主要是由后弗思(Firth)时代的三位语料库语言学学者Sinclair 、Louw 和S t u bbs 所阐释的。 [1](P131) 语义韵(se m antic proso dy),即关键词项的典型搭配词在语境中营造起 的语义氛围。[2](P300) 目前,国内广泛接受并使用的语义韵分类方法其实是由Stubbs 提出的。他认为语义韵大致可分为积极(positi v e )、中性(neu tra l)和消极(negative)三类。[3](P176) 在消极语义韵里,关键词吸引的词项几乎都具有强烈或鲜明的消极语义特点,它们使整个语境弥漫着一种浓厚的消极语义氛围。积极的语义韵的情况正好相反:关键词吸引的几乎都是具有积极语义特点的词项,形成了一种积极语义氛围。在中性语义韵里,关键词既吸引一些消极涵义的词项,也吸引一些积极涵义或中性涵义的词项,形成了一种错综的语义氛围。因此,中性语义韵又可称 错综(m i x ed)语义韵。[4](P165) 语义韵并非英语所独有,而是所有语言所共有的一种现象。例如:英语词汇中的一些词,如:co mm i,t cause ,set i n 等,具有消极的语义韵特征,而在汉语词汇当中 的一些词,如: 充斥!、 陷入!、 摆脱!、 推波助澜!等,也都具有消极的语义韵特征。 语义韵并非是一成不变的。由于语言是不断变化发展的,语义韵是这一发展过程中的产物,也会继续发展演化。一些旧的语义韵正在改变,

信息检索文献综述

信息检索文献综述 前言:关于信息检索技术的文献综述,一、信息检索技术现状,信息检索技术综述,信息检索技术实现了把信息检索从基于关键词层面提高到知识层面,从传统的基于关键词的检索到吸引广大研究者眼球的语义检索,传统的基于关键词信息检索,语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术,它从语义理解的角度分析信息对象和检索者的检索请求,提高了检索性能,语义检索技术将有一个长期深入研究的过程。 关于信息检索技术的文献综述 一、信息检索技术现状 【1】梁鸿雁,信息检索技术综述,2010(9),软件导刊,35~37,在 现有研究的基础上,信息检索技术实现了把信息检索从基于关键词层面提高到知识层面。从传统的基于关键词的检索到吸引广大研究者眼球的语义检索。实现了把信息检索从基于关键词层面提高到知识层面。传统的基于关键词信息检索,已取得了很大的成功,但是它不能从根本上表达用户的查询请求。语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术,它从语义理解的角度分析信息对象和检索者的检索请求,提高了检索性能。但由于自然语言理解和人工智能等领域的局限,语义检索技术将有一个长期深入研究的过程。 二、信息检索技术类型及方法

【1】赵阳,浅谈信息检索技术,2012年11月,科技创新与应用,45,介绍了当今比较热门的两种信息检索技术:第一,智能检索或知识检索传统的全文检索技术基于关键词匹配进行检索,智能检索利用分词词典、同义词典,同音词典等改善检索效果,还可在知识层面或者概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。第二,知识挖掘,目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息、提取知识,以满足信息检索的高层次需要。 【2】孙广维,多媒体信息检索技术的研究,2012,6 ,吉林建筑工程学院学报,79~81,作者提出传统的多媒体检索方法处理比较简单,有的仅通过多媒体的外部属性和简单的文字描述进行检索,还脱离不了文本、数值和关键词的检索范畴,对图像、音频、视频信息则只有浏览或查看功能,缺乏多媒体本质特征的描述,在多媒体数据库中集成了图像、视频、音频等非文本信息,这样我们就可以用图像、音频、视频信息方便的进行检索。 【3】双林平,分布式信息检索技术探析,2012(4),图书馆学刊,111~112,分布式信息检索是信息检索研究的一个重要方向,主要对分布式信息检索概念、分布式信息检索法、搜索引擎技术进行了分析,分布式技术与信息检索相结合,对于分布式资源的检索策略来讲,不仅可以对分布服务器之间的通信问题进行有效解决,还可以对

语义检索

在数字图书馆中,信息检索存在明显不足。在文献的组织与描述上,简单将关键词作为描述文献的基本元素,文献之间没有关联,是相互独立的、无结构的集合。在检索操作上,通常是基于关键词的无结构查询,难以反映词语间各种语义联系, 查询能力有限,误检率和漏检率很高,检索结果的真实相关度较低;计算查询和文档之间的相似度的方法也有局限。在用户交互界面上,用户的检索意图难以被机器理解,采用自然语言输入的检索关键词与机器的交互存在障碍。现有数字图书馆信息资源检索存在资源表示语义贫乏和检索手段语义贫乏、查准率低下等问题,语义网技术的出现,为数字图书馆的发展注入了新的活力,为信息检索质量的提高带来了新的生机。运用语义网技术,使解决信息检索中现存的问题,完善信息检索流程成为了可能。3.1 数字图书馆信息检索模型目前数字图书馆的信息检索主要借助于目录、索引、关键词方法来实现, 或者要求了解检索对象数据结构等, 对用户提供的关键词的准确性要求较高,基于语法结构进行检索, 却不能处理复杂语义关系,常常检索出大量相关度很差的文献。 图3.1 数字图书馆信息检索模型用户通过检索界面,输入关键词,文本操作系统对用户的关键词进行简单的语法层次的处理整合,与数字图书馆资源进行匹配检索,最终将检索的结果,再通过用户界面返回给用户。而数字图书资源,专业数据库等都是数字图书馆信息检索的范畴,这些数字化的知识资源主要以数据库形态分布于全球互联网的数千个站点,这种以数据库形式存放的信息资源,通常是电子化了的一次文献,包括元数据、摘要或者是全文,也可以是全文链接的地址。 24 基于语义网的数字图书馆信息检索模型研究 3.2 基于语义网的数字图书馆信息检索模型的设计思想数字图书馆信息检索系统存在诸多问题。查询服务智能化水平低,无法对用户请求进行语义分析;信息资源的共享程度低,仅仅采用题名、文摘或全文中出现的关键词标识文献内容,难以揭示文献资料所反映的知识信息,易形成信息孤岛;对用户输入的关键词进行句法匹配,查准率不高;片面追求查全率,返回大量无关结果等。这些问题最终造成用户的真正检索意图难以实现。人们希望有突破性的信息检索技术出现,能够支持更为强大的信息检索功能,具备理解语义和自动扩展、联想的能力,并为用户提供个性化服务。在这样的需求下,本节深入探讨了现存问题的解决方法,结合语义网技术,提出了以下基于语义网的数字图书馆信息检索模型的设计思想。3.2.1 机器理解与人机交互人们通过信息的交流和沟通,表达一定的思想、意思和内容,因此,自然语言和表达的信息中蕴含着丰富的语义。尤其是自然语言中,一词多义、一义多词现象十分常见,在不同的语境中,同样的词汇还可以表达出不同的意义。在人与人的交流中,近义词、反义词、词语的词性、语法结构等帮助人们在特定的语言环境中理解语言表达的确切含义,而计算机要做到这点却有难度。随着网络的不断发展,网络信息充斥着人们的视野。如何在浩如烟海的信息资源中,以最短的时间查找出相关资源,成为人们所关注的问题之一。通常,检索系统总会返回相关度不高,甚至完全无关的信息,而有些相关的信息却往往被遗漏了。一方面,检索工具没能把已经存在的、对用户有价值的信息检索出来,另一方面,信息资源没有很好的被归纳,提炼成知识。利用语义网技术,将语义丰富的描述信息和资源关联起来,通过机器理解和人机交互,对信息资源进行深层次的分析和挖掘。从本质上讲,人机交互是认知的过程,主要通过系统建模、形式化语言描述等信息技术,最终实现和应用人机交互系统。3.2.2 语义知识与描述逻辑从语义学的角度讲,语义是语言形式表达的内容,是思维的体现者,是客观事物在人们头脑中的反映[72]。人们在进行信息交流和沟通时,通过词语、符号来表达思想。当人们看到

个性化推荐系统的文献综述

个性化推荐系统在电子商务网站中的应用研究 一、引言 随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。 个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。本文对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。 二、个性化推荐系统概述 个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。 1995年3月,卡内基 梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航系统Web-Watcher,斯坦福大学的Marko Balabanovic 等人在同一次会议上推出了个性化推荐系统LIRA。同年8月,麻省理工学院的

移动搜索现状与发展研究

分类号:TP315 U D C:D10621-408-(2007) 5900-0 密级:公开编号:2003214051 电子科大成都学院 学位论文 搜索引擎与移动搜索 论文作者姓名: 申请学位专业: 申请学位类别: 指导教师姓名(职称): 论文提交日期:2010年06月01日

移动搜素基础,国内外移动搜索现状,国内外移动搜索发展,国内外移动搜索发 展的问题与对策。 搜索引擎与移动搜索 摘要 电脑网络与现代生活密切相关,它们已成为现代生活的标志,随着信息技术日新月异的发展,电脑网络在我们的日常生活、工作、学习、娱乐等方面日益重要,可以说,网络就象一个大宝库,里面有取之不尽的宝藏,要在浩如烟海的网络资源中迅速、有效的找到需要的资料,搜索引擎是最好的帮手。在3个月的毕业设计中,我在PCMAGZINE杂志社实验室学习了搜索引擎的一些原理及其使用方法,并实际参与测评了多款时下流行使用的搜索引擎,期间该评测实验室分别对5种不同的搜索引擎按易用性,功能和灵活性进行评测比较。以下便是我在实际测评工作中的心得体会。由于第一次从事这方面的分析,不足,错误之处在所难免,恳请各位老师批评指正。 关键字:搜索:移动搜索:网络营销 bstract Computer Network and is closely related to modern life, they have become the symbol of modern life, as information technology rapid development of computer networks in our daily life, work, study, entertainment and more important, we can say as a big network treasury, which has an inexhaustible treasure, to the vast network of resources quickly and effectively find the information needed, the search engine is the best helper. In the 3 months of the graduation project, I PCMAGZINE magazine laboratory study search engine and use some of the principles and practice involved in a variety of popular measurement used by search engines, respectively, during the evaluation laboratory 5 different search engines by ease of use, functionality and flexibility compared to evaluation. The following are my experiences in the actual evaluation work experience. As for the first time in this analysis, less than, is wrong with the inevitable urge teachers criticized the correction.

国外Folksonomy语义丰富研究综述

国外Folksonomy语义丰富研究综述 魏来 2012-12-25 10:12:42 来源:《情报资料工作》2010年03期【英文标题】Review of the Research of Semantic Enrichment of Folksonomy Abroad (Academy of Computer Sciences and Information technology Northeast Normal University, Changchun, 130117) (National Science Library, Chinese Academy of Science, Beijing, 100080) 【作者简介】魏来,女,1976年生,东北师范大学传媒科学学院讲师,中国科学院国家科学图书馆博士研究生。东北师范大学计算机科学与信息技术学院长春130117中国科学院国家科学图书馆北京100080 【内容提要】文章对国外folksonomy语义丰富的理论与实证研究进行了全面的梳理,从folksonomy的聚类、推荐、关联和实证四个方面探讨folksonomy 语义丰富的方法和途径,优化网络信息资源组织。 The paper comprehensive researches the theory and practice of folksonomy semantic enrichment, including folksonomy clustering, suggesting, relating and practicing. 【关键词】folksonomy/语义丰富/语义folksonomyfolksonomy/semantic

语义搜索的分类

语义搜索的分类 一.按语义搜索引擎服务内容的分类 语义搜索引擎从人们头脑中的概念到在搜索领域占据一席之地经历不少坎坷。语义网出现后,语义搜索迎来了高速发展的机遇期。虽然语义搜索服务内容主要集中在传统搜索引擎不擅长的语义网搜索方面。不过语义搜索引擎也试图拓展服务范围,提供比传统搜索引擎更全面的服务。语义搜索引擎的服务内容主要包括以下几个方面:知识型搜索服务、生活型搜索服务、语义工具服务等。 (1)知识型搜索方面,主要针对语义网知识信息资源。其中包括: ①词典型搜索服务。一种形式是如同使用电子词典一样,通过关键词直接查询与关键词对应的概念。这些概念由语义搜索引擎索引的本体文件中提取。另一种形式则是对在线百科全书的搜索服务,如PowerSet,这一点与传统搜索引擎近似,但语义搜索引擎在信息的组织上远胜于传统搜索引擎。 ②语义网文档(SWD)的查询服务。用户可以通过语义搜索引擎查询所需的语义网文档和相关的语义网文档。Falcons 为统一资源标识符(URI)定义的语义网对象和内容提供基于关键词的检索方式。Swoogle 从互联网上抽取由RDF 格式编制的语义网文档(SWDs),并提供搜索语义网本体、语义网例证数据和语义网术语等服务。 ③领域知识查询。部分语义搜索引擎提供了针对某个或某几个专业门类的信息检索服务,用户可以选择自己所需相关信息。Cognition 以搜索法律、卫生和宗教领域为主。个别语义搜索引擎提供针对特定领域的多媒体语义搜索服务,如Falcon-S 对足球图片的搜索服务。不过多媒体语义搜索面临与传统多媒体搜索相似的困境,缺乏有效的语义标注。对多媒体信息的辨别和分类能力仍有待提高。 (2)生活型搜索方面,语义搜索引擎在传统搜索引擎力所不及的诸方面发展迅速。 ①社会网络搜索。部分语义搜索引擎提供社会网络搜索功能,这种功能可以实现通过姓名、著作、所在单位等信息中的一条或几条,查询与这些信息有关联的更多信息,如我国的ArnetMiner。 ②资讯搜索。目前语义化的网络搜索服务能够更有针对性,更准确地为用户提供新闻资讯。Koru就是这方面的代表。 (3)语义工具服务。 这是语义搜索引擎所属的研究机构的一个较为独特的方面,和传统搜索引擎提供的桌面搜索等工具不同,语义搜索引擎提供的语义工具一般不是对语义搜索功能的直接移植,而是对文档的相似性、标注等进行处理用的。这些工具可以为语义搜索引擎的索引对象进行前期数据加工,同时也供科研使用。 理论上讲语义搜索引擎能够提供包括普通网络文档检索在内的所有类型网络文档搜索服务,但是由于语义搜索引擎对网页的索引方式不同,微处理器需要比传统搜索更长的时间才能分析完一个页面,因此很多语义搜索网站只能扫描到外部网站的二级页面,这样将难以满足用户全网络搜索的需求。 二.按语义搜索引擎服务模式分类 语义搜索引擎高速发展的阶段正值传统搜索引擎发展的平台期,虽然语义搜索引擎暂时尚不具备传统搜索引擎的市场竞争力,但是它们却可以很容易地借鉴传统搜索引擎的成

Cause语义韵研究与其在词汇教学中的启示9页

Cause语义韵研究与其在词汇教学中的启示 一、引言语义韵是语料库语言学中的一个较新的领域。"韵律"(prosody)这一词最早运用于语音学中, 指具有超切分特征的音韵现象。John Sinclair 从语言学中借用prosody这一词,并创造了一个新词(term):语音韵,用来指超出某一个词项所表达出的内涵意义。(Firth, Sinclair, 见纪玉华,吴建中 ,2000)。Susan Hunston也给语义韵下了定义, 她认为语义韵一般就是指一个单词由于经常用于某一个情景下,因此带有那个情景的韵义。 此后, Stubbs 把语义韵分成3类,即:积极语义韵,中性语义韵或混合语义韵,和消极语义韵。(Stubbs, 1996:176,见卫乃兴,2002)。如果一个单词具有消极的语义韵,与其搭配运用的词也都具有非常强的,明显的消极意义,所以整个语言特征或语言环境都是消极的。如果一个单词具有积极的语义韵,与其搭配的词也倾向于有积极的意义。混合语义韵,就如名字所示,既可以与消极意义的词搭配,也可以与积极的意义搭配。 综上所述,语义韵是词汇意义的重要部分,但是, 大部分的字典在定义词汇意义中,并不包括语义韵。在外语教学中, 教师也没有教授到词汇语义韵的相关知识,导致很多学习者虽然掌握了词汇的意思,却也会错误的运用该词, 本文将以"Cause"为例进行说明。 二、cause语义韵的相关研究 王乃兴研究过cause作为及物动词的语义韵(卫乃兴2002, ①②),他发现 "cause"具有消极的语义韵。与 cause左右搭配的词为"erosion, leaks, errors, inflation, undesirable等等。Cause 右边的搭配此为

基于信任机制的电子商务个性化推荐算法研究文献综述(全)

基于信任机制的电子商务个性化推荐算法研究文献 综述 一、引言 互联网技术的迅猛发展把我们带进了信息爆炸的时代。海量信息的同时呈现,用户很难从中发现自己感兴趣的部分,传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务。信息的爆炸使得信息的利用率反而降低。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也编的更加复杂,用户常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。 个性化推荐,被认为是当前解决信息系统超载问题最有效的工具之一。推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和兴趣,从而成为发现用户潜在的消费倾向,为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。但是推荐系统存在各种缺陷,Rashmi等人提出,相对于使用推荐系统来说,人们更愿意从自己认识的朋友或者熟悉的人那边获取推荐信息[1]。这体现了在互联网环境下,人们更加倾向于从自己信任的人获取推荐信息。 本文对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及信任概念、信任模型。 二、个性化推荐系统概述 个性化推荐研究直到20世纪90年代才被作为一个独立的概念提出来。电子商务个性化推荐系统的正式定义由Resniek&Varian在1997年给出:电子商务个性化推荐系统是利用电子商务网站向用户提供产品信息和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物过程的系统。这个定义现在已经被广泛的应用。推荐系统的使用者是用户(电子商务活动中的用户),推荐的对象是项目。项目是推荐系统提供给用户的产品和服务,也即最终的推荐内容。 个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网

基于本体的语义检索系统的研究与应用

基于本体的语义检索系统的研究与应用 董涛,孟祥武 北京邮电大学计算机科学与技术学院,北京(100876) E-mail:tdong2005@https://www.wendangku.net/doc/4b17139779.html, 摘要:基于本体查询的语义检索是建立在Semantic Web基础之上的一种检索技术。与传统搜索引擎技术相比,它极大地提高了系统的查全率和查准率。文章首先介绍了语义网和本体的基本概念,然后通过实际举例的概念层次图详尽地阐述了本体中概念及其关系的具体意义。最后利用本体构建工具Protege并结合本体的相关标准共同构建本体,通过Jena API实现了基于OWL本体文件的语义查询系统。 关键词:本体,语义网,OWL,Jena,Protege 0. 引言 随着Internet的迅猛发展,互联网上的信息正在随指数的速度在迅速增长,出现了信息爆炸的问题。在如此浩瀚的信息海洋中,检索到有价值的信息成为当前计算机检索系统必须解决的问题。因此,信息检索技术成为当前热门的研究课题。 目前,最主要的信息检索技术有两种。一种是基于目录的检索技术,它将相关主题的页面组织起来,形成一棵目录树。因此,检索的过程,就是遍历一棵目录树的过程。另一种是基于关键字匹配的检索技术,也是最常见的检索技术[1]。 以上两种信息检索技术在查全率和查准率方面还存在着很多欠缺之处。例如:当用户查询番茄时,搜索引擎只会将包含有“番茄”一词的页面提供给用户,而不会把包含有“西红柿”一词的页面也返回给用户。因此,这就存在着查全率的问题。与此同时,搜索引擎会把包含有“番茄花园”的页面返回给用户,但这并不是用户想得到的,因此,这在查准率方面就出现了问题。 为了解决查全率和查准率的问题,就需要提高信息检索技术的精度和覆盖率。如何使搜索引擎更加智能化,使它能够充分理解用户的意图,是信息检索技术需要迫切解决的问题。近年来,语义网的提出为增强搜索引擎的智能化提供了良好的解决方案。它将网络中的各种资源结构化,使得计算机能够识别、处理。 计算机首先将检索词本体化,检索引擎通过解析、推理,然后将相关资源从本体库中提取出来,最后返回给用户。这种智能的检索技术能够提高用户的满意度,减少不相关的结果,得到更多相关的结果。 本文从构建本体及其本体库的角度出发,结合实际的应用,阐述如何建立语义检索系统进行信息检索。 1. 语义网与本体的概述 1.1 语义网 在2000年11月的XML2000会议上,Tim Berners-Lee首次提出了语义Web的概念。他将语义Web定义为:语义Web是一个网,它包含了文档或文档的一部分,描述了事物间的明显关系,且包含语义信息,以利于机器的自动处理。他于2000年提出了语义Web的体系结构[2],如下图所示:

基于标签的推荐系统研究进展综述

Zhang ZK, Zhou T, Zhang YC. Tag-aware recommender systems: A state-of-the-art survey. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY 26(5): 767-777 Sept. 2011. DOI 10.1007/s11390-011-0176-1 基于标签的推荐系统研究进展综述 1.本文的主要内容 近年来,社会标签系统引起了包括物理学、计算机科学等诸多学科科学家的广泛关注。目前而言,对社会标签系统的研究主要集中在研究其结构、动力学和功能应用上。其中最主要的应用当属利用标签进行信息推荐。本文总结了当前该领域的最新进展,分别从网络结构、张量模型和潜层语义三个角度归纳了基于标签的推荐系统的思想、算法和性能。在此基础之上,文章最后讨论了三种方法的优劣,并对该方向的发展趋势进行了展望。 2.结论及未来待解决的问题 本文总结了基于标签的推荐系统的最新研究进展。主要归纳了以下三个方向的方法:(1)基于网络结构的方法;(2)基于张量的方法;(3)基于主题的方法。虽然目前还没有一种普适性的方法能够完全解决推荐系统中的冷启动、稀疏性和多样性等问题,但每种方法都能从一定程度上解决其中的一个或几个问题。基于网络结构的方法能解决大规模数据的稀疏性问题;基于张量的方法能解决多维数据的降维问题;基于主题的方法则能产生更加便于解释的推荐结果。因此,如能将几种方法的优点结合在一起,则有可能会设计更有效除了以上方法之外,随着对标签系统研究的不断深入,其中很多研究成果对于推荐系统有着非常重要的借鉴价值:(1)超图能完整的刻画多节点网络的结构特性,因此能很好地解决目前普遍采用的降维方法所带来的信息损失;(2)基于标签聚类的方法将有效地减少随意性标注所带来的信息噪声;(3)推荐节点对的方法打破了传统信息推荐只推荐一类节点的思维;(4)利用社会网络分析方法将标签系统中的社会影响力与传统推荐算法结合;(5)利用多层网络的耦合特性来更好地分析标签功能,在此基础上得到更有效的推荐算法;(6)通过分析分析用户标注行为的时间特性,将有望得到更加具有时效性的推荐结果。

基于语料库的语义韵翻译研究

龙源期刊网 https://www.wendangku.net/doc/4b17139779.html, 基于语料库的语义韵翻译研究 作者:汤益飞 来源:《科教导刊》2014年第34期 摘要本文通过对语料库数据中“导致”类动词的语义韵调查,本文发现翻译人员在“导致”类动词使用过程中会产生语义韵冲突或非典型搭配。 关键词语料库语义韵翻译“导致” 中图分类号:H319 文献标识码:A Semantic Rhyme Translation Studies Based on Corpus ——Take Chinese "leading to" verbs as an example TANG Yifei (School of Foreign Languages, Zhejiang University of Finance & Economics, Hangzhou,Zhejiang 310018) Abstract Based on the corpus data "cause" semantic class of verbs rhyme investigation, we find translators in the "cause" category verb process will produce a semantic conflict rhyme or atypical match. Key words corpus; semantic rhyme; translation; "leading to" 0 引言 近年来,随着语料库语言学的发展,语义韵的研究在语言的学习和应用中发挥了越来越显著的作用。语义韵的定义由Louw于1993年正式提出,Louw将语义韵定义为“a consistent aura of meaning with which a form is imbued by its collocates”。本文以大量真实的源语语料和翻译语料探究“导致”类动词的语料韵特征及其对翻译的启示。 1 文献综述和语料库介绍 关于语义韵翻译的研究国内外研究就有涉及。Munday(2003)在英语与西班牙语的语义韵和翻译的跨语言研究分析的基础上提出语料库数据对译者翻译大有益处。Stewart (2009)分析了英意翻译中的语义韵问题。 文本采用的语料库为兰卡斯特汉语平衡语料库(LCMC)和浙大汉语译文语料库(ZCTC)。本文运用软件Antconc3.2.1w(windows)2007对语料进行处理。搜索“导致”和

搜索引擎评价研究方法综述

搜索引擎评价研究方法综述 费巍 2012-9-29 19:50:56 来源:《现代情报》(长春)2010年12期【英文标题】Overview of the Methods of Evaluation on Search Engine 【作者简介】费巍(1981-),男,博士,研究方向:信息组织和信息检索,发表论文10多篇。苏州图书馆,苏州 215002 【内容提要】通过ISI Web of Science和中国期刊网查找有关搜索引擎评价研究的文章,本文对搜索引擎评价研究的相关文献进行了梳理,并对研究方法进行了总结。搜索引擎评价研究方法主要有实验法、调查法、观察法、数据分析法、综述和评论等。对比国内外相关研究,国内搜索引擎评价研究数据支撑较为缺乏,科学分析和论证也明显不足。本文旨在提升国内搜索引擎评价研究的科学性。 The paper reviewed the documents related to the evaluation of search engines based on the ISI Web of Science and CNKI. The methods of these studies were concluded, which were experimentation, survey, observation, data analysis, and review. According to the comparison between domestic and overseas correlational research, the research on the evaluation of search engines was lack of data, as well as scientific analysis and verification. The aim of this paper was to improve the scientificity of the evaluation of search engine in China. 【关键词】搜索引擎/评价/研究方法/综述Search

国内语义韵研究综述

山东外语教学 Shandong Foreign Language Teaching Journal 2009年第2期(总第129期)  国内语义韵研究综述 翟红华,方红秀 (山东科技大学外国语学院,山东青岛 266510) 基金项目:本研究为山东省教育厅资助项目“基于语料库的语义韵研究及其应用” (Y 06512)阶段性成果之一。收稿时间:2009201220 作者简介:翟红华(1967-),女,汉族,山东蓬莱人,教授,硕士生导师,南开大学在读博士。研究方向:生成音系学、应用语言学。 方红秀(1983-),女,汉族,山东泰安人,硕士研究生。研究方向:外国语言学及应用语言学。 摘要:自2000年语义韵的概念被介绍到中国,对语义韵的研究一直吸引了国内广大学者的兴趣,涌 现出了大量的成果。对此,本文拟对近十年的研究成果从宏观的角度综合概述其研究特点、研究领域等,同时指出研究的不足之处,这将对语义韵的进一步研究具有一定的借鉴意义。关键词:语义韵;研究综述中图分类号:H030 文献标识码:A 文章编号:100222643(2009)022********.0引语 语义韵(Semantic Pros ody )是当代语料库语言学中的一个重要研究对象。这一术语是Sinclair (1991) 借用Firth 曾经使用的“音韵” (pros ody )一词而新创的一个专为语料库语言学研究使用的术语。Stubbs (1996)将语义韵分为消极语义韵(negative pros ody )、中性语义韵(neutral pros ody )和积极语义韵(positive pros ody )三类。其中中性语义韵又可称为错综语义韵。(卫乃兴,2002a )语义韵研究通常采用三种方法:基于数据的方法、数据驱动的方法和基于数据和数据驱动相结合的折中方法。卫乃兴是最早将语义韵概念介绍到国内的著名学者之一。自2000年,对语义韵的研究一直吸引着广大学者的兴趣。本文试图从宏观的角度对这一可喜的研究现象及成果进行全面概括,展现语义韵研究的全貌。2.0统计与分析 自语义韵的概念被介绍到中国,国内关于语义韵的研究呈现出良好的发展势头,陆续出版和发表了一批学术论文,取得了一定的研究成果。本文以中国期刊全文数据库、博士学位论文全文数据库、中国优秀硕士学位论文全文数据库、中国重要会议论文全文数据库四个数据库为来源,先后以“主题为语义韵”“关键词为语义韵”为检索项,检索并筛选出关于语义韵研究的文章38篇。 从目前国内语义韵研究的特点来看,主要表现在两个方面:一是研究论文逐渐增多,特别是在2006年之后。具体分布见图表1。二是研究领域不 断扩大。从起初对语义韵对象、方法的简单介绍转入更广、更深的领域 。 图表1 从目前的研究方向上看,基于语料库的语义韵研究主要有以下四个方面:语义韵的理论介绍、词汇语义韵的实证研究、语域的扩展及语义韵的实际应用。下面从这四个方面分别对近几年的语义韵研究进行介绍。 2.1语义韵的理论介绍 各个时期均有这方面的介绍性文章。纪玉华、吴建平(2000)的文章“语义韵研究:对象方法及应用”是最早有关语义韵的介绍。随后,卫乃兴(2002b )在其论文“语义韵研究的一般方法”中就语义韵研究的三种常用方法作了详细的介绍,即基于数据的方法、数据驱动的方法和基于数据与数据驱动相结合的折中方法。文章通过对语义韵的实例研究,揭示研究中的理念及具体步骤,分析每种方法的特点与实用性,并讨论语义韵研究的价值和意义,实用性极强。王泽鹏、张燕春(2005)在“语义韵律理 8

相关文档