文档库 最新最全的文档下载
当前位置:文档库 › Web评论主流观点提取及不同源数据的对比分析

Web评论主流观点提取及不同源数据的对比分析

计算机研究与发展ISSN1000—1239/CN11—1777/TPJournalofComputerResearchandDevelopment46(Suppl.):1—7,2009

Web评论主流观点提取及不同源数据的对比分析

孔亮石磊孙柏张岩

(北京大学智能科学系北京100871)

(klangelfox@gmail.corn)

WebCommentAnalyzingandOpinionComparisonAmongDifferentSources

KongLiang,ShiLei,SunBai,andZhangYan

(Departmentof

MachineIntelligence,PekingUniversity,Beijing100871)

AbstractWiththepopularizationoftheInternetandpublicmedia,thenetworkmediahasgraduallybecomethemostusednetworkapplication.TheinteractionofmediaandtherichcontentoftheWebleadtotheexplosionofWebcomments.ItmakestheautomaticminingofthemainstreamopinionsontheWebandthecharacteristicsofdifferentdatasourcesparticularlysignificant.Therearetwocontributionsinthispaper.Firstly,amethodonautomaticminingofWebmainstreamopinionsisputforward.Itcanautomaticallydigoutthemaintrendopinionsunderacertainsubjectwithtwocriticalprocesses

named“commentclassification’’and“opiniondescription”.ItevenfurtherusesseveralkeywordsandonereDresentativeremarktodescribeeachmainstreamopinion.Secondly,withthismethod,theopiniondatafromdifferentsourcesareanalyzedandcompared.

KeywordsWebcomment;mainstreamopinionextraction;opinionanalysis

摘要随着互联网普及率的不断提高和大众媒介的网络化,网络媒体逐渐成为使用率最高的网络应用.媒介的互动性和网络的海量性导致了网络评论的大量出现,使得网络评论主流观点的自动提取以及不同源数据的对比分析格外具有意义.针对以上问题展开研究,主要有两点贡献:第一,提出了一种自动提取网络评论主流观点的方法,该方法克服网络评论的复杂性和海量性,通过“Web评论观点鉴别”和“主流观点描述”两个核心部分的处理,自动提取出某一主题下评论的主流观点,并针对每个主流观点,使用关键词和代表性评论对其进行描述;第二,利用该方法对来自不同数据源的网络评论进行对比分析,给出了不同数据源的网络评论特点及差异.

关键词Web评论;主流观点提取;评论分析

中图法分类号TP391

自1969年因特网诞生以来,经历了飞速的发展.根据InternetWorldStats公布的最新数据,截至2008年12月31日,全球因特网用户已经超过15亿.与此同时,大众媒介不断网络化,根据CNNIC的统计[1],2008年网络媒体的使用率达到78.5%,成为网民使用最多的网络应用.媒介的互动性和网络的海量性,创造了吸引受众的、独有的网络评论.网络评论具有形成速度快、交互性强、高容纳性和随意

收稿日期:2009-06—19

基金项目:国家自然科学基金项目(60673129,60773162。60672171)性,决定了单纯依靠人力不可能完成对网络信息的分析.

网络评论推动了信息的传播,对于社会舆论的形成有着不可低估的作用.然而网络的虚拟性和隐蔽性,也使得一些人敢于散布虚假的、不确实的消息和言论.如果想对网络言论进行了解和把握,那么就要及时准确了解网络评论的主流观点;如果想要网上购物、计划观看电影或者远足旅行,也需要查看相

万方数据

相关文档
相关文档 最新文档