文档库 最新最全的文档下载
当前位置:文档库 › 基于k均值聚类的微博用户分类的研究

基于k均值聚类的微博用户分类的研究

基于k均值聚类的微博用户分类的研究
基于k均值聚类的微博用户分类的研究

Computer Knowledge and Technology 电脑知识与技术软件设计开发本栏目责任编辑:谢媛媛第8卷第26期(2012年9月)基于k 均值聚类的微博用户分类的研究

张国安1,钟绍辉2

(1.中国石化江汉油田信息中心,湖北潜江433124;2.江西工业工程职业技术学院,江西萍乡337055)

摘要:文章通过对用户数据的分析,根据用户的教育情况,用户的收入情况,采用k 均值算法对用户进行聚类,将具有相同特征的用户归为同一类,为微博的个性化营销和服务提供依据。

关键词:K 均值聚类;微博;用户分类

中图分类号:TP393文献标识码:A 文章编号:1009-3044(2012)26-6273-03

微博客是博客的一种变体,是一种允许用户及时更新简短文本并公开发布的博客形式,允许任何人阅读或者只能由用户选择的群组阅读。用户可通过即时通讯工具、网页等终端发布、更新博文。博客虽已成为一种有效的信息沟通与交流方式,但依然具有进

入门槛,而微博客则将门槛降到最低[1]。微博的使用人群数量基数大,状态信息更新频繁、信息传播迅速。并且微博平台媒介用户

占有率相对集中,因此基于微博数据的分析研究成为了十分值得关注的研究方向。在廉捷[1]等人就微博数据的获取提出了基于新浪微博API 与基于页面解析的新浪微博数据获取方案。KANG Shulong [2]针对新浪微博研究了其群体结构与度分布特征。目前,微博的应用中,没有根据用户的需求,用户的特征做相应的推荐工作,比如根据用户的受教育程度,用户的所从事的工作,推荐相应的用户群体。本文根据新浪微博提供的API 接口,获得用户的相关资料,采用k 均值算法对用户分类,为微博的智能的发展和微博得营销提供有力的支持。

1k 均值算法

聚类就是将一个数据对象集合分组成为类似的对象组成的多个类的过程。每个类中的对象具有相似的特征,不同类中的对象具有相异的特征。聚类和分类不同,不需要训练的集合。

k 均值聚类方法:k 均值方法是把含有n 个对象的集合划分成指定的k 个族,每个族中的对象的平均值称为该族的聚点(中心),两个族的相似度就是根据两个聚点而计算出来的。假设聚点X ,Y 都有M 个属性,取值分别为想x 1,x 2.......x n 和y 1,y 2.......y n ,则x 和y 的距离

d xy =(∑k =1m x k -y k )12

.k 均值算法的步骤如下:

初始化。输入基因表达矩阵作为对象集X ,输入指定聚类类数N ,并在X 中随机选取N 个对象作为初始聚类中心。设定迭代中止条件,比如最大循环次数或者聚类中心收敛误差容限。

进行迭代。根据相似度准则将数据对象分配到最接近的聚类中心,从而形成一类。初始化隶属度矩阵。

更新聚类中心。然后以每一类的平均向量作为新的聚类中心,重新分配数据对象。

反复执行第二步和第三步直至满足中止条件。

2微博网站用户分类的实证分析

2.1数据采集与预处理

本文用户数据的来源于新浪微博网站,该网站是国内知名的微博社区。通过利用网络爬虫来实现数据的获取。具体抓取和处理过程如下:1)提取每位用户基本的数据信息,包括用户的受教育情况,用户的年龄,用户从事的行业情况。2)提取表征用户社区结构属性的数据资料,包括他关注的人数、关注他的人数、微博数、收藏数四项数据。3)为了在网络分析时更加高效,对用户名称进行顺序编码。4)提取每位用户的关注对象名单,共得到8257条数据,以用户为单位进行保存。将所有的非数值型数据采用数值型来表示,为对用户进行聚类分析做好准备。

2.2K 均值聚类法代码及其对用户分类的实现

收稿日期:2012-06-28

作者简介:张国安,高级工程师,现就职于中国石化江汉油田信息中心。

E-mail:xsjl@https://www.wendangku.net/doc/d617346639.html,

https://www.wendangku.net/doc/d617346639.html, Tel:+86-551-56909635690964

ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术Vol.8,No.26,September 2012.6273

Computer Knowledge and Technology 电脑知识与技术本栏目责任编辑:谢媛媛软件设计开发第8卷第26期(2012年9月)

在深入分析K 均值聚类算法的基础上,本人用JAVA 语言实现了K-meams 的代码,并且通过代码的编写来实现对用户的分类。其中核心代码如下:public void cluster(){boolean centroidsChanged =true;while (centroidsChanged ==true){List>clusters =new ArrayList>(k);for (int i =0;i ());}//Assign points to each set based on minimum distance from the centroids for (DataPoint p :allDataPoints){int i =findClosestCentroid(allCentroids,p);clusters.get(i).add(p);}for (int i =0;i

centroidsChanged =false;for (int i =0;i 0){double[]newCentroidValues =findCentroid(allClusters[i]);double[]oldCentroidValues =allCentroids[i].getNumericAttrValues();if (!Arrays.equals(oldCentroidValues,newCentroidValues)){allCentroids[i]=new DataPoint(allCentroids[i].getLabel(),newCentroidValues);centroidsChanged =true;}}else {//keep mean unchanged if cluster has no elements.}}

}

}public DataPoint[]getAllCentroids(){return this.allCentroids;}public Cluster[]getAllClusters(){return this.allClusters;}public int getK(){return this.k;}public static DataPoint[]pickInitialCentroids(int k,DataPoint[]data){Random randGen =new Random();DataPoint[]centroids =new DataPoint[k];SetpreviouslyUsedIds =new HashSet();for (int i =0;i

Computer Knowledge and Technology 电脑知识与技术软件设计开发本栏目责任编辑:谢媛媛第8卷第26期(2012年9月)

double[]values =data[centroidId].getNumericAttrValues();String[]attrNames =data[centroidId].getAttributeNames();centroids[i]=new DataPoint(label,Attributes.createAttributes(attrNames,values));}return centroids;

}2.3实现对用户的分类的核心代码如下

SFDateset ds=SFData.createDATESET();DataPoint[]dps=ds.getdata();//加载用户数据;KmeansAlgorthm kmeans=new KmeansAlgorithm(8,dps)//初始化K-means 算法;Kmeans.cluster();Kmeans.print();实验中,初始的聚类节点选择为8个。K-mean 算法中,初始聚点的选择对用户的划分具有很大的影响。选择初始的聚类节点的不同,算法的解也不同。选择合适的初始聚点可以能够加快算法的收敛速度。为了最大可能的实现对用户有效的分类,笔者分别尝试了用不同的初始聚点来实现用户分类,实验结果表明,聚点在8和13之间具有很好的分类效果。3结束语

本文通过对k-meam 聚类算法的分析,将聚类算法首次应用在微博中,实现对用户的分类,为微博用户的个性化服务和个性化营销提供依据。本文的创新点在与,实现了对用户智能的分类,开拓了微博应用的新的领域。

参考文献:

[1]廉捷,周欣,曹伟,等.新浪微博数据挖掘方案[J].清华大学学报:自然科学版,2005,51(10):1300-1305.[2]KANG Shulong,ZHANG https://www.wendangku.net/doc/d617346639.html,plexity research of massively microblogging based on human behaviors[C]//20102nd Inter?national Workshop on Database Technology and Applications,DBT A2010)Proceedin gs.Wu han,China:IEEE Comput er S ociety,2010:1-4.

(上接第6266页)

参考文献:

[1]Wang Lina.The Research and Application of Engineering Designing Management System Architecture Based on CSCW[D].Xi ’an Shiyou University,2006.[2]Wang lina.Engineering Design System Research Based on CSCW Engineering Design System Research Based on CSCW[C].The 2nd International Conference on E-Business and E-Government ICEE,2011:5986-5989.[3]毛雯娟.浅谈工程设计档案管理信息化[J].建厂科技交流,2007(5):148-149[4]王亚清.基于信息化管理理念的工程设计单位档案管理研究[J].工程建设与设计,2010(12).6275

微博运营六大策略

微博运营六大策略 一、互动策略 1、评论策略 常规评论、可简单回复或者不回复 无效评论、例如纯广告、“转发微博”等 观点类评论,此类评论同策是对文案内容的补充及意见,很有意义 负面性评论,即反对性观点或攻击性言语 2、转发策略 常规转发 观点转发 咨询类转发 负面性转发 3、私信策略(私信策略六原则) 及时原则:第一时间回复,快速反应是王道 分类原则:对目标微博进行分类整理 对等原则:私信对方地位对等 互动原则:建立多层次的沟通互动机制,包括@、私信、转发、评论以及QQ、短信、电话综合应用 闭环原则:每个客户的情况都要闭环 持续原则:生意不在仁义在,不成交的客户也持续沟通 4、监控策略 对企业相关关键词进行定点搜索监控 5、关键词搜索策略 对企业相关关键词进行搜索,摘取好的内容和对象进行互动 二、组织策略 1、组织人员管理 人员配置 职能职责 人员培训 人员考核 人员激励 2、企业微博运营管理工具 批量关注工具 粉丝管理工具 定时工具 3、微博运营知识库管理 业内意见领袖 行业知识动态 行业信息来源 三、危机应对策略 1、概念 危机的定义 危机的分类 危机的发展过程

危机的类型 微博危机管理原则:时间原则 责任原则 态度原则 机会原则 2、微博危机预防机制 主动发现:关键词监控 搜索机制:通过相关标签 3、微博危机处理流程 统一指挥,主要负责人知悉; 注意倾听,及早响应(感谢关注、友好赞赏、诚意邀请参观公司、请对方给出意见与建议等); 第一时间刷微博进行@覆盖; 不在事发评论席进行评论,尽可能降低舆情的热度; 事后恢复,弥补事件造成的损失; 建立危机应对预案,确保紧急时刻能做到“兵来将挡水来土掩“; 完善网络微博发言人机制,统一指挥、统一口径; 加强与网友日常沟通,培养忠实粉丝和客户,防患于未然; 注重企业领导人及员工在微博的一言一行; 4、微博危机公关总结 四、定位策略 首先要明确的第一点就是开设微博的目的,界定微博的定位是做销售产品,还是品牌宣传,还是为了扩大个人影响力,然后才能在此基础上发布相关内容,吸引目标粉丝群,才能针对其销售产品,做到最大化利益。 五、装修策略 1、微博模板 微博模板的设置一定要遵循两个原则:美观性原则和一致性原则。 2、微博头像 企业微博头像可使用公司logo,子账户可根据自身属性设置,但切忌频繁变动。 3、微博昵称 微博昵称不宜过长,应尽量与定位一致,尽量避免出现生僻字和中英文混搭现象。 4、个性域名 个性域名一经确定将无法修改,所以应谨慎选取,同时最好是与企业保持一致性。 5、认证信息 对微薄进行认证可以提高真实性,增加权威性,提高曝光率。 6、企业介绍或个人介绍 企业介绍可以让浏览者对企业或个人有一个最直观的认识。 7、公告栏 8、建议企业微博可利用公告栏放置告示性文字,如通知、活动信息等。 9、友情链接 微博是增加企业网站链接曝光率的一种有效途径,企业可通过微博对网站进行宣传和推广。 10、展示视频 展示视频可放置宣传企业文化、品牌等信息的视频。 11、首页图片

微博运营六大策略(经典)

微博运营六大策略 1 定位策略 首先要明确的第一店就是开设微博的目的,界定微博的定位是左销售产品,还是品牌宣传,还是为了扩大个人影响力。然后才能在此基础上发布相关内容,吸引目标粉丝群,才能针对其销售产品,做到最大化利益。 2 装修策略 A.微博模板微博模板的设置一定要遵循两个原则,美观性原则和一致性原则。 B.微博头像企业微博头像可使用公司logo,子账号可根据自身属性设置,但切忌频繁 变动 C.微博昵称微博昵称不宜太长,应尽量与定位一致,尽量避免出现生僻字和中英文混 搭现象 D.个性域名个性域名一经确定将无法修改,所以应谨慎选取,同时最好是与企业保持 一致性 E.认证信息对微博进行认证可提高真实性,增加权威性,提高曝光率 F.企业介绍企业介绍可让浏览者对企业有一个最直观的认识 G.公告栏建议企业微博可利用公告栏放置告示性文章,如通知,活动信息等 H.友情链接微博是增加企业网站链接曝光率的一种有效途径,企业可通过微博对网站 进行宣传和推广 I.展示视频展示视频可放置宣传企业文化,品牌等信息的视频 J.首页图片相当于首页界面的宣传和广告,用语展示企业的产品,动态等等 K.我的标签标签的左右有两种,一种是展示效应,一种是搜索效应 L.子品牌企业可在为日本界面上设置品牌子账号,对企业子账号或关联微博进行推广 M.领导人企业领导人的展示,但被设置为领导人的微博需要保持更新,因为其代表企业的形象 N.我加入的群按行业分企业行业相关匹配性

按地区分目标群体所在地的组织 按内容分共同感兴趣的话题组 3 内容策略 A. 栏目设置相关性 互动性 趣味性 B. 栏目设置行业相关知识,作为定时栏目 行业相关热点,作为非定时栏目 C. 栏目发布时间定时发布一般定在粉丝活跃度较高时间段发布 9-12點,12-17點17-19點19-22點22-24點0-3點 即时发布新鲜热点即时发布 D. 内容发布流程定时栏目内容收集统一整理并审核审核通过定时发布 非定时栏目即时取材编辑即时审核审核通过即时发布 E. 内容发布定制定制是指標對你的目標群體來選擇內容,要讓這部分人感興趣 非定制:是指那種適合任何粉絲的內容 建議粉絲沒超過10000時不要發佈自己企業或産品的資訊(除非你的粉絲很有效或者真要發,每天不能超過一條)

基于划分方法的聚类分析

南京信息工程大学滨江学院实验(实习)报告 实验(实习)名称基于划分方法的聚类分析实验(实习)日期 2011.6.10 指导教师闫雷鸣 专业软工(动画)年级 2008 班次(1)班姓名王圆媛学号 20082358002 得分 一、实验目的 (1)学习聚类分析的基本概念、各种数据类型、聚类方法的分类。 (2)学会典型的划分方法K均值和K中心点算法的基本原理、特点、优缺点。 (3)应用Weka软件,学会导入数据文件,并对数据文件进行预处理。 (4)学会并应用划分方法中K均值和K中心点算法对数据集进行聚类分析。 二、实验准备: Bank-data 三、实验要求: 用划分方法中K均值和K中心点算法对数据集进行聚类分析 四、实验内容: 4.1 相关知识 聚类分析中的“类”(cluster)和前面分类的“类”(class)是不同的,对cluster更加准确的翻译应该是“簇”。聚类的任务是把所有的实例分配到若干的簇,使得同一个簇的实例聚集在一个簇中心的周围,它们之间距离的比较近;而不同簇实例之间的距离比较远。对于由数值型属性刻画的实例来说,这个距离通常指欧氏距离。聚类分析中使用最常见的K均值(K-means)算法。 K均值聚类方法的步骤如下。 (1)K均值算法首先随机的指定K个簇中心。 (2)将每个实例分配到距它最近的簇中心,得到K个簇; (3)计分别计算各簇中所有实例的均值,把它们作为各簇新的簇中心。重复(2)和(3),直到K个簇中心的位置都固定,簇的分配也固定。 上述K均值算法只能处理数值型的属性,遇到分类型的属性时要把它变为若干个取值0和1的属性。WEKA将自动实施这个分类型到数值型的变换,而且Weka会自动对数值型的数据作标准化。 Weka中列出了很多聚类算法。对于EM实现,用户可指定需要产生多少聚类,否则所用的算法可通过交叉验证来决定,在这种情况下,折的数量固定为10(除非训练实例小于10个)。用户可指定循环次数的最大值,并且为正常的密度计算设定可允许的最小标准差。SimpleKMeans使用k均值来聚类数据;聚类的数量通过一个参数设定。Cobweb实现了用于名词属性的Cobweb算法和用于数值性属性的Classit算法。FarthestFirst实现Hochbaum 和Shmoys远端优先遍历算法。MakeDensityBaseCluster是一个元聚类器,它包装一个聚类算法,使其返回一个概率分布和密度。它为每个聚类拟合一个离散分布,或一个对称的正态

SPSS因子、聚类案例分析报告.pdf

喀什大学实验报告 《多元统计分析SPSS》 实验报告 实验课程:基于SPSS的数据分析 实验地点:现代商贸实训中心实验室名称:经济统计实验室 学院: xxx学院年级专业班: xxx班 学生姓名: xxx 学号: XXXX1808015 完成时间: XXXX年x月x日 开课时间: XXXX 至 2017 学年第 1 学期

实验项目:中国上市银行竞争力分析 (一)实验目的 本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其XXXX 年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。 (二)实验资料 通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。 具体数据如下所示: 十家同类型上市商业银行XXXX年指标 (三)实验步骤 1、选择菜单

2、选择参与因子分析的变量到(变量V)框中 3、选择因子分析的样本 4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图形等 5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:主成分分析法 6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法

微博增设栏目

据观察易发现,新活广播、Ucity的微博与社联官方微博的不同之处在于它们发布的微博话题很广,关系到我们学生的方方面面。对于学校各种活动它们都会进行预告和说明,且有许多衣食住行方面的内容,比较贴近学生的生活,学生可以获取自己感兴趣的信息。而我们社联的官方微博基本上只发布有关社联社团活动的信息,没有涉及到学生生活的其他方面,较难吸引学生关注。而我们社联的又是为社团服务的,所以也因尽可能的为各社团提供各方面信息,如其他高校同一性质的社团举办的一些比较特别的、有参考价值的活动相关内容我们可以发微博@它们。 因此,我认为我们社联官方微博可以增设以下栏目: 1、名称:#社团校外信息频道# 内容:主要发布其他高校相关社团的特色活动等各方面信息,并@我校相关社团。 来源:密切关注其他高校各社团的微博或博客,从中找出一些特色品牌活动,然后转发为微博或编辑相关内容的微博。注意时效性。 2、名称:#华师社联生活频道# 内容:各类我校衣食住行方面的信息,内容不能太官方,要贴近学生的生活。 来源:原创,许多比较专门发布这方面信息的微博,例如广州吃货小窝、大学城小八卦等等。 3、名称:#华师社联艺术频道# 内容:电影推荐、音乐推荐、美文、哲理故事、旅游介绍等。 来源:原创,各类相关微博,如一块去旅行、全球经典音乐、精彩电影等。接受私信投稿。 4、名称:#华师社联社团活动时光机# 内容:社团、社联往期活动回顾 来源:每月一次总的活动回顾 5、名称:#校园活动速递# 内容:校内外活动预告 来源:转发各大组织的微博 6、名称:#社团百科# 内容:社团的简介并@社团微博 来源:各大社团的简介,开学前已经收集过。 PS:以上栏目都接受各类私信投稿…

微博营销成功案例分析

Weimedia--微营销分析 完美“优雅女”营销案例分析 weimedia微媒体平台是华人基业公司旗下核心业务之一,是中国最专业的微博营销平台,是国内最早深入研究微博营销广告技术平台的公司。北京华人基业科技有限公司成立于2004年,总部设立于北京,长期服务于国内300多家知名企业,旗下拥有4大核心自主技术广告平台,定位于互联网全程效果整合营销专业服务,拥有大批互联网营销、管理、技术等专业人才、优质媒体资源和自主核心技术平台。 网络营销的方法和案例非常多,在较为浮躁的中国互联网环境下,一个好的创意是网络营销活动中最主要的灵魂。去年的“贾君鹏事件”就是一个非常好的创意,也用事实说明了事件营销的效果和所产生的推动力,往往比其他营销方法要好的多。今天我就具体以最近发生的一起事件营销“后宫优雅事件”为例,来分析一下在社会化网络环境下的微博事件营销的过程和方法。 事件营销策划 事件营销就是通过制造具有新闻价值的事件,并让这一新闻事件得以传播,来转弯抹角的做广告,达到广告的效果。比如某公司要推广某一款网络游戏,使用知名度高的明星代言往往需要较高的费用,推广时候的广告费也不菲,而如果通过事件营销的方式打造一个知名度很高的网络红人来代言这个网络游戏,不仅仅可以节省大量费用,还以低廉的成本进行了网络推广营销。 营销策划人可谓用心良苦,从去年12月就开始计划利用互联网来打造这个具有较高知名度的“网络红人”—“后宫优雅”。这个案例的营销平台选择的是“新浪微博”,这是一个2009年后半年开始逐渐热闹起来的社会化网络平台,注册用户约有几十万,有不少“名人”

入驻。由于网络的虚拟性和匿名性,注册的微博用户背后的身份往往无从知晓,于是做好几方面准备之后就可以开始进行事件营销。 事先的准备工作包括,寻找一个虚拟的“网络美女”,并预备几十张左右的自拍照片,然后寻找一个写作团队,能够持续地写出有趣的段子。准备好这一切后,就可以开微博帐号进行炒作。微博前期的炒作主要以“美女”、“炫富”、“明星八卦”为着重点,总而言之就是“找骂贴”。典型的症状包括,自称来自“新加坡”,“后宫三千,独我优雅”。号称有私人飞机,认识很多明星,和阿娇去日本泡温泉,被范冰冰专门因为安慰过,经常行来于夏威夷、香港等地,投资几千万给电影《阿凡达》,并与许多大牌娱乐圈艺人私交甚好等等。 值得一提的是,该微博的写作团队具有较高的文案写作水准,在初期炒作阶段,发表的段子非常诙谐幽默,颇具有娱乐效果,可读性很高,使得不少新浪微博的名人都转发其段子,在12月中旬时,“后宫优雅”具有了约四千左右的粉丝数。 平媒介入 12月下旬,平面媒体、报刊杂志开始报道和炒作“优雅女”,使得“后宫优雅”的知名度急剧上升,并在2009年12月29日达到了一个小高峰,用户关注度增长惊人,搜索量也开始猛增,也开始有网友对其进行人肉搜索,“后宫优雅”的微博在29日粉丝数增长到八千多。经过人肉搜索,网友发现“优雅女”的身份真实性存在很大疑问,有人称其照片为盗用他人照片,而“优雅女”则发帖称自己的相册被盗了。 围观吹牛

基于划分的聚类算法

- 文献阅读报告 课程名称:《模式识别》课程编号:题目: 基于划分的聚类算法 研究生: 学号: 论文评语: 成绩: 任课教师: 评阅日期:

基于划分的聚类算法 2016-11-20 摘要: 聚类分析是数据挖掘的一个重要研究分支,已经提出了许多聚类算法,划分方法是其中之一。基于划分的聚类算法就是用统计分析的方法研究分类问题。本文介绍了聚类的定义以及聚类算法的种类,详细阐述了K 均值聚类算法和K中心点聚类算法的基本原理并对他们的性能进行分析,对近年来各学者对基于划分的聚类算法的研究现状进行梳理,对其具体应用实例作简要介绍。 关键字:数据挖掘;聚类;K 均值聚类算法;K 中心点聚类算法;K众数算法;k多层次聚类算法 Partitional clustering algorithms Abstract:Clustering analysis is an important branch of data mining, many clustering algorithms have been proposed, the dividing method is one of them. Based on the clustering algorithm is divided into classification problems using the method of statistical analysis. In this paper,we introduces the definition of clustering and type of clustering algorithm,the basic principle of k-means clustering algorithm and K-center clustering algorithm are expounded in detail,we also analyze their performance,the scholars in recent years the study of the clustering algorithm based on partitioning present situation has carried on the comb,make a brief introduction to its specific application instance. Key words:Data mining;clustering;k-means clustering algorithms;k-medoids clustering algorithms;k-modes clustering algorithms ;k-prototype clustering algorithms 1.引言 把单个的数据对象的集合划分为相类似的样本组成的多个簇或多个类的过程,这就叫聚类[1]。在无监督的情况下,具有独立的学习能力,这就是聚类。将数据空间中的所有数据点分别划分到不同的类中,相近距离的划分到相同类,较远距离的划分到不同类,这就是聚类的目的.聚类分析常作为一种数据的预处理过程被用于许多应用当中,它是更深一步分析数据、处理数据的基础。人们通过聚类分析这一最有效的手段来认识事物、探索事物之间的在联系,而且,关联规则等分析算法的预处理步骤也可以用它。现在,在气象分析中,在图像处理时,在模式识别领域,在食品检验过程中,都有用到它。随着现代科技水平的不断提高、网络的迅猛发展、计算机技术的不断改革和创新,大批量的数据不断涌现。怎样从这些数据中提取有意义的信息成为人们关注的问题。这对聚类分析技术来说无疑是个巨大的挑战。只有具有处理高维的数据的能力的聚类算法才能解决该问题. 研究者们开始设计各种聚类算法,于是,基于划分的聚类算法便应运而生,而且,取得了很好的效果。 2.正文 1 聚类概述

四大微博的共同点和差异

四大微博的共同点和差异一、登陆页面(以下图片顺序为新浪、腾讯、搜狐、网易) 微博登陆界面(新浪、腾讯) 微博登陆界面(搜狐、网易)

从客户端上的登陆页面操作中得出,用户名和密码都是默认记录的,都支持多用户切换。 二、注册 (新浪、腾讯微博注册界面)

通过界面截图可以用看到,四大微博客户端都可以用邮箱进行注册,其中搜狐和腾讯微博都是可以用QQ号进行注册。 三、客户端首页

从外形上看,新浪微博和搜狐微博的首页相似度比较高,腾讯的首页则是保持自己的蒲公英样式。但还是从使用上作出了区别。四款客户端都是运用向上向下拉伸进行内容的更新,符合用户使用网页的习惯。四个微博都有新的消息通知,新的微博、评论、粉丝、@消息等等在各个模块的图标上都有提示,功能上无太大差异。 下面,我们从用户体验方面,通过注册流程、发表内容和交互细节几个方面来进行对比。 新浪:新浪微博支持新浪博客、新浪UC、新浪邮箱账号、直接登录,在注册时,需要填写注册邮箱、密码和验证码三类选项,注册完之后到邮箱点击验证连接激活。 初次登录新浪微博需要设置昵称、居住地、姓名三项信息,昵称不允许重复,不允许使用“非法字符”。例如假设一位用户名“王刚”,而王刚这个名字已经被演员王刚注册,则该用户无法使用自己喜欢的昵称;假设以为用户名为“王新浪”,因含有“新浪”字样也无法注册。 网易:注册网易微博流程同样是填写注册邮箱、密码和验证码三类选项,注册完成后到邮箱点击验证链接激活。初次登录网易微博需要设置名字和个性网址。名字也与新浪相同,不允许重复。一个细节是,名字中输入不当字符如含有“网易”字样,无论怎样变换系统都提示“名字有人用了”,与事实不符。 搜狐:搜狐微博支持搜狐博客、校友录、搜狐邮箱、QQ等登陆。 初次登录搜狐微博需要设置昵称、性别、第一条微博。昵称设置相比新浪、网易略微宽松一些,含有“搜狐”等字样的昵称不会作为非法字符,但昵称同样具有唯一性。 腾讯:腾讯微博注册将和QQ号码注册统一,点击注册将跳转到QQ号码注 册页面。 发布微博:发布信息,是微博最最核心的应用,其重要性不言而喻。我 们发现四家微博在发布信息上有较大差异,其中最明显的是搜狐微博与网易微博在字数限制上并没有按照传统的140字来设定。在多媒体方面新浪微博则更为 丰富。 新浪:

聚类分析的案例分析(推荐文档)

《应用多元统计分析》 ——报告 班级: 学号: 姓名:

聚类分析的案例分析 摘要 本文主要用SPSS软件对实验数据运用系统聚类法和K均值聚类法进行聚类分析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的 气体浓度的情况,从而判断出这几个地区的污染程度。 经过聚类分析可以得到,样本6这一地区的气体浓度值最高,污染程度是最严重的,样本3和样本4气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。 关键词:SPSS软件聚类分析学生成绩

一、数学模型 聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相 似性。可以根据这些相似性把相似程度较高的归为一类,从而对其总体进行分析和总结,判断其之间的差距。 系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。 K 均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。 二、数据来源 《应用多元统计分析》第一版164 页第6 题 我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的 8 个大气取样点,在固定的时间点每日 4 次抽取6 种大气样本,测定其中包含的8 个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及 大气污染气体进行分类。 三、建立数学模型 一、运行过程

面向微博热门话题的主客观分类方法研究

面向微博热门话题的主客观分类方法研究 【摘要】:随着Web2.0的快速发展,互联网的载体已经不仅仅是单一的电脑,手机、平板电脑等移动终端已经悄然进入了人们的视野。人们获取、分享信息也不单单通过社区、博客,而是能够随时随地发表微博,实现即时分享。微博用户的大幅度增长吸引了一大批学者对其发表言论进行研究,面向微博热门话题的主客观分类问题是其中的重要课题之一。到目前为止,国内外学者主要针对无话题的微博文本进行研究,而面向热门话题的微博文本研究尚处于起步阶段。热门话题下的微博言论文本具有话题分散性,即用户发表的言论常常与当前的热门话题不相关,这个现象会导致针对微博热门话题的主客观分类方法准确率不高。基于此,本文将面向微博热门话题的主客观分类问题看成是两个子问题——话题相关性分类子问题和主客观分类子问题,对两个子问题独立建模,再使用Logistic回归对两个结果集建模,得出当前热门话题下的主观性观点表达。本文的主要研究内容如下:(1)研究了基于同义词词林的话题相关度计算方法。在话题相关性分类子问题中,主要研究当前微博语料是否与所关注的热门话题相关,如何度量两者之间的相关程度是此问题的关键之处。本文以同义词词林扩展版作为资源,通过计算当前词与热门话题词的距离来刻画两者之间相关程度,以此来简化话题相关度的计算方法。(2)研究了基于汉语框架语义网生成有效观点词集的方法。在主客观分类判断子问题中,主要是判断当前微博是否属于主观观点表达。其中构建有效的观点词集是

该问题中重要的步骤之一。本文利用汉语框架语义网中框架间关系和词元,以“观点”框架内词元为种子集,构建了有效的观点词集。(3)研究了将话题相关性模型结果和主客观分类模型结果统一的方法,使用Logistic回归模型将两重结果统一在一个模型下,得到热门话题下的主观文本。(4)本文使用无话题相关性分类的主客观分类方法作为Baseline,并与多分类主客观分类方法与分步主客观分类方法进行对比分析。分析了使用Logistic回归模型并行融合话题相关性分类结果与主客观分类结果的重要性。【关键词】:热门话题主客观分类话题相关性分类Logistic回归模型 【学位授予单位】:山西大学 【学位级别】:硕士 【学位授予年份】:2013 【分类号】:TP393.092;TP391.1 【目录】:摘要4-6Contents6-8中文摘要8-9ABSTRACT9-11第一章绪论11-171.1研究背景及意义11-131.2国内外研究现状13-141.3本文研究内容14-151.4论文组织结构15-17第二章问题描述及相关资源17-232.1面向微博热门话题的主客观分类问题描述17-182.1.1话题相关性分类子问题描述182.1.2主客观分类子问题描述182.2相关资源18-212.2.1同义词词林及扩展版18-192.2.2汉语框架语义网19-212.3

基于划分的聚类算法

文献阅读报告 课程名称:《模式识别》课程编号:题目: 基于划分的聚类算法 研究生姓名: 学号: 论文评语: 成绩: 任课教师: 评阅日期:

基于划分的聚类算法 2016-11-20 摘要: 聚类分析是数据挖掘的一个重要研究分支,已经提出了许多聚类算法,划分方法是其中之一。基于划分的聚类算法就是用统计分析的方法研究分类问题。本文介绍了聚类的定义以及聚类算法的种类,详细阐述了K 均值聚类算法和K中心点聚类算法的基本原理并对他们的性能进行分析,对近年来各学者对基于划分的聚类算法的研究现状进行梳理,对其具体应用实例作简要介绍。 关键字:数据挖掘;聚类;K 均值聚类算法;K 中心点聚类算法;K众数算法;k多层次聚类算法 Partitional clustering algorithms Abstract:Clustering analysis is an important branch of data mining, many clustering algorithms have been proposed, the dividing method is one of them. Based on the clustering algorithm is divided into classification problems using the method of statistical analysis. In this paper,we introduces the definition of clustering and type of clustering algorithm,the basic principle of k-means clustering algorithm and K-center clustering algorithm are expounded in detail,we also analyze their performance,the scholars in recent years the study of the clustering algorithm based on partitioning present situation has carried on the comb,make a brief introduction to its specific application instance. Key words:Data mining;clustering;k-means clustering algorithms;k-medoids clustering algorithms;k-modes clustering algorithms ;k-prototype clustering algorithms 1.引言 把单个的数据对象的集合划分为相类似的样本组成的多个簇或多个类的过程,这就叫聚类[1]。在无监督的情况下,具有独立的学习能力,这就是聚类。将数据空间中的所有数据点分别划分到不同的类中,相近距离的划分到相同类,较远距离的划分到不同类,这就是聚类的目的.聚类分析常作为一种数据的预处理过程被用于许多应用当中,它是更深一步分析数据、处理数据的基础。人们通过聚类分析这一最有效的手段来认识事物、探索事物之间的内在联系,而且,关联规则等分析算法的预处理步骤也可以用它。现在,在气象分析中,在图像处理时,在模式识别领域,在食品检验过程中,都有用到它。随着现代科技水平的不断提高、网络的迅猛发展、计算机技术的不断改革和创新,大批量的数据不断涌现。怎样从这些数据中提取有意义的信息成为人们关注的问题。这对聚类分析技术来说无疑是个巨大的挑战。只有具有处理高维的数据的能力的聚类算法才能解决该问题. 研究者们开始设计各种聚类算法,于是,基于划分的聚类算法便应运而生,而且,取得了很好的效果。 2.正文 1 聚类概述

聚类算法比较

聚类算法: 1. 划分法:K-MEANS算法、K-M EDOIDS算法、CLARANS算法; 1)K-means 算法: 基本思想是初始随机给定K个簇中心,按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心,从而确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。 K-Means聚类算法主要分为三个步骤: (1)第一步是为待聚类的点寻找聚类中心 (2)第二步是计算每个点到聚类中心的距离,将每个点聚类到离该点最近的聚类中去 (3)第三步是计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心 反复执行(2)、(3),直到聚类中心不再进行大范围移动或者聚类次数达到要求为止 下图展示了对n个样本点进行K-means聚类的效果,这里k取2: (a)未聚类的初始点集 (b)随机选取两个点作为聚类中心 (c)计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去 (d)计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心 (e)重复(c),计算每个点到聚类中心的距离,并聚类到离该点最近的聚类中去 (f)重复(d),计算每个聚类中所有点的坐标平均值,并将这个平均值作为新的聚类中心 优点: 1.算法快速、简单; 2.对大数据集有较高的效率并且是可伸缩性的; 3.时间复杂度近于线性,而且适合挖掘大规模数据集。 缺点: 1. 在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。 2. 在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响。

聚类分析实例分析题

5.2酿酒葡萄的等级划分 5.2.1葡萄酒的质量分类 由问题1中我们得知,第二组评酒员的的评价结果更为可信,所以我们通过第二组评酒员对于酒的评分做出处理。我们通过excel计算出每位评酒员对每支酒的总分,然后计算出每支酒的10个分数的平均值,作为总的对于这支酒的等级评价。 通过国际酿酒工会对于葡萄酒的分级,以百分制标准评级,总共评出了六个级别(见表5)。 在问题2的计算中,我们求出了各支酒的分数,考虑到所有分数在区间[61.6,81.5]波动,以原等级表分级,结果将会很模糊,不能分得比较清晰。为此我们需要进一步细化等级。为此我们重新细化出5个等级,为了方便计算,我们还对等级进行降序数字等级(见表6)。 通过对数据的预处理,我们得到了一个新的关于葡萄酒的分级表格(见表7):

考虑到葡萄酒的质量与酿酒葡萄间有比较之间的关系,我们将保留葡萄酒质量对于酿酒葡萄的影响,先单纯从酿酒葡萄的理化指标对酿酒葡萄进行分类,然后在通过葡萄酒质量对酿酒葡萄质量的优劣进一步进行划分。 5.2.2建立模型 在通过酿酒葡萄的理化指标对酿酒葡萄分类的过程,我们用到了聚类分析方法中的ward 最小方差法,又叫做离差平方和法。 聚类分析是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。为了将样品进行分类,就需要研究样品之间关系。这里的最小方差法的基本思想就是将一个样品看作P 维空间的一个点,并在空间的定义距离,距离较近的点归为一类;距离较远的点归为不同的类。面对现在的问题,我们不知道元素的分类,连要分成几类都不知道。现在我们将用SAS 系统里面的stepdisc 和cluster 过程完成判别分析和聚类分析,最终确定元素对象的分类问题。 建立数据阵,具体数学表示为: 1111...............m n nm X X X X X ????=?????? (5.2.1) 式中,行向量1(,...,)i i im X x x =表示第i 个样品; 列向量1(,...,)'j j nj X x x =’,表示第j 项指标。(i=1,2,…,n;j=1,2,…m) 接下来我们将要对数据进行变化,以便于我们比较和消除纲量。在此我们用了使用最广范的方法,ward 最小方差法。其中用到了类间距离来进行比较,定义为: 2||||/(1/1/)kl k l k l D X X n n =-+ (5.2.2) Ward 方法并类时总是使得并类导致的类内离差平方和增量最小。 系统聚类数的确定。在聚类分析中,系统聚类最终得到的一个聚类树,如何确定类的个数,这是一个十分困难但又必须解决的问题;因为分类本身就没有一定标准,人们可以从不同的角度给出不同的分类。在实际应用中常使用下面几种方法确定类的个数。由适当的阀值确定,此处阀值为kl D 。

微博栏目常用分类

微博分类: 微博分类 1、早安中小企业:励志优美的短句 2、干货分享:经验交流、前沿分析最新科技咨询等 3、项目申报:项目申报相关咨询 4、政策解读:简要分析信息、推广网站信息链接 5、融资信息:融资技巧、资讯等 6、每日一笑:简短笑话 7、号外号外:免费培训、会议会展 8、【今日关注】:简要发布我网站时讯信息附带链接 1.早安中小企 2.干货分享 3.县域经济 4.喜讯 5.融资 6.创业者 7.产业 8.创业故事 9.信息化建设 10.财经 11. 创业分享 12. 数据 13.园区新闻 14.创业资讯 15.创业干货 16.企业关注 17.税收优惠 18.农业 19.地市经济 20.水果产业 21.关注 22.活动报名 23.地方政策 24.午间资讯

25.电商资讯 26.早间新闻 27.资讯 28. 农产品电商 29.看图说话 30.管理干货 31. 大佬生意经 32.物流动态 33 . 焦点新闻 34.下午资讯 35.本土行业 36.产业协会 37.科技 38.动态 39.财务干货 40.政策解读 41.项目 42.产业与产品 43. 农民就业创业 44.号外 45.旅游经济 46.新闻动态 47.投资资讯 48 .政策补贴 49.下午资讯 50.扶持资金 51.企业注册资本登 记制度 52.职称申报 53.融资商学院 54.政策文件 55.案例 56.消息 57.行动 58.财税资讯 59.企业家话语 60.展会资讯 61.观点 62.金融信贷 63 时事 64.通知 65.企业纳税 66.企业服务 67.房地产 68.融资体系 69.论坛 70.社会融资 71.信贷政策

5聚类之层次聚类基于划分的聚类(k

5 聚类之层次聚类基于划分的聚类(k 、层次聚类 1、层次聚类的原理及分类1)层次法(Hierarchicalmethods )先计算样本之间的距离。 每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并, 直到合成了一个类。其中类与类的距离的计算方法有:最短 距离法,最长距离法,中间距离法,类平均法等。比如最短 距离法,将类与类的距离定义为类与类之间样本的最短距离。 层次聚类算法根据层次分解的顺序分为:自下底向上和自上向下,即凝聚的层次聚类算法和分裂的层次聚类算法 agglomerative 和divisive ),也可以理解为自下而上法 bottom-up )和自上而下法(top-down )。自下而上法就是 开始每个个体(object )都是一个类,然后根据linkage 寻找同类,最后形成一个“类” 。自上而下法就是反过来, 开始所有个体都属于一个“类”,然后根据linkage 排除异己,劣之分,只是在实际应用的时候要根据数据特点以及你想要的“类”的个数,来考虑是自上而下更快还是自下而上更快。 最后每个个体都成为一个“类” 。这两种路方法没有孰优孰 至于根据Linkage 判断“类”的方法就是最短距离法、最长

距离法、中间距离法、类平均法等等(其中类平均法往往被 认为是最常用也最好用的方法,一方面因为其良好的单调性,另一方面因为其空间扩张/浓缩的程度适中)。为弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。 2)Hierarchical methods 中比较新的算法有BIRCH( Balanced Iterative Reducingand Clustering Using Hierarchies 利用层次方 法的平衡迭代规约和聚类)主要是在数据量很大的时候使用,而且数据类型是numerical 。首先利用树的结构对对象集进行划分,然后再利用其它聚类方法对这些聚类进行优化; ROCK ( A Hierarchical ClusteringAlgorithm for Categorical Attributes )主要用在categorical 的数据类型上;Chameleon(A Hierarchical Clustering AlgorithmUsing Dynamic Modeling )里用到的linkage 是kNN (k-nearest-neighbor)算法,并以此构建一个graph,Chameleon 的聚类效果被认为非常强大,比BIRCH 好用,但运算复杂度很高,0(22)。 2、层次聚类的流程 凝聚型层次聚类的策略是先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到所有对象都在一个簇中,或者某个终结条件被满足。绝大多数层次聚类属于凝聚

各栏目微博示例

所以我们的微博可以按模式发送: #科聚·视窗#【文章题目】内容提要+个人感想+@相应的社团组织(如有网络链接,如发在博客的文章,可在正文后面加上链接地址,不明白此话啥意思的请认真观察下面所发的一些微博例子)+相应图片 读报栏目模式示例:

文艺类的读报: 时评 名家典例 注意要在前面加上#时评# 艺苑示例 #乐享# 资讯型示例: #乐享#

上面是一种发博形式,要注意前缀必须是我们自己的栏目名#乐享#,正文必须是我们自己的原创语言,可以有上面那种网络链接,最好能有其中一些曲目名的音乐链接,在新浪和腾讯微博发送菜单上都有“音乐”链接使用。 感觉类实例: 以上示例说的就是一种音乐带来的感觉,不要觉得那是从QQ音乐官方发出来的就遥不可及,我们完全可以也说得这么好。也可以在微博中附上一幅上面那种很有感觉的图片,像上面那条中的#晚安#这些东西就不用了。 示例下方就是音乐链接。 大家发音乐类微博时可以在正文中联系一下歌手,为什么ta 会唱出这种感觉的歌,或者说一下这个歌手一些鲜为人知的好处,然后带出ta的音乐链接这样子。 最好还是能有关于音乐的感受写上去,如果能结合自己个人经历也很不错,比如说到《那些年》的时候,可以说 “回到教室座位前后,故意讨你温柔的骂”记得当年初中的同桌真的很喜欢总是拉前面女生的马尾惹她骂,可是她一有什么小病小痛,最紧张的也是他。《那些年》轻易地就勾起了我们那些年的回忆,屏幕前我们不知不觉地成为它的和声。同桌的抽屉里现在还压着她的照片,遗憾经过那些年的洗涮变成一种美丽。 或者怀旧一点,讲一下某个粤剧经典的历史故事也可以营造文化氛围也不错。 影谈示例: #影·谈#当凌雁秋在观众眼中以金镶玉的替身存在,延续着她对周淮安的追随,又继承着邱莫言的气质品性。一出场就用西夏语高声言笑,大方打架的布鲁都大胆地对风里刀说着“我喜欢你”,又搂又抱,豪放泼辣之处活脱脱一个镶玉转世。这部《新龙门客栈》的续集里,一切注定似的在延续,真爱是永恒不变的主题 (说的是《龙门飞甲》。不一定说得好,只是一种示例。)

聚类分析案例

SPSS软件操作实例——某移动公司客户细分模型 数据准备:数据来源于telco.sav,如图1所示,Customer_ID表示客户编号,Peak_mins表示工作日上班时期电话时长,OffPeak_mins表示工作日下班时期电话时长等。 图1 telco.sav数据 分析目的:对移动手机用户进行细分,了解不同用户群体的消费习惯,以更好的对其进行定制性的业务推销,所以需要运用聚类分析。 操作步骤: 1,从菜单中选择【文件】——【打开】——【数据】,在打开数据窗口中选择数据位置以及文件类型,将数据telco.sav导入SPSS软件中,如图2所示。 图2 打开数据菜单选项 2,从菜单中选择【分析】——【描述统计】——【描述】,然后在描述性窗口中,将需要标准化的变量选到右边的“变量列表”,勾选“将标准化得分另存为变量”,点确定,如图3所示。

图3 数据标准化 3,从菜单中选择【分析】——【分类】——【K-均值聚类】,在K-均值聚类分析窗口中将标准化之后的结果选入右边“变量列表”,客户编号选入“个案标记依据”,聚类数改为5。点击迭代按钮,在迭代窗口将最大迭代次数改为100,点击继续。点击保存按钮,在保存窗口勾选“聚类成员”、“与聚类中心的距离”,点击继续。点击选项按钮,在选项窗口勾选“ANOV A表”、“每个个案的聚类信息”,点击继续。点击确定按钮,运行聚类分析,如图4所示。 图4 聚类分析操作

由最终聚类中心表可得最终分成的5个类它们各自的均值。 第一类:依据总通话时间长,上班通话时间长,国际通话时间长等特征,将第一类命名为高端商用客户。 第二类:依据其在各项指标中均较低,将第二类命名为不常使用客户。 第三类:依据总通话和上班通话时间居中等特征,将第三类命名为中端商用客户。第四类:依据下班通话时间最长等特征,将第四类命名为日常客户。 第五类:依据平均每次通话时间最长等特征,将第五类命名为长聊客户。 由ANOVA表可根据F值大小近似得到哪些变量对聚类有贡献,本例题中重要程度排序为:总通话时长>工作日上班时期电话时长>工作日下班时期电话时

微博栏目说明

微博栏目设置 (1)#校园新闻# 内容:我社学生记者被校园网首页的“校园快讯”和“新闻中心”采用的新闻稿发表形式:#校园新闻#【题目】+正文+校园网相关链接+新闻图片,对新闻的标题和正文可进行适度的重新编辑,以让微博上的新闻更抢眼 负责人:每天晚上负责管理QQ聊天账号的社委 (2)新一期校报出炉时通过微博发布专版和副刊上登载的我社学生记者作品,包括版面设计、文稿和图片 (3)#读报# 参照刊物:中国青年报、南都报系 形式:认真读报后,选择出其中的一篇或多篇文章进行点评。 点评时,先转播或分享中国青年报数字报、南都报系网站上的相关文章。如果文章有配图,可以一并转播及分享。 如果需要点评的内容较多,可以将重点点评的段落截图后作为该条微博的配图发表 内容要求:读报内容可以涉及各个方面,但是据此所发布的微博一定要有自己的看法。 看法少则点评一两句精到的话,看法多可以写多些,甚至使用腾讯微博的文图功能,发表一篇2000字以内的读后感,观点要清晰明确,如果字数较多,要注意内容的饱满。 评报时可以评内容,也可以重点评论报纸新闻的写法,比如记者用了什么手法感动人,如何排列新闻内容让新闻的意义得到提升等等。 (4)#时·评# 设置出发点:校媒记者除了应该熟练掌握校园新闻的报道外,还需要关注时事,训练时事敏感度,这两者是相互促进的;同时,校园新闻的写作可以通过对社会媒体时事的关注得到提高。对时事的评论是当下许多大学生的习惯或者爱好。我们的生活总会受最近发生的大事的影响,关注时事也是一种责任感,还可以提高我们的人文素养和思辨能力。 形式:由时评编辑小组的学生记者进行微博的编辑,所发微博为完全原创作品,用学生记者自己的话说对时事的看法,如果需要从网上寻找背景材料,可以在腾讯微博的“文图”功能上粘贴相关链接和选摘的材料中的几句话 (5)#艺苑# 形式:#艺苑#又再细分为#乐·享#、#影·谈#、#动漫·观#等3个栏目,分别涉及音乐、影视、动漫3方面的内容,主要以欣赏素材+短评的形式发表。 如果在学生记者中有合适的稿源,也可以增加舞蹈、更多种形式的美术作品的欣赏栏目。 内容:(1)#乐·享#——编辑从多个渠道获取理想的音乐或者MV后,发布上微博,并进行评论。说明自己推荐或分享一首歌,或是一段乐章的理由。 可以对音乐进行技术上的分析,也可以说音乐给自己带来的遐想和感觉。

相关文档