文档库 最新最全的文档下载
当前位置:文档库 › 利用准私密社交网络文本数据检测抑郁用户的可行性分析

利用准私密社交网络文本数据检测抑郁用户的可行性分析

利用准私密社交网络文本数据检测抑郁用户的可行性分析刘德喜1,2,邱家洪1,2,万常选1,2,刘喜平1,2,钟敏娟1,2,郭海峰3,邓松4

【摘要】社交媒体的发展为抑郁用户的检测提供了一条新的途径。已有的相关研究通常是利用用户在Twitter、微博等社交网络平台上的用户行为数据或公开发表的文本内容,较少有利用微信朋友圈、QQ空间这种相对比较私密的社交网络数据。直观地,这类准私密社交网络数据更能反映用户的心理健康状况。该文主要讨论利用准私密社交网络文本数据检测抑郁用户的可行性,包括训练样本的选择、特征量化方法、检测模型选择和不同文本特征下的模型分类效果等。实验表明,采用平衡高低分组的方法选择样本比非平衡高低分组样本和离散化的高低分组样本训练的分类器要好;利用Z-score标准化的特征量化方法比直接使用频次或归一化频率要好;随机梯度下降模型SGD较支持向量机SVM等其他用于对比的分类模型要好。实验还发现,相对于词袋、词向量等文本特征,主题特征有较好的效果,可以使社交网络用户抑郁检测模型的F值达到0.753,而对抑郁用户的检测精度达到0.813。

【期刊名称】中文信息学报

【年(卷),期】2018(032)009

【总页数】10

【关键词】准私密社交网络文本;抑郁用户检测;可行性分析

定稿日期:2017-10-29

基金项目:国家自然科学基金(61762042,61363039,61562032,61662027,61462037);江西省科技落地计划(KJLD14035);江西省自然科

相关文档