龙源期刊网 https://www.wendangku.net/doc/779778823.html,
基于CNKI的大数据研究现状的可视化分析作者:刘祥鹏夏艳萍
来源:《科教导刊·电子版》2015年第28期
摘要以2007—2015年CNKI数据库收录的大数据研究文献为分析对象,利用SPSS、Ucinet等数据处理软件,对大数据研究的文献数量、机构单位、基金资助、文献类别、研究热点等进行了分析,以可视化的形式展现了目前大数据中文研究现状和发展趋势。
关键词大数据 CNKI 可视化研究现状
中图分类号:G353.1 文献标识码:A
0引言
目前对大数据研究现状综述的中文文献较少,本文以2007-2015年中国知网CNKI收录的有关大数据研究的相关文献为对象,通过Ucinet[1]、SPSS等数据处理工具进行了可视化分析,为相关研究和应用提供参考。
1数据来源与研究方法
本文在CNKI检索区域主题字段、题名段、关键词段中分别输入“大数据”,时间字段起始为2007年1月1日,截止时间为2015年8月1日,主题字段和题名、关键词间采用“与”运算,题名和关键词间采用“或”运算,检索完后经简单处理共获得到4707篇有效文献,对相关字段进行统计整理。
2大数据研究文献的时间分布
衡量某领域发展的重要指标为学术论文数量的变化,它在一定程度上反映了该领域研究的基本水平和发展规律,绘制相应的分布曲线,为评价该领域所处的阶段具有重要意义,从大数据研究的中文文献分布(如图1所示)情况看,从2013年随着舍恩伯格的《大数据时代》一书的热销,研究热度呈现高速上升,2014年较2013增长了2.5倍,2015年截止到8月1日已经有1808篇文献发表,按照目前的趋势预计到年底将超过3000篇。随着我国对“互联网+”关注的升温,大数据相关研究论文数量也会呈现稳定发展的趋势。
3大数据研究文献的空间分布
3.1机构单位分布
在检索到的4707篇文献共涉及526个,发表论文数量在14篇及以上的机构单位有40
个,发表论文在25篇及其以上的机构共有14个,如表1所示,由高产发文机构可以看出在大