文档库 最新最全的文档下载
当前位置:文档库 › 作为科学政策分析工具的文献计量指标

作为科学政策分析工具的文献计量指标

作为科学政策分析工具的文献计量指标
作为科学政策分析工具的文献计量指标

计量研究方法

計量研究方法 Quantitative Research Methods 陳建州 南華大學教育社會學研究所與社會學研究所 計量研究方法是社會學重要的分析方法之一。本課程將介紹量化研究的特性及常見的分析方法,並釐清重要觀念,以避免統計的誤用與濫 用,使學習者能正確運用,並能獨立完成研究。 課程進度: 第一週2008.09.18 課程簡介;選定主題 第二週2008.09.25 概念化、操作化與測量 陳文俊譯(2005)。社會科學研究方法。第五章「概念化、操作化及測量」。 載於Earl Babbie原著,社會科學研究方法(The Practice of Social Research),頁161-205。台北:雙葉。 第三週2008.10.02 指數、量表及分類法 陳文俊譯(2005)。社會科學研究方法。第六章「指數、量表及分類法」。載於Earl Babbie原著,社會科學研究方法(The Practice of Social Research),頁207-243。台北:雙葉。

第四週2008.10.09 抽樣、問卷設計 陳文俊譯(2005)。社會科學研究方法。第七章「抽樣的邏輯」。載於Earl Babbie 原著,社會科學研究方法(The Practice of Social Research),頁 245-297。台北:雙葉。 陳文俊譯(2005)。社會科學研究方法。第九章「抽樣調查」。載於Earl Babbie 原著,社會科學研究方法(The Practice of Social Research),頁 329-382。台北:雙葉。 第五週2008.10.16 問卷處理與列表 實例示範。 第六週2008.10.23 抽樣分配、點估計、信賴區間 Chap 6-9, Wonnacott T. H. and R. J. Wonnacott (1990).Introductory statistics for business and economics. New York : John Wiley & Sons. 江建良(1999)。第8章「推論(一)--估機」。統計學。頁231-280。台北:龍騰。 江建良(1999)。第9章「推論(二)--假設檢定」。統計學。頁285-343。台北:龍騰。 第七週2008.10.30 迴歸分析Ⅰ:迴歸模型的假設條件與解釋 Chap. 1-2, Wonnacott, Thomas H and Ronald J. Wonacott. 1981. Regression: A Second Course in Statistics.FL: Krieger Publishing Company. 鄭旭智、張育哲、潘倩玉、林克明譯(2002)。第二章「連續結果變項—線

文献计量学综述

文献计量学综述 一、起源及发展 早在20世纪初,人们已经开始对文献进行定量化研究,但是当时文献计量学并没有作为一门独立的学科而存在。直到1969年,英国著名情报学家阿伦.普理查德首次提出术语“Bibliometrics”,这一术语的出现标志着文献计量学的正式诞生。 三阶段:萌芽、发展和分化 萌芽(1917-1933)这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。这些研究都为文献计量学的诞生与后期的发展奠定了基础 发展(1934- 1960)年注重理论研究与规律发现,著名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到 成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。 迁移衍生: 专利计量学 文献计量学网络计量学 政策计量学 二、概念界定 文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法, 研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。目前,文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。学科交叉使得文献计量研究内容体系日益丰富。数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。 三、三大定律 布拉德福定律该定律描述文献分布规律,利用刊载某专业论文的数量来确定该专业的核心期刊,应用于指导文献情报工作和科学评价。 齐普夫定律该定律用以统计文献中的词频,通过文献的词频分析可确定学科或行业的研究热点和研究趋势。 洛特卡定律该定律描述著者人数与所著论文之间的关系。探讨了科学论文著者分布平衡的规律,在宏观的科学著作活动中,少数作者写出了大量文章,大多数人的著作还是很少的。依此定律推论出“杰出科学家数目仅是科学家数目的平方根”。 从表面上三大定律的统计对象各异,其结论也不尽相同,但是它们的研究方法存在着某些相似之处,事实上它们属于同一个分布体系。该体系被称为布-齐-洛体系。如果把期刊、字词、书籍、文章等称为信息发生源,将作品、论文、字词的出现、书籍的使用、文章的被引等称为产物,那么文献计量学的规律可认为是发生源数量与产物数量之间存在的函数关系。

文献计量学复习要点

《文献计量学》复习要点(初稿) 一、题型 1、填空题(共10分,每空1分) 2、选择题(共20分,每空2分)(不定项) 3、问答题(共50分,每题10分) 4、计算题(共20分,每题10分) 二、复习要点 1、文献计量学、统计目录学各是谁提出来的。 文献计量学起源于英国学者休姆(E .W .Hulme)于1923年提出的统计书目学(statistical bibliography )。1969年,英国学者普里查德(A .Pritchard)提出用文献计量学命名这个领域的研究,以替代统计书目学。 2、科学文献数量增长的规律是由科学发展的客观过程决定的,而科学发展的实际过程主要受哪两种因素的制约? 科学文献数量增长的规律是由科学发展的客观过程决定的,而科学发展的实际过程主要受两种因素的制约:一是科学自身固有的发展规律,二是科学所处的环境条件。 3、半衰期的定义。比较普赖斯指数和半衰期。普赖斯指数的计算。 物理学中的半衰期:任何放射性物质都以这样的方式衰变:在相等的时间间隔内它按相同的比率减少。减少到一半量的时间间隔就是“半衰期”,也是表示这种物质的放射性特性。 文献半衰期:某学科(专业)现时正在被利用的全部文献中的一半的出版年限。它是衡量文献老化的指标之一。 “普赖斯指数”和“半衰期”是既有联系又有区别的两个衡量科学文献老化的指标。半衰期是指某一学科或专业领域的文献总和而言的;而普赖斯指数既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者的文章的老化特点。一般而言,如果某一学科或专业的文献的普赖斯指数越大,则半衰期就越短,说明其老化速度就越快。 “普赖斯指数”:就是在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。其计算公式为: 5P 100%= ?出版年限不超过年的被引文献数量 被引文献总量 4、从文献利用的角度来说,科学文献的老化有以下哪几种情形? 有五种情形: ① 献包含的信息失效。如被证明是不可靠的、或者是错误的。②文献包含的知识已经被人 们广泛接受而不再被提及③文献被新的文献取代④研究兴趣的下降及研究转移⑤信息不通而不被引用致使老化。 5、文献信息老化的影响因素。 文献的老化要受到许多因素的影响,其机理可从以下5个方面来分析: (1) 文献的增长 在文献的动态规律中,增长与老化是一个事物的两个方面,它们从不同的方面来阐述

测量系统分析方法82638

测量系统分析(MSA)方法 测量系统分析(MSA)方法**** 1.目的 对测量系统变差进行分析评估,以确定测量系统是否满足规定的要求,确保测量数据的质量。 2.范围 适用于本公司用以证实产品符合规定要求的所有测量系统分析管理。 3.职责 质管部负责测量系统分析的归口管理; 公司计量室负责每年对公司在用测量系统进行一次全面的分析; 各分公司(分厂)质检科负责新产品开发时测量系统分析的具体实施。 4.术语解释 测量系统(Measurement system):用来对被测特性赋值的操作、程序、量具、设备以及操作人员的集合,用来获得测量结果的整个过程。 偏倚(Bias):指测量结果的观测平均值与基准值的差值。 稳定性(Stability):指测量系统在某持续时间内测量同一基准或零件的单一特性时获得的测量平均值总变差,即偏倚随时间的增量。 重复性:重复性(Repeatability)是指由同一位检验员,采用同一量具,多次测量同一产品的同一质量特性时获得的测量值的变差。 再现性: 再现性(Reproductivity) 是指由不同检验员用同一量具,多次测量同一产品的同一质量特性时获得的测量平均值的变差。 分辨率(Resolution):测量系统检出并如实指示被测特性中极小变化的能力。 可视分辨率(Apparent Resolution):测量仪器的最小增量的大小,如卡尺的可视分辨率为。有效分辨率(Effective Resolution):考虑整个测量系统变差时的数据等级大小。用测量系统变差的置信区间长度将制造过程变差(6δ)(或公差)划分的等级数量来表示。关于有效分辨率,在99%置信水平时其标准估计值为GR&R。 分辨力(Discrimination):对于单个读数系统,它是可视和有效分辨率中较差的。 盲测:指在实际测量环境中,检验员事先不知正在对该测量系统进行分析,也不知道所测为那一只产品的条件下,获得的测量结果。 计量型与计数型测量系统:测量系统测量结果可用具体的连续的数值来表述,这样的测量系

文献计量学实务

第三章文献计量学实务 (1) 第一节Web of Science (1) 第二节运用Excel (2) No.1 文章类型 (5) No.2 语言 (6) No.3 期刊 (6) No.4文章页数 (6) 参考文献数 (6) No.5国家分析 (6) No.7国家分析 (9) No.6作者分析 (11) No.7成长趋势 (12) 影响因子 (13) 作者关键词 (13) 研究领域 (14) 文献计量模式分析 (14) 被引用率 (14) 第三节 (14) 第四节 (15) 第五节 (15) 第三章文献计量学实务 第一节Web of Science 进行搜索: 在search框内敲入所需要查找的关键词,不同关键词间用and或or连接。如通常格式可为:(XX or XX or XX)and XX*。*可要可不要,表示后续内容可任意。点击search。 (如:搜索吸附领域粘土的文献,可敲入:(adsorption or sorption) and clay*。点击Refine your results下的Subject Categories从众多领域中选出所需要关注的领域内的文章,点击VIEW RECORDS。对所有文献进行了初步筛选。 Add to marked list 在网页右下方Output Records:下的Records选择所需要输出的文献序号,ISI一词输出可以最多500篇, 所以我们通常选1-500,依次501——1000,等等。点击右下Add to marked list。此时网页整上方会出现有红勾的Add to marked list,点击。

Step 1. Select the fields to include in the output下选择所需要输出的数据项。通常我们做分析时候应选上除cited references和abstract外的所有项。这两项是由于内容较多,EXCEL 处理起来不便,所以通常不选。 Step 2. Select an option.我们需要选择的是Tab Delimited(Windows). 接下来很重要的一步是我们应在“Automatically delete selected records from the Marked List after output is complete.”前打勾,否则在后续输出时候会因对前面输出项目的记忆造成干扰。 点击SAVE TO FILE。在下个网页中会输出一个记事本(.txt)格式的文档,对其内容全选复制贴贴入新建EXCEL中,便自动输出各项数据。 此时可进行下一查找:直接点击BACK,然后RETURN 即可。需要注意的是在后续贴入EXCEL时,每次再贴入EXCEL的第一行都是标题,应该删除。 重复执行,最终便可得到我们所需领域的文献数据。 如果我们在电脑里安装有软件Reference Manager或者 EndNote,也可直接将文献输出其中进行管理。前面的操作基本雷同,只是再Add to marked list后Step 1. Select the fields to include in the output后所选项重点可变为选择Author(s),Title,Title,abstract*,keywords及times cited等所需项。Step 2. Select an option.我们需要选择的是 Field Tagged.然后在下面小方框打勾,再点击SAVE TO FILE。 第二节运用Excel 通过第一节我们对所需查找领域文献全部已经输出为EXCEL形式数据,接下来可对其进行整理分析。 (一)前期处理步骤: 1.首要的工作是保存好原始数据,在EXCEL里将其所在sheet命名为OD (original data的缩写),方便我们在后续处理工作中进行核对。 2.数据的初步处理,包括: (1)先从原始数据库中找到我们想要进行分析的部分保留,其它意义不大的可直接删除。新建一个sheet,将OD的全部数据复制过来,将其命名为D。可删除的列有:CA,SE,AB,EM,CR,PU,PI,PA,J9,JI,PD,VL,IS,PN,SU,SI,BP,EP,AR,DI,GA 。(注:各列title所代表的含义见附二。) (2)可将年份PY进行排列,如从按Z→A降序排序得2006→1995,按A→Z则相反。因为我们从WOS中所下当年的文献只是一部分,数据不完全,所以在分析

关于SCI中的科学计量指标

关于SCI中的科学计量指标 科学技术是第一生产力。科技成果和科技人材的重要评价工具——科学引文索引(SCI),是学术界众人皆知的,SCI(Science Citation Index )作为“中国看世界,世界看中国”的权威性科学引文分析工具和独特的文献检索工具,在我国科学研究和科技管理活动中已得到了广泛的应用。为了使我校科研人员进一步了解和认识SCI,我中心将有关引文分析法的知识概念介绍给广大师生,便大家参考。 A.科学引文索引 SCI 科学引文索引(Science Citation Index)简称SCI,创刊于己于1963年,是由美国人E.加菲尔德创立的美国科学情报研究所(Institute for Scientific Information,简称 ISI )编辑出版的。是一种国际性的、多学科的综合性索引,涉及的学科有数、理、化、农、林、医、生物学、生命科学、天文、地理、环境、材料、工程技术等自然科学等各学科。SCI从来源期刊数量来看可分为SCI和SCI-E。SCI是指来源期刊为3600种左右的SCI 印刷版和SCI光盘版。SCI-E的全称是 SCI-Expanded, 又称SCI Search,是SCI的扩展库,有来源期刊5600种,可通过国际连联机和国际互联网进行检索。书本式SCI分双月刊,年度累积本和多年度累积本等三种形式,内容都包括五部分:引文索引,专利引文索引.来源索引.机构索引和轮排主题索引。SCI不仅是一种大型的文献检索工具,而且是引文分析的极为重要的工具之一。 B.中国科学引文数据库 中国科学引文数据库(Chines Science Citation Database)简称CSCD,是国家自然科学基金委员会和中国科学院共同资助,由中国科学院文献情报中心研制的一个多功能的建大型数据库。CSCD 收录了国内出版的中英文科技术核心期刊582种,涉及数学、物理学、力学、化学、天文学、地球科学、生物科学、 农林科学、医药卫,生、工程技术、环境科学等领域。CSCD始建于1989年,目前已经累计了50万条来源数据库和30万条引文数据。该数据库可提供论著(期刊论文、专著、会议论文、学位论文、专利文献等)被引情况、期刊被引情况、机构或个人在核心期刊上发表论文情况的检索,是目前国内唯一能与 SCI接轨的数据库。 C.科学指标 科学指标是衡量科学实力的量化规定项目。目前各国有关科学事业的统计指标虽不尽相同,但通常的科学指标都包括:科学出版物的数量和类型、出版物的施引和受引的数量、授予各级学位的人员数量、政府科学基金的金额与力度、科学出版物使用语种的数量、申请与批准的专利数量、聘任工作的科学家数量等。上述这些指标常用来评价科学成果和科学生产能力等。 D.文献计量学

基于文献计量的我国信息可视化研究

一、引言 信息可视化就是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对抽象信息的认知。随着海量信息的猛增,信息可视化研究与应用也不断深化;诚然,信息可视化已成为提高信息产品质量、追求更高经济效益与社会效益的重要手段。为了解我国信息可视化研究状况,笔者对我国信息可视化研究文献进行计量分析,以期探索我国信息可视化研究的现状及趋势。 二、数据收集、整理及分析方法 关于数据的收集整理,本文以中国学术期刊网全文数据库(cnki)和重庆维普作为统计来源,从中筛选出样本文献。在选取样本时,主要采用“篇名=信息可视化or摘要=信息可视化”的检索策略,以精确查询的方式分别从两个数据库中提取1994年至2015年的文献作为研究数据。通过剔除无分析意义的文本、填补或删除数据项缺失的文本、合并重复的文本等操作,最终获得1548篇样本文献。 关于样本的分析,本文主要通过文献信息统计方法,并辅以内容分析法,从论文总量的变化趋势、核心作者、机构分布、高频词等方面对信息可视化领域的总体研究趋势、研究主体及研究主题进行统计分析。 三、总体研究趋势 首先,本文通过年度论文发表数量来分析信息可视化领域的总体研究趋势。从信息可视化领域文献数量增长趋势图(图1)中可看出,1998年之前的有关信息可视化研究成果较少,究其原因是由于信息可视化还未受到足够的重视,研究领域也较为局限,只是初步将科学可视化的研究成果应用于gis、管理信息系统等。而从1999年开始,信息可视化领域逐渐受到不同学科领域、甚至是国家的重视,有关该领域的研究成果不断涌现,虽然在2005、2010年该领域的文献量有所下降,但总体上,该领域的文献量呈快速增长的趋势,这从一定程度上反映了其受重视的程度。 四、研究主体分析 信息可视化领域的研究主体包括作者及所在机构。通过对核心作者及相应机构的分析,我们可以发现信息可视化领域的科研精英及核心研究力量。 (一)论文核心作者情况分析 信息可视化研究所涉及的核心作者及发文量也从另一个侧面反映出该研究的成熟程度。本文应用普赖斯的杰出科学家定理,来计算核心作者,公式如下: m=0.794(nmax)1/2式中m为论文篇数,nmax为统计样本中发文最多的作者的论文数,其中发文m篇以上的人即被定义为核心作者。本例中nmax为28,因此发文在6篇以上的作者为核心作者,共有21人。表1列出了这些核心作者以及它们的发文数、所在机构。 从上述分析可以看出,信息可视化领域的学者较多,然而高产作者群还未成型,该领域还处于发展阶段,需不断发展。 (二)论文机构分布情况分析 通过对机构进行统计分析,发现高校在信息可视化研究领域发挥着重要科研作用。虽然也有企业的参与,但比例很小,在602个机构中仅有61个企业,占总机构数的10.17%;而高校有344所,占总机构数的57.28%。表2所示为发文量排在前列的机构及其发文数,通过对照排在前列的发文机构和核心作者所属机构,可以发现,正是这样一大批杰出科技工作者的存在,使得他们所处的单位成为我国当前信息可视化研究的核心力量。 五、主要研究领域分析 关于研究领域的分析,本文主要采用内容分析法,关键词词频分析法、关键词共现网络图谱相结合的方式来锁定信息可视化的核心研究领域。

文献计量学

文献计量学 一.科技文献的增长规律 什么是科学指标 科学指标(Scientific indicators)是指人类科研活动的数量研究首先应确定的定量对象。 科学指标的类型 - 人员与机构的数量。其中人员数量包括科学工作者、工程师、教师和学生的数量等。机构数量是指各类科研院所、学会及高等学校的数量。 - 科研成果的数量。其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。 - 科研过程及成果记录载体的数量。其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。 - 科研资金投入的数量。主要指直接投入于理论与应用研究的资金数量。 文献指标使用最为频繁,主要原因: - 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。 - 与其他指标相比,科技文献数量巨大、易于收集。这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。 - 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。 文献量度指标 1)绝对值指标,是表示文献数量多少的指标。 2)相对值指标,是表示不同部分文献的数量比例的。 3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为 规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研 究。 4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非 规则曲线,难以用某种函数来描述。 文献指数增长模型 文献指数增长规律 文献指数增长规律的局限性 (1)科学文献并不总是按指数函数关系增长。普赖斯指数增长模型与所研究的文献的学科和时间有关。所研究的学科范围越广泛,符合指数规律的时间就越长。 (2)指数增长规律不能预测文献的未来增长趋势。这就是说,随着时间的推移,科学文献的增量会趋向无穷大。这显然是不符合客观规律的。 文献指数增长规律存在局限的原因:

《Information Systems Research》1998~2017文献计量分析 —基于Citespace可视图谱

Advances in Social Sciences 社会科学前沿, 2018, 7(9), 1521-1530 Published Online September 2018 in Hans. https://www.wendangku.net/doc/fa11658354.html,/journal/ass https://https://www.wendangku.net/doc/fa11658354.html,/10.12677/ass.2018.79225 Bibliometrics Analysis of Information Systems Research during 1998~2017 —Based on Citespace Viewable Spectrum Bing Wu, Peng Li School of Economics and Management, Tongji University, Shanghai Received: Aug. 21st, 2018; accepted: Sep. 4th, 2018; published: Sep. 13th, 2018 Abstract The bibliometric analysis software Citespace is used to analyze the 747 articles in the “Informa-tion Systems Research” (ISR) journal from 1998 to 2017 from four aspects of literature output analysis, national cooperation network analysis, institutional cooperation network analysis and citation network clustering. The research results show that 1) according to the literature output analysis, the volume of document output of the ISR journal presents a volatility increase; 2) ac- cording to the analysis of the national cooperation network, the United States is the core node in the national cooperation network, and China needs to strengthen international cooperation the- reby to increase its influence; 3) in the cooperation network of research institutions, the top five universities in the literature output are all located in the United States, and according to the cen-trality analysis of the cooperation network, of the 12 institutions centered above 0.1, 9 institutions are located in the United States, and only Hong Kong city university in China is listed; in addition, the University of Texas at Dallas, Georgia Institute of Technology, National University of Singapore, and University of Texas at Austin have great potential in the research field of information systems; 4) according to citation network cluster analysis, the evolution of research hotspots can be divided into three phases: the focus of research in the field of information systems from 1998 to 2001 is information integration of enterprise applications, research spots during the period of 2002 to 2011 shift from the traditional organization to measure virtual organization, trust and influencing factors, and during the period 2012 to 2017of research topics shift from electronic word of mouth to knowledge dissemination in online knowledge community. Keywords Information Systems Research, Citespace, Cooperation Network, Central Analysis, Citation Network 《Information Systems Research》 1998~2017文献计量分析 —基于Citespace可视图谱

Bibexcel进行文献计量分析和引文分析快速指南

Bibexcel进行文献计量分析和引文分析快速指南 Alan Pilkington 【a.pilkington@https://www.wendangku.net/doc/fa11658354.html,】 概述与安装 本人使用Bibexcel业已多年,一直向大家推荐这个工具。但是,总是被人们问及如何上手使用,每次拿它进行分析的时候,总是要回头再次读一读自己手写的笔记。所以,我感到有必要就如何利用Bibexcel进行文献计量分析写出一个介绍性的东西,希望能给大家提供有用的信息。如果有任何建议或者发现任何错误,请通知我。 Bibexcel是一个用于文献计量分析、特别是引文分析的完美工具。用户可以在www.umu.se/inforsk网站上获得最新版本。其安装也十分简单,只需要把文件拷贝到硬盘的目录下即可,记住要把帮助文档也放在一个目录下。如果本指南不能满足你的需求请到该网站上浏览网页。 利用Bibexcel进行引文分析 第一步要有用于分析的来源数据。在引文分析中,来源数据就是从《科学引文索引》、《社会科学引文索引》中检索到来源文献。这两个数据库是商业数据库,是Web of Science或者ISI数据服务的组成部分,你所在的大学可能已经订购了它们。 《科学引文索引》和《社会科学引文索引》的使用 和平时一样,使用WOS/ISI检索功能检索到来源文献。在开始下载文献之前,必须了解你研究的内容。如果是对一种期刊的文章内容进行分析,其来源文献很容易确认下来。比较复杂的研究有可能是针对某一作者或者大学的某个系的文献记录。无论你的计划是什么,如果你是要从《科学引文索引》和《社会科学引文索引》中下载数据,下载和准备数据的步骤都是一样的: 在WOS,下载前需要对要下载的记录进行标记。然后开始下载所选择的论文,保证下载项目中包括论文的引文。可以通过“download for future analysis (为进一步分析而下载)”或者通过电子邮件发给自己,两种方式都生成纯文本文件。 如果下载的文献记录过多,下载中有的时候会导致数据传输超时。可以打开已经得到的文件查看(可以用Bibexcel中左上角的窗口找到文件,在左下角的窗口中可以看到文件的内容,也可以使用文本编辑器),找到文件的最后几行,看看是否存在HTML格式错误,如果有错误就表明下载中出现了超时。如果出现超时,解决的办法只有重新下载并注意减少下载记录的数量,比如减少检索的年限。如果是分段下载的,必须记住,在下一步分析之前,要把分离的文件重新组合到一起。用文本编辑器(如记事本)打开这些文件,剪切和粘贴,要保证在合成的文件的顶部只有一个文件头,而不是在已下载的每一个部分的开头: FN ISI Export Format VR 1.0 利用文本编辑器可以很容易查看纯文本中的数据,但是在使用诸如MS wor d之类的字处理器时候要当心,因为它们会增加字符、重新定义过的行格式和其他可以在后来引起问题的东西。

文献计量学专业复习资料

信息计量学复习预测参考 一.名词解释信息论:采用数理统计方法来研究信息的度量,传输和变换规律的一门学科。 信息计量学:采用定量方法来描述和研究情报(信息)的现象,过程和规律的一门学科。 期刊载文量:在给定时间内,期刊发表的全部论文数量。 期刊引证率:在给定时间内,期刊引证的全部参考文献数量。 期刊被引率:在给定时间内,期刊被引证的全部次数。平均引文率:反映期刊平均引文水平的统计量,以修正由于载文量大小不同带来的偏差。 知识发现:对数据中隐含的,以前不知道的,潜在的有用的信息的有价值的提取。 聚类:利用论文间的同被引关系把本来无外部联系的论文“聚”在一起而形成“类”的过程。引文聚类:引文之间都具有一定程度的学科专业相关性,根据专业属性,引文可聚集成为一个个聚类群体。 引文耦合:引证文 献通过其参考文献 (被引证文献)建 立的耦合关系。 文献同被引:指两 篇(或多篇)文献 同时被后来的一篇 或多篇论文所引 证,则称这两篇论 文具有“同被引“关 系。 期刊同被引:以期 刊为基本单元而建 立的同被引关系。 普赖斯定律:撰写 全部论文一半的高 产作者的数量,等 于全部科学作者总 数的平方根,这就 是普赖斯定律. 普赖斯指数:普赖 斯指数等于(出版 年限不超过5年的 被引文献数量/ 被引文献总量) X100% 文献信息流:在信 息计量学中,通常 把文献所含信息的 汇流称为文献信息 流。由于文献是信 息的最基本的载体 形式,文献信息流 是具有一系列主题 特征的科学文献的 集合,所以有时将 文献信息流简称为 文献流。 文献信息老化:科 学文献随其“年龄” 的增长,其内容日 益变得陈旧过时, 作为情报源的价值 不断减小,甚至完 全s丧失其利用价 值。过程观认为文 献老化是一种过 程,状态观认为文 献老化是一种状 态,过程状态辩证 观认为文献老化既 是一种过程又是一 种状态。 半衰期:某学科(专 业)现时尚在利用 的全部文献中较新 的一半是在多长一 段时间内发表的 (共时半衰期);该 学科一半文献失效 所经历的时间(历 时半衰期)。 引文分析法:就是 利用各种数学及统 计学的方法和比 较,归纳,抽象, 概括等逻辑方法, 对科学期刊,论文, 著者等各种分析对 象的引证与被引证 现象进行分析,以 便揭示其数量特征 和内在规律的一种 文献计量分析方 法。 核心期刊:指针对 某一学科或专业领 域来说,刊载大量 专业论文和利用率 较高的少数重要期 刊,就称为该学科 (专业)的核心期 刊。 影响因子:评价和 比较一种期刊相对 于同学科中其他期 刊影响力和重要性 的指标。影响因子 等于某刊前两年发 表论文在该年的被 引证次数除以该刊 前两年发表论文总 数。 即年指标:评价期 刊中的论文被引证 的速度,或者在同 一年内期刊中的论 文被引证的频率。 即年指标等于该刊 某年发表的论文在 当年的被引次数除 以当年发表论文的 篇数。 科技预测:根据预 测学的基本原理以 及科技发展的历史 和现状,对科学技 术的发展前景及其 对社会进步的影响 程度进行分析和推 测,从而得出预见 性的结论。 网络信息计量学: 是综合采用文献计 量,信息计量,统 计学方法,计算机 技术和网络技术等 对网络信息规律进 行计量分析的一门 科学。 格鲁斯下垂:布拉 德福曲线在进入直 线部分后,并非无 休止的直伸下去, 后来总要弯曲下 垂,因而使得布拉 德福的图形变为明 显的三个部分:上 升的曲线部分—直 线部分—弯曲下垂 部分。

23种计量学习方法

首先,我们对前面介绍的方法进行简单的归纳。我们把研究方法分为三个层面,即方法论、 一般方法和特殊方法。在一般方法层面又分为定量研究和定性研究方法, 而定量研究方法所 涵盖的内容最多,也是社会科学研究中使用最为广泛的方法, 规范的定性研究方法在中国使 用得并不多。这主要是因为中国学者对定性研究有自己的理解, 甚至把理论研究、 思辨研究 都称为定性研究,这是错误的。 定咸研究方注 定忤研禿方法 丄[ 丄 I ■「 ] 坨济学恃室方法 沁介学畅定方法 人瓷学騎定方法 研究方法的三个层次 F 面给出23种具体定量研究方法的名称: 10) 分层分析 11) 纵向分析 12) 路径分析 13) 结构方程模型 14) 项目评估方法 15) 系统动态学 16) 贝叶斯方法 17) 队列分析 18) 随机过程或马尔科夫链 多元数据分析 9) 1) 社会科学应用统计学原理 2) 社会测量方法 3) 实验设计方法 4) 抽样调查方法 5) 应用线性回归模型 6) 分类数据分析 7) 生存分析(或事件史分析) 8) 空间数据分析

19)系统仿真方法 20)文献分析方法 21)内容分析方法 22)势分析方法 23)复杂调查数据分析方法 在一般方法中的定性研究方法中,给出了下面几种方法: 1) 叙述研究 2) 现象学 3) 扎根理论 4) 民族志 5) 案例研究 6) 焦点组讨论 上面所列的研究方法课程,并不是可以随便想学哪一门课就可以学哪一门课的,它们之间具有内在逻辑联系。要想系统学习社会科学研究方法,需要遵循这种内在的逻辑顺序,否则会影响对内容的理解。 学习社会科学研究方法,第一门课应该是“研究设计和研究方法”。学习这门课,可以对社会科学研究的基本思路、原理、过程、各类方法等有基本的、全面的理解。在这门课中还会介绍一些简单的、与社会测量有关的内容,包括实验设计、问卷设计、抽样设计等。学完这门课以后,有人喜欢继续学习定量研究方法,也有人可能会喜欢学习定性研究方法,那么就 可以开始学习第二个层次的课程。目前,国内社会科学领域均把定性研究方法作为独立的一 门课。尽管这属于一类方法,其中还有很多具体的研究方法,但目前还很少有学校把每一种 具体方法设置为一门课。学习定性研究方法,通常不需要任何前修课,但最好能够有过一些研究的经历,并掌握一定的社会科学理论。 对从来没有学过定量分析方法特别是统计学方法的人来说,最好从统计学基础课开始学。“社 会科学应用统计学原理”被称为应用统计学或定量研究方法的第一门课。它将介绍统计学的基本概念、原理,以及针对单变量和双变量的描述、解释和推断方法。学完了解决单变量和 双变量问题的方法以后,就将学习多变量问题的方法。针对多变量问题,最重要也是最基础

基于文献计量的大数据研究综述_李贺

收稿日期:2013-12-10 基金项目:国家科技支撑计划(课题编号:2013BAH21B05)作者简介:李 贺(1964-),女,吉林长春人,教授、博士生导师,主要从事知识管理、竞争情报分析、信息系统开发与设计 研究. 基于文献计量的大数据研究综述 李 贺,袁翠敏,李亚峰 (吉林大学管理学院,吉林长春130022) 摘 要:本文通过检索Web of Science 中有关大数据的论文,采用文献计量分析法、可视化分析法 和内容分析法等对文献进行梳理,分析了该领域的研究现状和发展趋势,并从大数据基本理论、大数据存储与分析处理技术和大数据应用研究三个角度说明当前研究热点,对未来研究进行展望。关键词:大数据;Web of Science ;文献计量;综述中图分类号:G250.2 文献标识码:A 文章编号:1007-7634(2014)06-148-08 A Review of Big Data Research Based on Bibliometrics LI He,YUAN Cui-min,LI Ya-feng (School of Management,Jilin University,Changchun 130022,China) Abstract:The paper analyzes related literatures in the field ofbig data retrieved from Web of Scienceus ?ing methods of bibliometric analysis,visualization analysisand content analysis,and analyzes the research status and development trends.The paper shows the current research focus of big data from three angles: basic theory,technology of big data storage,analysis and processing,as well as big data applied research,and gives prospects of the future research. Key words:big data;Web of Science;bibliometrics;review 1大数据概述 1.1大数据定义 从学术角度来讲,大数据一词最贴切的概念最早出现在2008年《Nature 》杂志所设立的“Big Data ”专刊中,该专刊所发表的文章分别从互联网、数据管理及生物医药信息等角度介绍大数据所带来的机遇与挑战【1】。自此以后,大数据研究在各国兴起。2011年5月,大数据的概念由信息存储资讯科技公司EMC (易安信)在“云计算相遇大数据”大会 正式提出。同年6月,IBM 及麦肯锡等著名研究机构也相继发布大数据研究报告,掀起了大数据研究的浪潮。然而,各界对大数据的定义尚未统一。Gartner 结合其特征将大数据定义为数据量大、高运转速率和多样性的信息集合,它需要新的处理形式以加强决策支持、深入发现和优化处理【2】。我国学者孟小峰【3】通过将大数据与数据库的概念进行对比,并将两者分别比喻为“大海捕鱼”和“池塘捕鱼”,从数据规模、数据类型、模式和数据的关系、处理对象以及处理工具几个方面分析了大数据这一概念,较为准确、形象。总体上讲,大数据不仅指数据量巨大,且数据主要是以半结构化和非结构化形 - -148

计量方法的步骤

计量方法的步骤 第一,确定研究课题。依据题目明确取得统计数据的资料对象,确定统计数据的具体项目。 第二,确定数据资料的代表性。在研究课题确定后,要支研究那些用来解决这一课题的史料内容,确定这些数据资料的置信度和准确度,以及这些数据资料对于解决所确定的课题有多在代表性,即它们能在多大程度上正确地揭示研究对象的实质。 第三,利用电子计算机系统地整理、储存史料。这是在历史研究中使用计量研究法的必要条件,也是进一步采用数学分析和数学模型方法的前提。其具体步骤是:第一,编制运算程序;第二,将数据输入电子计算机;第三,计算机按照指令进行运算;第四,计算机输出资料和信息。 第四,对数据资料进行计量分析。这是历史研究中运用计量研究法中的一个关键性步骤。根据所使用的统计方法难易程度的不同,又把计量分析划分为描述性统计和分析性统计两种。描术性统计不需要高深的统计学知识,便于掌握,并且应用这种方法所得出的结论容易理解,因而为大多数计量史学家所采用。常见的描述性统计有以下几种方法:其一,次数分布法。这是对变量矩阵的再处理,往往以表格的形式显示出来。其二,图表法。就是计量史学家依据对其数据资料的分类,制成相应的图表。常见的图表有条形图、直方图、曲线图、离散性图、比率图等。其三,概括法。就是在大量同质的数据中,利用统计学求出那些数量上能反映总体的基本特征和规律性的指标,如算术平均数、几何平均数、中位数等。其四,动态分析法,又称时间数列分析法。就是将反映某一历史现象的统计指标按时间的先后顺序排列起来,形成数列。它又分为绝对动态数列、相对动态数列,平均数动态数列。动态分析法从数量方面研究历史现象发展变化的趋势和速度,揭示历史现象各个发展阶段的特点和规律,因而在计量研究法中占有重要地位。分析性统计的实质在于利用较为复杂的数理统计方法,从一些相关的数据中推断历史现象的变化情况。其具体方法有相关分析、路径分析、因素分析、对数曲线、对数百分比等几种。分析性统计要求较深的数理统计方面的理论和技巧。 第五,制定数学模型,进行模拟研究。使用数学方法分析数据资料,目的就是要建立这些资料的数量形式的数学模型。数学模型是研究对象的基本实质的抽

相关文档
相关文档 最新文档