文档库 最新最全的文档下载
当前位置:文档库 › 北京大学数字图书馆门户的构建与实施 张春红

北京大学数字图书馆门户的构建与实施 张春红

北大数字图书馆的构建与实施

2006年8月

主要内容

一、北大数图门户的定位与功能

二、北大数图门户特点

三、北大数图门户的需求设计与实施

(含可用性调查)

——根据美国研究图书馆学会(Association of Research Libraries,ARL)的调查,截止到2004年5月止,已经有19所研究型大学图书馆建设了自己的数字图书馆门户,其中包括哥伦比亚大学、加州大学圣地亚哥分校和圣塔巴巴拉分校、康奈尔大学、杜克大学、伊利诺依大学香槟分校和芝加哥分校、密西根大学、麻省理工学院、爱荷华大学、华盛顿大学等…

——国家数字图书馆二期、CSDL学科门户(E-Science,三期VDL)、CADLIS中心/高校门户;

清华大学图书馆MetaLib+SFX+ERS数字图书馆整体解决方案;北京师范大学图书馆MetaLib+SFX 统一检索型数字图书馆门户;北航图书馆TRS搭建数字图书馆门户;人民大学图书馆“CDI

CM+TPI+麦达博文非书资料管理系统+天宇系统”的应用型数字图书馆…

——建设什么样的门户?

通用门户、特色门户、个性化门户;

知识导航型(知识聚合型)门户、统一检索(资源整合)型门户、统一认证型门户、综合服务(整合)型门户…

——作为一所研究性、综合性的大学图书馆,

北京大学数字图书馆从一开始就把自己定位为“学术型、研究型数字图书馆”,其建设宗旨是“以研究为基础,以服务为主导”。其主门户因此定性为综合性通用门户,包含了门户的全部核心和非核心功能要素,如统一认证、统一检索、知识导航、资源链接与全文获取、咨询服务与帮助、个性化服务、动态消息、网站索引、站内检索等

二、北大数图门户特点

一、总体设计:以用户需求为主导

增加了学科导航,以北京大学的学科设置和

需要为基础设计学科体系

增加链接深度:把书刊目录检索、内容统一

检索从原来的二级页面提到一级页面,以简

化主页使用程序,提高用户的查找速度

同类型资源合并

多途径揭示

全部保留;在资源类

型揭示、资源和服务

整合、栏目设计等方

面体现功能增强

科导航、资源统一检

索、网站索引和站内

检索等功能

二、整合应用:多途径集成资源和服务

资源整合

服务整合

资源与服务的整合

传统服务与数字化服务的整合

通用门户整合各个特色门户

三、学科体系:以教学科研为服务目标

四、开放建设:面向信息化校园和外部共享环境

资源区

资源统一检索调度系统

特色库

考虑服务对象:大学数字图书馆门户首先是开放的,任何用户都可进入数图首页,并使用其免费的资源和服务。因此门户的总体流程是针对全体用户而设计的

读者是否在门户上登录是可选择的:“登录+认证”是门

户流程中贯穿始终的最重要的流程之一,只有理清了这个流程,门户的总体流程设计才可能畅通

读者在门户上登录后可使用个性化和特色门户

门户总体服务链流程框架的设计还必须体现门户的不同应用层次,一般说来,门户应该有三个应用层次——第一、二层是服务层次,分别是用户登录与认证、门户功能服务;第三层是技术层次,主要是结算系统、调度系统等支撑平台。不同层次之间会涉及到“链接”与“返回”的关系,总体服务链流程设计必须能清楚地反应这些关系

调研与交流

数字图书馆整体方案设计:包括数字图书馆门户、用户认证、多媒体中心、用户培训中心、读者用计算机管理、网络改造与部署、数字资源存储等数图门户需求设计与实施:第一阶段内重点提出了4个需求设计方案,即统一认证系统需求及相关应用系统的统一认证改造需求、统一检索系统完善需求、门户知识导航体系及其功能需求、门户网站页面流程及设计需求

支撑系统选型

北大数图门户的可用性调查

80%的读者认为“北大图书馆新主页暨数字图

书馆门户方便使用”;

北大数图门户的可用性调查(续)读者对门户的肯定性评价

结构和设计方面:认为新主页暨门户具有信

息丰富、重点突出的特点;设计方面色调淡

雅,体现了图书馆安静广博的特点,给人清

新庄重的感觉,在蓝白主色的基础上,又大

胆运用了橙黄色点缀,使整个页面更显得活

泼,生动;布局方面认为整个网站的页面设

计更具整体性和可用性;

先进性和规范性方面:认为新主页暨门户采用的门户内容管理技术和网站索引、站内检索等功能都具有国内国际领先水平,并符合各大门户网站的规范化要求。

--根据读者调查表中用户填写的内容、大学图书馆学报沙龙、北大BBS、信息管理系李国新老师的学生作业等来源统计

对数图门户的建议和意见

结构、美工及栏目:

统一认证:登录流程及其便利性方面需要改

进;一卡通接口问题

统一检索:检索结果不准确、性能不够优化;

资源链接和调度功能不完善

其他栏目设置:网站索引和站内检索由于数据不完善功能未能发挥

对数图门户的建议和意见(续)其他建议

RSS服务

包括留言簿和BBS等的互动服务

网站地图

Firefox浏览器支持

浅析数据挖掘在数字图书馆信息服务中的应用

第8卷 第2期2009年6月 高校图书情报论坛 A cademic Librar y and Information Ser vice V ol.8 No.2 June.2009 浅析数据挖掘在数字图书馆信息服务中的应用 梁 田 (华中科技大学图书馆 湖北武汉 430074) 摘 要:介绍了数据挖掘的概念及其形式,阐述了数据挖掘在数字图书馆信息服务中的作用及功能,并指出数据挖掘在数字图书馆应用中需要注意的问题。 关键词:数字图书馆;数据挖掘;信息服务 中图分类号:T P274 Application of Data Mining in Information Services of Digital Library LIAN G Tian (H uaz hong Univ er sity of Science and T echnology,H ubei W uhan430074) Abstract:Introduces the co ncepts and form s o f data m ining,discusses the roles and func tions of data m ining in inform ation serv ices o f digital libraries,and points out so me questions w hich should be taken no tice. Key words:digital library;data mining;information serv ices 自从数字化的生存方式逐渐为人们所了解和接受以来,数字图书馆的研究也开始吸引越来越多人的关注。当前对数字图书馆的定义很多,概括来讲,数字图书馆就是基于计算机网络、信息提取、(图书)分类、法律、管理等技术,集数字信息收集、整理、保存、保护、使用于一体化的综合智能数字信息资源管理和服务系统,其中涉及了大量的人工智能、互联网、数据库、人机界面、图书情报学等技术。 数字图书馆的信息服务是基于信息用户的信息使用行为、习惯、偏好、特点及用户特定的需求,向用户提供满足其个性化需求的信息内容和系统功能的一种服务。它首先应该是一种能够满足数字图书馆用户个体信息需求的一种服务;其次应该是一种培养个性、引导需求的服务,以促进社会的多样性和多元化发展。当前国内外数字图书馆的信息服务系统的研究已逐步深入,信息服务的应用也迅速发展。数据挖掘在图书馆中的应用将为数字资源的组织和管理,服务质量的提升和服务方式的拓展等方面提供技术支持,并显示强大生命力。1 数据挖掘形式 数据挖掘又称数据库中的知识发现,是目前信息技术领域中的一个热门课题。所谓数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律等看作知识,把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理、查询优化、决策支持和过程控制等,也可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。

中文核心期刊目录(北京大学图书馆2014年版)

中文核心期刊目录(2014年版) 北大核心目录(第七版) 作者:北京大学图书馆 来源:北京大学图书馆 发布时间:2015-08-25 《中文核心期刊要目总览》是由北京大学图书馆及北京十几所高校图书馆众多期刊工作者及相关单位专家参加的研究项目,项目研究成果以印刷型图书形式出版,此前已由北京大学出版社出了六版:第一版(1992年)、第二版(1996年)、第三版(2000年版)、第四版(2004年版)、第五版(2008年版)、第六版(2011年版)。第七版(2014年版)于2015年9月由北京大学出版社出版。 序号中文刊名 A/K.综合性人文、社会科学 1中国社会科学 2中国人民大学学报 3学术月刊

4北京大学学报(哲学社会科学版) 5华中师范大学学报(人文社会科学版) 6浙江大学学报(人文社会科学版) 7南京大学学报(哲学、人文科学、社会科学8北京师范大学学报(社会科学版) 9复旦学报(社会科学版) 10清华大学学报(哲学社会科学版) 11社会科学 12上海师范大学学报(哲学社会科学版) 13江海学刊 14中山大学学报(社会科学版) 15吉林大学社会科学学报 16文史哲 17学术研究 18江苏社会科学 19上海交通大学学报(哲学社会科学版) 20厦门大学学报(哲学社会科学版) 21社会科学研究 22南开学报(哲学社会科学版) 23社会科学战线 24上海大学学报(社会科学版) 25浙江社会科学

26江西社会科学 27南京社会科学 28天津社会科学 29学习与探索 30河北学刊 31陕西师范大学学报(哲学社会科学版) 32湖南师范大学社会科学学报 33学海 34江汉论坛 35南京师大学报(社会科学版) 36西北师大学报(社会科学版) 37武汉大学学报(哲学社会科学版) 38甘肃社会科学 39浙江学刊 40人文杂志 41天津师范大学学报(社会科学版) 42华东师范大学学报(哲学社会科学版) 43求索 44求是学刊 45贵州社会科学 46思想战线 47河南大学学报(社会科学版)

数据挖掘技术在数字图书馆中的应用研究热

数据挖掘技术在数字图书馆中的应用研究热 [ 作者:王路漫 | 转贴自:本站原创 | 点击数:335 | 更新时间:2009-8-18 | 文章录入:imste 2009年第 4 期 ] (北京大学医学部,北京 100191) 摘要:文章介绍了数据挖掘的主要技术,即关联规则和聚类算法,并针对北京林业大学数字图书馆数据的具体特点,将这两种关键技术运用到图书馆借阅信息挖掘过程中,通过分析挖掘结果,寻找借阅书刊一些潜在的规律,优化图书馆的馆藏布局,提高个性化服务质量。 关键词:数据挖掘;关联规则;聚类算法;数字图书馆 中图分类号:TP274 文献标识码:A 文章编号:[HT K]1007—6921(2009)04—0158—03 随着高校图书馆数据库中数据量的迅速增加,如何使高校图书馆朝着自动化、数字化和信息化的方向发展,已成为目前迫切需要解决的问题。如果将数据挖掘技术很好的运用到图书馆数据库中,将会使其职能相应地实现转型,即除了传统的服务和教育职能外,还可以为高校的决策、管理及建设发展提供信息咨询与服务。这样可以使高校图书馆逐步成为开放的社会化数字图书馆,为师生的学习及科研创造更好的环境和氛围。 1 数据挖掘及其关键技术 1.1 数据挖掘的定义 数据挖掘(Data Mining,简称DM),就是从大量的、不完全的、有噪声的、模糊的、随机的数据库中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程 [1] 。它主要研究发现知识的各种方法和技术,并利用各种分析工具在海量数据中分析发现模型和数据间的潜在关系。 1.2 数据挖掘中的主要技术 1.2.1 关联规则。关联规则是数据挖掘的主要技术之一。所谓关联规则,就是寻找数据库中数据项(属性、变量)之间存在(潜在)的关联规则。利用关联规则的数据挖掘技术,可以找出大量数据之间未知的依赖关系。例如:通过对读者借阅行为进行关联规则分析,可以分析出不同图书类别中的潜在关系。虽然数据挖掘中频繁项集挖掘算法对于一些非稠密数据库能够取得较好的性能,但对于稠密数据库或者支持度阈值比较小时,频繁项集的数量会以指数形式增长,使得找出所有的频繁项集成为不可能的任务。但实际上,在频繁项集中,存在着较多的冗余,最大频繁项集的规模是所有频繁项集中最小的,并且可以导出频繁项集。因此我们可以使用最大频繁项集数据挖掘,提高关联规则挖掘效率。 1.2.2 聚类分析。聚类是一种常见的数据分析工具,其目的是把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同。因此在数据进行聚类这一过程中没有指导,是一种无监督分类。聚类分析是用数学方法研究和处理所给对象的分类以及各类之间的亲疏程度,是在对数据不作任何假设的条件下进行分析的技术 [2] 。 2 数据挖掘技术在图书馆借阅信息中的应用 数据挖掘在商业领域内的应用给图书馆带来了很大启发,图书馆读者的特点是数量巨大、读者的年龄不同、工作性质和专业方向不同、研究领域更是差别很大,这样的读者特点给图书馆提出了不同的个性化要求。如何满足读者的需求,提高读者的满意度,给读者更好的服务,是一个值得研究的问题[3]。 在读者利用图书馆的资源过程中会留下诸如读者基本信息、借阅历史、检索历史等有价值的大量信息,这正是图书馆工作者获取读者信息需求、

中文核心期刊目录(北大图书馆)

中文核心期刊目录(北大图书馆) (2004年版) 第一编哲学、社会学、政治、法律类 A/K综合性人文、社会科学1.中国社会科学2.北京大学学报.哲学社会科学版3.社会科学战线 4.学术月刊 5.中国人民大学学报 6.天津社会科学 7.学术研究8.江海学刊9.江汉论坛 10.江苏社会科学11.北京师范大学学报.人文社会科学版12.复旦学报.社会科学版13.文史哲14.南京大学学报.哲学、人文科学、社会科学15.浙江学刊 16.浙江社会科学17.社会科学研究18.求是学刊 19.社会科学(上海)(吸收:上海社会科学院学术季刊)20.社会科学辑刊21.华东师范大学学报.哲社版 22.华中师范大学学报.人文社会科学版23.中州学刊24.南开学报.哲学社会科学版25.人文杂志26.求索27.思想战线 28.中山大学学报.社会科学版29.吉林大学社会科学学报30.国外社会科学 31.南京社会科学32.厦门大学学报.哲学社会科学版33.浙江大学学报.人文社会科学版34.四川大学学报.哲学社会科学版35.齐鲁学刊 36.西南民族学院学报.哲学社会科学版(改名为西南民族大学学报.人文社科版) 37.学海38.武汉大学学报.人文科学版39.江西社会科学 40.东北师大学报.哲学社会科学版41.郑州大学学报.哲学社会科学版42.河北学刊43.学术界44.东岳论丛45.湖南师范大学社会科学学报 46.东南学术47.首都师范大学学报.社会科学版48.中国社会科学院研究生院学报 49上海社会科学院学术季刊(并入:社会科学)50.湖北大学学报.哲学社会科学版 51.西南师范大学学报.人文社会科学版52.北京社会科学53.河南大学学报.社会科学版54.学术论坛55.南京师大学报.社会科学版56.广东社会科学 57.陕西师范大学学报.哲学社会科学版58.中央民族大学学报.哲学社会科学版 59.福建论坛.人文社会科学版60.西北大学学报.哲学社会科学版61.山东社会科学62.探索63.学术交流64.湘潭大学社会科学学报 65.暨南学报.哲学社会科学版66.华南师范大学学报.社会科学版67.安徽大学学报.哲学社会科学版 68.北方论丛69.山东师大学报.人文社会科学版70.广西民族学院学报.哲学社会科学版71.西北师大学报.社会科学版72.深圳大学学报.人文社会科学版73.河南师范大学学报.哲学社会科学版 74.上海师范大学学报.哲学社会科学版75.宁夏社会科学76.兰州大学学报.社会科学版77.辽宁大学学报.哲学社会科学版78.云南社会科学79.长白学刊 80.河北师范大学学报.哲学社会科学版81.天津师范大学学报.社会科学版82.江淮论坛83.福建师范大学学报.哲学社会科学版84.河南社会科学85.内蒙古社会科学 86.南昌大学学报.人文社会科学版87.甘肃社会科学88.上海大学学报.社会科学版89.内蒙古大学学报.人文社会科学版90.扬州大学学报.人文社会科学版91.晋阳学刊92.四川师范大学学报.社会科学版93.清华大学学报.哲学社会科学版94.苏州大学学报.哲学社会科学版 95.河北大学学报.哲学社会科学版96.烟台大学学报.哲学社会科学版97.贵州社会科学98.山东大学学报.哲学社会科学版99.山西师大学报.社会科学版

浅论互联网背景下图书馆数字化阅读平台的建设 陈凌云

浅论互联网背景下图书馆数字化阅读平台的建设陈凌云 发表时间:2018-10-12T10:08:53.560Z 来源:《知识-力量》5中作者:陈凌云 [导读] 网络数字阅读因互联网技术的发展而兴起,它有着传统阅读方式无可比拟的优越性,它在改变人们阅读和学习方式的同时,也为图书馆的下一步建设指明了方向,本文从图书馆网络数字平台建设的角度出发,结合网络数字阅 (成武县图书馆) 摘要:网络数字阅读因互联网技术的发展而兴起,它有着传统阅读方式无可比拟的优越性,它在改变人们阅读和学习方式的同时,也为图书馆的下一步建设指明了方向,本文从图书馆网络数字平台建设的角度出发,结合网络数字阅读本身的特点,分析了当前图书馆网络数字化平台建设过程中存在的问题,并提出了相应的解决对策。 关键词:网络;数字阅读;图书馆;服务 1.引言 随着互联网技术的飞速发展和普及,网络技术在阅读领域悄然掀起了一场革命。阅读的载体首次从纸质的书籍报刊扩充到互联网平台,阅读的内容首次从纯文字形式扩充到图片、音频与视频形式,阅读不再受时间、空间的限制,网络数字阅读的方便和快捷正逐渐改变着人们学习方式和生活方式,也为各地图书馆的发展建设指引了方向,即在完善传统阅读体验的同时,加强网络数字平台的建设,为读者提供全方位、方便、快捷的阅读服务。 2.网络数字阅读及其特点 所谓“网络数字阅读”,指的是人类利用数字技术,将文字信息、图形信息、声音信息、影像信息等内容编辑加工后,存储在电、磁等介质上,借助网络的联通性,通过计算机或智能手机等等具有类似功能的设备读取信息的活动[2]。它有两种必备的要素,首先是数字资源,从数据的组织形式上看,有数据库、电子期刊、电子图书、网页资源、多媒体资料等类型;其次是传输媒介,数字资源借助当前发展迅猛的互联网进行传播,在智能手机等移动终端普及之前,人们一般通过电脑进行数字资源的阅读;在移动智能终端普及之后,更多的网络用户参与数字阅读,进行信息内容的获取和创建,人们的阅读环境也转换为交互式的网络环境,使网络数字阅读逐渐成为主流。数字阅读之所以能有如此强劲的发展势头,缘于它本身有如下几个特性: 2.1阅读载体多样化、移动化:数字阅读的载体十分丰富,只要是可以连接网络、可以展示数字文件的设备,例如智能手机、平板电脑等等,都可以被用来当做数字阅读的载体。尤其是智能手机等移动设备,其移动性和便携性打破了传统阅读过程中时间和空间的限制,使得人们可以随时随地进行阅读。在生活节奏日益加快的今天,移动阅读帮助读者充分利用碎片化的时间,提高阅读的效率。 2.2阅读内容丰富、形式多样 互联网设备强大的存储能力和互联网络的联通性将世界各地不同领域的内容整合到一起,各种新闻资讯、网络文学、多媒体数据库搜索引擎等新媒体不断涌现,为网络数字阅读提供了丰富多彩的内容。这些网络信息形式多种多样,包括文字、图像、音频、视频等各种形式,同传统的纸本阅读相比,数字多媒体资源有着不可逾越的优势,他们往往更加直观,更加形象,更容易被读者接受。笔者做过一个调查,在传达内容一致的情况下,相对于纸质阅读,大约70%的人会选择视频的形式去了解特定的史实,因为其形式形象生动,更易于接受,给人的印象更加深刻。内容丰富、形式多样的网络数字平台更加契合当代社会的节奏和需求。 2.3阅读过程的互动化 传统的阅读过程中,读者都是单纯地从书中获取信息,是信息的单向传递,而与此不同的是,网络数字阅读有很强的互动性,读者不再被动地接受信息,更多的是主动发现、选择、处理和评价信息,这种互动的过程给读者很强的参与权、提升了读者的积极性[4]。 3. 网络数字阅读现状及存在的问题 网络数字阅读是活字印刷革命之后的另一场革命,是信息生产力的再次解放。据“第八次全国国民阅读调查”结果显示,2010年,我国国民综合阅读率达到77.1%,比2009年增加5.1个百分点。各种方式阅读的接触率较2009年均有增长;网络数字阅读方式的接触率为32.8%,比2009年的24.6%增加了8.2个百分点,增幅为33.3%。相比之下,网络数字阅读方式的接触率增长幅度最大[1]。然而,网络数字阅读在给人们带来极大便利的同时,也存在着诸多问题,笔者从图书馆数字平台建设的角度,提出以下几个典型的问题。 3.1区域信息不平衡 比较理想的情况是,全国各地、所有公民都可以享受到同样的数字资源服务,然而现实情况却并非如此。首先,不同城市图书馆资源分配不平衡,例如,某省图书馆购进了一批数字资源,除了省会城市所在的区域或者特定的区域之外,其他省内城市均无法访问该数字资源,造成城市之间资源的不平衡;其次,在图书馆内部和外部资源访问权限不同,目前来看,图书馆所拥有的数字资源只有在图书馆内部才可以访问,图书馆的墙壁阻拦了数字资源的访问请求,看起来是极不合理的,它给读者使用数字资源造成了很大的阻碍。因此有必要进一步放开图书馆内资源的访问限制。 3.2资源质量参差不齐 随着数字资源的推广,数字资源市场逐步发展起来,市场上出现了众多数字资源提供商,其中不乏高品质的产品,然而,绝大多数的产品都过不了质量关,数字内容提供商盲目追求利益,针对数字资源的内容,缺乏统一的规范,难以形成一个重视编审效果的团队,导致现有的数字资源编审队伍专业性不强,提供的内容无法满足大众的需求。 3.3缺乏引导、推广机制 图书馆数字化的转型过程中面临着些许尴尬,图书馆在人们的印象里更多的是原有的传统的图书模式,大家普遍想到的是图书馆里的书籍、期刊等纸质媒介,馆里的数字资源并不为人所熟知,人们往往把注意力放在互联网上形形色色的网络资源,例如各种新闻资讯、网络文学、各种在线电视栏目等等,图书馆里引进的大批量的、极具教育意义的数字资源却被冷落,如何引导广大读者访问图书馆内的数字资源,如何做好资源推广工作,是当前各级图书馆需要着重考虑的问题[5]。 4.图书馆的应对策略 4.1建立统一、开放的数字阅读体系 全国图书馆数字资源的不平衡,是国家数字文化资源推广的一大瓶颈,建立一个全国统一的、开放的数字资源阅读平台,可以有效地

数据挖掘在数字图书馆中的应用研究

数据挖掘在数字图书馆中的应用研究 潘旭武 陈玲洪 (浙江工业大学图书馆 杭州 310014) 摘 要 数据挖掘技术在信息的利用和提取中发挥着日益重要的作用。本文在描述数据挖掘技术的基础上,探讨了数据挖掘在数字化图书馆中应用的三个方面,说明数据挖掘技术在数字图书馆应用的必要性,并提出一个基于数据挖掘技术的数字图书馆的挖掘系统模型。 关键词 数据挖掘 数字图书馆 结构挖掘 内容挖掘 用户使用记录挖掘 1 引言 在现代科学技术推动下,高校图书馆正朝着自动化、数字化和信息化的方向发展。同时,其职能也相应地实现了转型:除了传统的服务和教育职能外,为高校的决策、管理及建设发展提供信息咨询与服务正逐步成为日益开放和社会化的高校图书馆的重要职能。 数据挖掘,这种全新的技术,是为解决当前“信息丰富而知识贫乏”这一问题而出现的。目前,它已经在银行业、零售业、工程技术和医学等领域得到成功应用和空前发展,在这些领域的成功应用鼓舞着人们将数据挖掘技术应用到更多、更广泛的领域中去。数字图书馆是综合运用多方面高新技术的数字信息资源管理系统,从它产生起就得到广泛的关注和蓬勃的发展,目前,网络上数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的实用价值。数据挖掘技术在图书馆中的应用将为图书馆在数字资源的组织和管理、服务质量的提升和服务方式的拓展等方面提供了技术支持,并显示出强大的生命力。 2 数据挖掘概述 数据挖掘(Data Mining,简称DM)是近10年来计算机科学研究的一个热点。它是指从大量数据中提取或挖掘隐含的信息或知识。数据挖掘可以在任何类型的信息载体或存储上进行。比如数据仓库、关系数据库、事务数据库、面向对象数据库、对象—关系数据库、空间数据库、时间数据库、文本数据库、多媒体数据库、Web数据库等等。这种从大型的数据库或数据仓库中提出隐藏的预测性信息的新技术,能挖掘出数据间潜在的模式,自动预测知识和行为、自动发现以前未知的模式。数据挖掘提取的知识可以表示为概念(C on2 cepts)、规律(Rule)、模式(Pattern)、约束(C on2 straints)、可视化(Visualization)等等。数据挖掘过程可分为3个阶段:数据准备、采掘操作、结果表达和解释。整个采掘过程是个反复精练的过程,离不开用户的参与。数据挖掘使挖掘大型数据库中的大量数据变得更加容易,挖掘人员并不需要经过多年的统计分析或数据分析方面的训练。数据挖掘和知识发现存在着一定的联系和差别。一般认为,数据挖掘是知识发现过程中的一个特定步骤,它用专门算法从数据库中抽取模式,然后通过系统解释和评价模块将模式转换成用户可以理解的知识。不过,广义的数据挖掘通 63

中文核心期刊目录(北大图书馆2004版)

中文核心期刊目录(北大图书馆2004版)编、类索引:

期刊索引: 第一编哲学、社会学、政治、法律、军事 A/K综合性人文、社会科学类核心期刊表 序号刊名序号刊名 1 中国社会科学51 西南师范大学学报. 人文社会科学版 2 北京大学学报. 哲学社会科学版52 北京社会科学 3 社会科学战线53 河南大学学报. 社会科学版 4 学术月刊54 学术论坛 5 中国人民大学学报55 南京师大学报. 社会科学版 6 天津社会科学56 广东社会科学 7 学术研究57 陕西师范大学学报. 哲学社会科学版 8 江海学刊58 中央民族大学学报. 哲学社会科学版 9 江汉论坛59 福建论坛. 人文社会科学版 10 江苏社会科学60 西北大学学报. 哲学社会科学版 11 北京师范大学学报. 人文社会科学版61 山东社会科学 12 复旦学报. 社会科学版62 探索 13 文史哲63 学术交流 14 南京大学学报. 哲学、人文科学、社会科学64 湘潭大学社会科学学报 15 浙江学刊65 暨南学报. 哲学社会科学版 16 浙江社会科学66 华南师范大学学报. 社会科学版 17 社会科学研究67 安徽大学学报. 哲学社会科学版 18 求是学刊68 北方论丛

20 社会科学辑刊70 广西民族学院学报. 哲学社会科学版 21 华东师范大学学报. 哲学社会科学版71 西北师大学报. 社会科学版 22 华中师范大学学报. 人文社会科学版72 深圳大学学报. 人文社会科学版 23 中州学刊73 河南师范大学学报. 哲学社会科学版 24 南开学报. 哲学社会科学版74 上海师范大学学报. 哲学社会科学版 25 人文杂志75 宁夏社会科学 26 求索76 兰州大学学报. 社会科学版 27 思想战线77 辽宁大学学报. 哲学社会科学版 28 中山大学学报. 社会科学版78 云南社会科学 29 吉林大学社会科学学报79 长白学刊 30 国外社会科学80 河北师范大学学报. 哲学社会科学版 31 南京社会科学81 天津师范大学学报. 社会科学版 32 厦门大学学报. 哲学社会科学版82 江淮论坛 33 浙江大学学报. 人文社会科学版83 福建师范大学学报. 哲学社会科学版 34 四川大学学报. 哲学社会科学版84 河南社会科学 35 齐鲁学刊85 内蒙古社会科学 36 西南民族学院学报. 哲学社会科学版(改名为:西南 民族大学学报.人文社科版)86 南昌大学学报. 人文社会科学版 37 学海87 甘肃社会科学 38 武汉大学学报. 人文科学版88 上海大学学报. 社会科学版 39 江西社会科学89 内蒙古大学学报. 人文社会科学版 40 东北师大学报. 哲学社会科学版90 扬州大学学报. 人文社会科学版 41 郑州大学学报. 哲学社会科学版91 晋阳学刊 42 河北学刊92 四川师范大学学报. 社会科学版 43 学术界93 清华大学学报. 哲学社会科学版 44 东岳论丛94 苏州大学学报. 哲学社会科学版 45 湖南师范大学社会科学学报95 河北大学学报. 哲学社会科学版 46 东南学术96 烟台大学学报. 哲学社会科学版 47 首都师范大学学报. 社会科学版97 贵州社会科学 48 中国社会科学院研究生院学报98 山东大学学报. 哲学社会科学版 49 上海社会科学院学术季刊(并入:社会科学)99 山西师大学报. 社会科学版 50 湖北大学学报. 哲学社会科学版 B(除B9)哲学类核心期刊表 序号刊名序号刊名 1 哲学研究9 中国哲学史 2 心理科学10 道德与文明 3 心理学报11 科学技术与辩证法 4 哲学动态12 现代哲学 5 自然辩证法研究13 心理发展与教育 6 孔子研究14 心理学探新 7 自然辩证法通讯15 周易研究 8 心理学动态(改名为:心理科学进展) B9宗教类核心期刊表 序号刊名序号刊名 1 世界宗教研究 5 中国宗教 2 宗教学研究8 佛教文化 3 法音7 中国穆斯林 4 敦煌研究8 世界宗教文化 C8统计学类核心期刊表 序号刊名序号刊名 1 中国统计 3 统计与决策 2 统计研究 4 数理统计与管理 C91社会学类核心期刊表 序号刊名序号刊名 1 社会学研究 3 妇女研究论丛 2 社会 4 中国社会保障 C92人口学类核心期刊表 序号刊名序号刊名 1 人口研究 4 人口学刊 2 中国人口科学 5 人口与计划生育 3 人口与经济

网上阅读——走进数字图书馆_张丽芳

课外阅读教案 课题: 网上阅读 ——走进数字图书馆 执教::广东省广州市白云区景泰小学张丽芳 学科:语文 授课年级:五年级 2013年3月14日

网上阅读 ——走进数字图书馆 白云区景泰小学张丽芳 一、教学背景 《新课程标准”》十分强调学生的课外阅读,重视语言积累,对学生的阅读量还做了明确的规定。因此,在平时的教育教学时就已经努力倡导学生多读课外书。2008年,广州市教育科研网上建立了一个数字图书馆。图书馆中的藏书丰富,适逢我校的读书节开幕,同时,我校也有条件开展网上阅读活动。为了拓宽孩子们课外阅读的途径,激发学生的课外阅读兴趣,于是开展了这次的网上阅读活动。 二、教学内容分析: 《网上阅读——走进数字图书馆》是一节课外阅读方法指导课。此课选择在学校电子阅览室上。通过指导学生使用广州市教育科研网数字图书馆开展网上阅读活动,引领学生走进数字图书馆,让学生熟悉数字图书馆的使用,知道在数字图书馆里借阅图书的方法,进行简单的图情教育。并且让学生体验数字阅读的乐趣,激发学生课外阅读的兴趣,使学生掌握一些阅读方法,提高阅读能力。通过网上阅读,丰富学生的学习生活,开阔学生的视野,养成良好的课外阅读习惯。 三、教学对象分析 本课的教学对象是五年级学生,他们从三年级起就有专门的信息课,我班学生家庭中几乎都有计算机,对于计算机的基本操作比较

熟悉,文字的输入也有一些基础。另外,我班学生特别喜欢阅读课外书,这是学生感兴趣的一个内容,不过,大多数孩子看书并没有什么目的和方法,都是比较随意的看书,因此,本课重点是指导学生掌握一些简单的阅读方法,提高阅读能力,丰富学生的学习生活,开阔学生的视野,养成其良好的课外阅读习惯。 四、教学目标 1、知识与技能 (1)、掌握操作计算机进入数字图书馆的方法。 (2)、了解在数字图书馆挑选数目的方法。 (3)、初步掌握一些简单的阅读方法,提高学生的阅读能力。 2、过程与方法 (1)、通过上机操作熟悉进入数字图书馆的步骤。 (2)、通过实际操作、交流讨论、比较等方式方法开展教学活动。 3、情感、态度、价值观 (1)、带领学生走进数字图书馆,让学生熟悉数字图书馆的使用,知道在数字图书馆里借阅图书的方法,进行简单的图情教育。 (2)、体验数字阅读的乐趣,激发学生课外阅读的兴趣,丰富学生的学习生活,开阔学生的视野,养成良好的课外阅读习惯。 五、教学重点和难点 重点:掌握进入数字图书馆借阅书籍的方法和掌握简单的阅读方法。难点:掌握简单的阅读方法,养成良好的阅读习惯。 六、教学方法

北京大学数字图书馆门户的构建与实施 张春红

北大数字图书馆的构建与实施 2006年8月

主要内容 一、北大数图门户的定位与功能 二、北大数图门户特点 三、北大数图门户的需求设计与实施 (含可用性调查)

——根据美国研究图书馆学会(Association of Research Libraries,ARL)的调查,截止到2004年5月止,已经有19所研究型大学图书馆建设了自己的数字图书馆门户,其中包括哥伦比亚大学、加州大学圣地亚哥分校和圣塔巴巴拉分校、康奈尔大学、杜克大学、伊利诺依大学香槟分校和芝加哥分校、密西根大学、麻省理工学院、爱荷华大学、华盛顿大学等…

——国家数字图书馆二期、CSDL学科门户(E-Science,三期VDL)、CADLIS中心/高校门户; 清华大学图书馆MetaLib+SFX+ERS数字图书馆整体解决方案;北京师范大学图书馆MetaLib+SFX 统一检索型数字图书馆门户;北航图书馆TRS搭建数字图书馆门户;人民大学图书馆“CDI CM+TPI+麦达博文非书资料管理系统+天宇系统”的应用型数字图书馆…

——建设什么样的门户? 通用门户、特色门户、个性化门户; 知识导航型(知识聚合型)门户、统一检索(资源整合)型门户、统一认证型门户、综合服务(整合)型门户…

——作为一所研究性、综合性的大学图书馆, 北京大学数字图书馆从一开始就把自己定位为“学术型、研究型数字图书馆”,其建设宗旨是“以研究为基础,以服务为主导”。其主门户因此定性为综合性通用门户,包含了门户的全部核心和非核心功能要素,如统一认证、统一检索、知识导航、资源链接与全文获取、咨询服务与帮助、个性化服务、动态消息、网站索引、站内检索等

对数字图书馆的认识和理解

对数字图书馆的理解 数字图书馆是一个新生事物,英文为digitallibrary,可以翻译成数字图书馆,也可以翻译为数字资料库。目前人们对数字图书馆的认识还处于一个发展的过程。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时间空间限制的知识中心。 数字图书馆是面向未来互联网发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组织的公众信息传播。现阶段,国内外对数字图书馆还没有一个明确、完整的定义。一般认为,数字图书馆是采用信息技术所支持的数字信息资源系统,是下一代互联网上信息资源的管理模式,它将从根上改变信息分散不便使用的现状。 数字图书馆是利用数字技术采集、存储和保存信息并高效率地提取存取信息的技术载体。数字图书馆绝不是图书馆的数字化,它已大大地突破了传统图书馆的概念和范畴,将成为未来社会人们工作、学习、生活的重要支撑点和前提性条件。而相对图书馆的常规服务内容而言,数字图书馆将使图书馆实现革命性的变革。 数字图书馆要求以新的方式执行图书馆的功能。包括新型信息资源、新的采访和馆藏发展方向与方式,尤其是有更多的资源共享和电子订购服务,新的存储与保存方法、新的分类和标引方式与用户新的交互模式,对计算机网络更多地依赖以及图书馆在人员智力构成、组织和经济等方面的显著变化,都与传统图书馆大相径庭。 数字图书馆的出现给传统图书馆带来了巨大的影响和冲击,主要表现在信息存储、处理、传递、管理等方式将发生根本性的变化。今后衡量图书馆服务能力和水平的主要标志将是能否拥有丰富而有用的信息资源,以及能否为用户提供全、新、准的信息服务。 数字图书馆需要建立起选择和采集文献的新标准。电子资料的选择和采访对于长期以来熟悉纸质资料的图书馆工作人员来说是一个巨大的挑战。现在数字图书馆的工作人员,应该是信息工程师和信息专家,是信息系统的建设者,也是使用者的向导和顾问。为了适应新的需要,图书馆的工作人员应具备以下的素质:独立获取信息的能力;比较强的外语应用能力和语言文字表达能力;很好的计算机、网络等新技术的应用能力;较强的专业能力。 从社会学角度看,数字图书馆是一个将信息收藏、服务和人集成在一起的环境,它支持数字化信息和知识整个生命周期的活动,包括生成、保存、发展、传播和利用。 从使用者的角度看,数字图书馆是运行在互联网上超大规模的、便于使用的、没有时间和空间限制的信息资源和知识中心,可以满足人们各个层次的学习和研究的需要。 从建设者角度看,数字图书馆是基于网络环境的数字信息资源管理和服务系统,包括信息资源的采集、组织、访问与服务等环节。 数字图书馆的优点有以下几个方面: 1.信息储存空间小、不易损坏 数字图书馆是把信息以数字化形式加以储存,一般储存在电脑光盘或硬盘里,与过去的纸制资料相比占地很小。而且,以往图书馆管理中的一大难题就是,资料多次查阅后就会磨损,一些原始的比较珍贵的资料,一般读者很难看到。数字图书馆就避免了这一问题。 2.信息查阅检索方便 数字图书馆都配备有电脑查阅系统,读者通过检索一些关键词,就可以获取大量的相关信息。而以往图书资料的查阅,都需要经过检索、找书库、按检索号寻找图书等多道工序,繁琐而不便。

数据挖掘技术在电子期刊及数字图书馆中的应用

数据挖掘技术在电子期刊及数字图书馆中的应用 发表时间:2010-08-04T16:54:40.607Z 来源:《价值工程》2010年第4月上旬供稿作者:朱京凤[导读] 近年来,随着计算机技术和网络技术的迅猛发展,电子期刊作为一种新的期刊资源,由于其更新速度快朱京凤(江南大学,无锡 214122)摘要:本文介绍了数据挖掘的概念及主要技术,数字图书馆个性化服务的含义,分析了数据挖掘技术在电子期刊及数字图书馆中的应用。 关键词:数据挖掘;电子期刊;数字图书馆个性化服务中图分类号:TP391 文献标识码:A 文章编号:1006-4311(2010)10-0155-02 0 引言 当前,随着网络技术的迅速发展,集信息资源的收集、创建、加工、服务和长期保存等于一体的数字图书馆因信息丰富,可实现真正意义上的资源共享,而且更新速度快等特点越来越受到人们的关注。不过拥有丰富信息的数字图书馆极容易陷入“数据丰富,但信息贫乏”的局面,因此,图书馆有必要增加对信息的处理能力以及对信息资源的组织能力,尤其是对海量信息的深层次开发,提取表面上庞杂无序的信息的内在联系供读者使用。因此,给图书馆提出了不少个性化要求。而利用数据挖掘技术因能为读者开展个性化服务,变被动服务为主动服务,因此在这个信息迅速发展的时代,有着重要的理论和实践意义。 1 数据挖掘的概念及主要方法 1.1 数据挖掘的含义数据挖掘是指从数据及数据库中抽取隐含的、先前未知的并有潜在价值的信息的过程;也有人认为数据万巨额是数据库中的知识发现,是从大数据中集中快速高效地发现令人感兴趣的规则,数据挖掘是数据库知识发现中的重要技术,是数据库研究的新领域,它通过查询内容进行模式的总结和内在规则的搜索,帮助决策者分析历史数据及当前数据,并从中发现隐藏的关系和模式,进而预测未来可能发生的行为。从而为决策行为提供有利的支持。 1.2 数据挖掘的主要方法数据挖掘的工具和方法,常用的有:分类、聚类、关联分析、偏差检测、孤立点分析、模式识别、可视化、决策树、遗传算法、不确定性处理等。下面简要介绍一下我们用比较常用的方法:①分类②聚类③关联分析④偏差检测。 2 期刊服务形式的演变 2.1 传统期刊服务流程传统期刊服务流程如图1所示。在期刊管理周期中,期刊征订有着极为重要的作用。合理的期刊定购能够保证在有限的采购经费下最大限度的满足学校的教学和科研工作的需要。影响期刊征订的因素很多,传统的征订工作是在初步调研的基础上,主要通过读者使用频率的统计和读者使用意见的反馈来决定后续的征订的工作。 2.2 期刊来源的演变近年来,随着计算机技术和网络技术的迅猛发展,电子期刊作为一种新的期刊资源,由于其更新速度快,检索和索取方便,正日益成为图书馆期刊管理的重要方式之一。期刊馆藏按照其存储介质的不同,分为纸质期刊和电子期刊两大类。电子期刊按照其信息类型,主要分为联机型电子期刊、光盘型电子期刊和网络型电子期刊。电子期刊按照其发行文字又可分为中文期刊和外文期刊。中文期刊的适用面较广,征订费用相对较少,着名的中文期刊主要包括中国学术期刊、重庆维普和万方数据库,因此一般院校均已定购。外文数据库由于种类繁多,价格高昂,合理的征订方案往往难以确定。 2.3 使用新技术的必要性目前,除少量综合性大学由于其学科齐全,资金雄厚,能够提供较为完善的电子期刊资源外,很多院校只是少数学科具备较强的科研实力,同时存在部分为适应国民经济和学校发展需要正在重点建设的学科。这就要求图书馆在资金有限的情况下,既要考虑到各学科的平衡发展,又要为本校重点发展的学科提供尽量完善的电子期刊资源。对于部分高等院校而言,由于受资金、场地等因素的影响,纸质期刊的征订数量正呈下降趋势,而电子期刊的征订数量和占用资金则呈上升趋势。传统的期刊征订准备工作是在期刊和数据库订阅之前,采取问卷调查和座谈会的形式,图书管理人员根据学校学科建设和学科发展需要,向领域专家、有关教师和科研人员征求各自学科的权威期刊或引用较高的期刊名称和出版单位等信息。这种方式获取信息只是一种感性程度的不精确信息。电子期刊的征订准备工作主要依赖于数据库使用。数据库试用是在综合了各学科反馈信息和采购成本之后,通过数据库提供商的简单介绍和培训,有数据库供应方给本校教师和学生提供一段时间的试用,以确定该数据库是否适合本校的教学和科研工作。由于试用时间较短,参与试用的人员有限,对数据库的适合程度的评判往往存在着一定的不完全性。电子期刊使用过程的统计分析则显得更为困难。统计分析作为一个有效的分析工具,分析得到的只是一些表面信息,对于整个学校在使用数据库的过程中保存下来的庞大记录则显得无能为力,无法获知数据内在存在的各种关联。 3 据挖掘技术在期刊服务中的应用 3.1 基于数据挖掘的期刊服务模式架构 使用数据挖掘技术服务于期刊服务的流程示意图。在传统电子期刊征订前的用户需求信息搜集和数据库试用的基础上,充分利用用户在使用过程中留下大量浏览、搜索和下载记录。这些存储于服务器中的大量数据对于人而言只是抽象的数据,由于数量庞大,传统的统计方法所获得的各种报表形式的分析数据难以描述其中隐含的知识关联。数据挖掘技术主要任务就是挖掘大量数据中隐含的各种模式类型,从而为数据关联分析、聚类分析、演变分析以及各种数据分类和预测提供显式的知识表示形式,从而通过数据挖掘技术的使用,为更加科学高效的电子期刊征订工作提供一种有效途径。 3.2 基于数据挖掘的期刊服务模式提供的新服务 3.2.1 为期刊征订计划的修改提供直接的分析依据,利用数据挖掘技术,通过分析服务器中用户浏览和下载文献的记录,可以获取不同专业,不同层次人员使用数据库的偏好模式,从而可以为期刊征订工作提供直接的分析依据。 3.2.2 据用户检索和下载的文献记录,利用数据挖掘技术获取不同学科、不同专业人员的检索策略和下载记录,从而可以为后续用户的使用提供具有参考价值的检索策略和研究热点,提高检索效率,提升图书馆的服务质量。 3.2.3 使用数据关联分析和演变分析,获取适合本校教学与科研的相关数据,分析和预测不同期刊的贡献率,从而为更加科学的征订和使用数据库提供帮助。数据挖掘技术作为一门新兴的交叉学科,在商业、金融等领域已有成功应用的范例。数据挖掘技术是一项正在发展的复杂技术,将其用于期刊管理,应该结合具体的使用目标,根据用户的具体要求逐步开发。尽管数据挖掘技术仍然面临着许多有待完善的地方,但是随着技术的不断发展和电子期刊的大量使用,数据挖掘将对提升图书馆期刊管理和服务质量产生积极影响。 4 个性化服务的概念及方式

数字阅读、经典阅读与图书馆未来的发展方向

数字阅读、经典阅读与图书馆未来的发展方向随着国内经济的快速发展,科技水平的不断进步,数字化产品的更新换代, 为国家走可持续发展道路奠定了坚实的科技基础。近年来,数字阅读在极大程度上影响到人们的阅读习惯和阅读方式,使人们在传统阅读的基础之上由增添了高科技产品所带来的更加便捷、舒适的多种选择。无疑,传统纸质媒介一家独大的信息知识传播时代已结束了,网络似乎越来越露出势不可当的传播优势,改变着人们的阅读习惯。 标签:数字阅读经典阅读图书馆发展方向 前言:经典是人类文化精华的凝练与提升,不同国家和地域的文化早就了不同地域和国家的经典,不同民族的文化形成不同的的民族经典,不同时代的文化产生不同时代的经典。图书馆作为国家最大的知识、智慧储备中心,有理由有必要更有责任在全民族的经典阅读中发挥其重要的作用。虽然传统纸质媒介时代的结束,但不代表其就退出历史舞台,反而起点铸就经典,经典铸造精华。 一、经典阅读、数字阅读的意义及作用 1.何谓“经典” 千百年来,新书源源不断地问世,属于“经典”的书目亦与日俱增。书海茫茫,世人难以全数涉猎。不管寿命有多长,至多只能阅读书海中的一滴水珠而已,因此人们所读的书应该是精华之所在,要读“经典”。值得庆幸的是,真正的经典相对说来是“凤毛麟角”。自从世界上有了文化,就有人列出最佳书目。古代亚历山大城的教师和图书管理员就曾列过此类书单。 “经典”,永不过时。为便于比较,把眼下流行的书称为“当代作品”,它们只流行一、二年或至多十多年。许多早期的畅销书恐怕连书名也记不起了,也不会再有兴趣读它们。而“经典”却不会因思想运动、学说更迭、舆论分歧而过时。经典的作品不是供学者研究而积满尘垢的遗著,而是当今世界上潜在的最强大的文明力量。人类的基本问题代代相同[2]。读过德摩斯梯尼的演说辞和西塞罗的信件,或是培根和蒙田的散文,任何人都会发现:人们对于幸福和正义、美德和真理,甚至对于安定与变幻本身是何等的笃信不疑!人类为其目标而奋斗的道路看来是不可改变的。“经典”论述人生有待解决的问题。世上有一些真正奥秘的东西,那是人类知识和思维局限性的标志。人们不仅带着疑问开始探究,也往往满腹疑团终止探究。真正有才智的人老老实实地承认未能理解的东西,认识到这一点不意味着浅薄,而是表明知识的渊博。读书的人都以知识不为国界所局限而深感庆幸。却迟迟不知道如何冲破政治上民族主义的桎梏,但通过时间的积累,渐渐地让人们清楚地明白,成为人类各方面精神的朋友,而不受时间和地点的限制。这就是靠阅读“经典”。 2.数字化的发展带给人类生活的影响

数据挖掘与分析心得体会

正如柏拉图所说:需要是发明之母。随着信息时代的步伐不断迈进,大量数据日积月累。我们迫切需要一种工具来满足从数据中发现知识的需求!而数据挖掘便应运而生了。正如书中所说:数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献。 1、数据挖掘 数据挖掘应当更正确的命名为:“从数据中挖掘知识”,不过后者显得过长了些。而“挖掘”一词确是生动形象的!人们把数据挖掘视为“数据中的知识发现(KDD)”的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤! 由此而产生数据挖掘的定义:从大量数据中挖掘有趣模式和知识的过程!数据源包括数据库、数据仓库、Web、其他信息存储库或动态地流入系统的数据。作为知识发现过程,它通常包括数据清理、数据集成、数据变换、模式发现、模式评估和知识表示六个步骤。 数据挖掘处理数据之多,挖掘模式之有趣,使用技术之大量,应用范围之广泛都将会是前所未有的;而数据挖掘任务之重也一直并存。这些问题将继续激励数据挖掘的进一步研究与改进! 2、数据分析 数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 数据分析有极广泛的应用范围。典型的数据分析可能包含以下三个步: 1、探索性数据分析:当数据刚取得时,可能杂乱无章,看不出规律,通过作图、造表、用各种形式的方程拟合,计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。 2、模型选定分析,在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。 3、推断分析:通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。 数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置

相关文档
相关文档 最新文档