文档库 最新最全的文档下载
当前位置:文档库 › 一种基于数据仓库的数据挖掘系统的结构框架

一种基于数据仓库的数据挖掘系统的结构框架

第9期商琳等:一种基于数据仓库的数据挖掘系统妁结构框架+63一种萋于数据仓瘁豹数据挖掘系统的结构框絮

商琳,骆斌

(南京太学计算机软件新技水国家重点实验室,汉苏南京2l0093)

摘要:教船奄库辆敷据挖掘技术是数据库、信息决策和机器学霉苓领域的前语研竞方向乏一。基于数据仓库的敷镌挖掘棱术霹前是研究酶热赢谭题。提盘了一辞基于凝据仓库的款据挖掘系纯蛙拇捱架,奔露了莫冬夸缎燕部分,并跨箕孛翡重要组成模块查竭磐霉氛进行了详尽遣猫连,藏砖络亵了巽体柏查询协商箨浊。

关键词:数据挖掘:数据仓库:查询协同机

中图分类号:"31112文献标识码jA文章编号:10Dl”3695(2000)09-0063-03

l引言

臣前。数据仓席和数据挖掘技术是国际.E数据库、信息硖肇帮撬嚣学习等擐城最嚣漆的磺必窍蠢之一。疆蕃诗算班辩普及菹及菇息辞健戆发袋,传统麴数据库已无法满足天容量历史数据、不嗣部分数据难以集成等特点,于韪数据仓库技术应运而生。数据仓库的出现是数据库技腿到一定阶段的产物。实际上.数据仓库是一个用米存放大容量的只读数据舯分析性数据库,它提供了一组以分析为主的工具。数据仓库之父wH№是这样定义的:“数据仓库是艇向主题鳇、集或瓣、稳定艟墨羹穗鞋蠢交纯骑鼗鬃巍台”。

数据挖搁(Da墩Mh妇g溜称鼗据瘁孛豹翔谈发现Ⅸno吼edgeDiscovervhDatabase),是飙犬型数据库的数据中提供有散的、新颖的、有潜在价值的知识和规则的过程。数据撒掘技术是目前发展极为遇德的一个研究领域,结台了机器学习、统计分析和数据库技术,自&够高度自动化地分析原有数据,作出归纳1生的推理,莽助决策者最终试识数据的真正价馕。

夔羞鼗器仓痒绶零懿菱震,大量验数攥蠢经装集藏和预整理。虫予数据仓库孛数据豹高质量静掰搦信息处理设施的存在,在数据仓库中进行复杂盼数据分析成为可能,于是基于太型数据仓库的数据挽搦技术的研究也得到了空前的重视。把数据挖掘建成在数据仓库之上.一方面能姆提高数据仓库系统的挟镄支持能力;另一方面,出乎数据仓库完成了数据盼收嶷、交换、集成、存耩帮管理工作,数据挖撼睡对晦悬经过初步娃理辫数攒,敏纛捷舞鼗器挖蠢我够夔捆专注于知识携发现,宥粕予发挥数据挖掘技术秘潜在能力。

本文根据数据仓库的特点,在传统的数据挖掘系统结构框架的基础上,提出了一种基于数据仓库的通用数据挖掘系绕的结构框槊.用于处理各种豢弛的数据挖掘任务。

毂蔫瑟翔;2∞昏璐一132一种基于数据仓库的数据挖掘系统结构框架

谈结构捱絮斡壤念模型主要虫熙户焱谗簌霜、壹询秘嚣氍、数攒锰痒管理系统,翔谖瘁瞥疆系统、模型库管理系统、朔谖痒发现颈处理搂块、知识评价模块、结论表选模块组成。系统结构框架如髑1所示。

强l—静基于数撂仓库秘通援靛据挖攘幕壤浆罐稳摇絮

其吾部分的功能简述如下:

?用户查询接口(Quefyjnt目face):将用户提出的知识发现请求通过一定的步骤解释成为规格化的查询语言,交由畿谢协同机进行处理。查询按期的工作可分为查询分擞、畿询解释及规格化两个部分。

?查诲酶藏辊(Qt埘eo。峨n越避):协辩数据仓瘁管理系绞、接麓痒管理系统和知谖痒管瑷赢统,莛弱对查诲接西搬竞麴奁运请求避{亍处理。豢询协弼瓤是系统的重要组成部分。

-数据仓库管理系统:直接负责对数据仓库进行管理,并完成对备种异构分布数据源中数据的提取工作.在最大限度上屏蔽各类异构数据游对累统带采的影响。

?知谓库罄联系统;对躲识痒进抒营壤和控%g,赶錾知诲嚣璜热、瓣辕、蔓舞秘查灞等。一骞囊,接

 万方数据

相关文档