万方数据
万方数据
万方数据
万方数据
第2期张春生等:Apnori算法低频规则的有效性及实现437
foreach
frequent
iteImetkiIl工
genrules(^,^)
//genrules()递归产生一个频繁项集的关联规则5实验证明
对第1章中的事务集,应用A砸ori低频规则挖掘算法和经典的C4.5算法进行数据挖掘。
1)Apfiofi低频规则挖掘。
估计考研学生的群体人数为5一lO,经典支持度80%,则群体支持度区间[(5/63)×80%,(10/63)×80%]*[6.3%,12.7%]一[5%,15%],选取置信度为80%。
挖掘结果如图1所示,产生频繁项7个,最大频繁项5个,关联规则一个:“去向(研究牛)一专业成绩好”。
图1应用Apfiofi低频挖掘算法的结果
2)C4.5算法挖掘。
golf.nanles文件内容(命名文件)
A,B,C,D.
//输出(毕业去向):A研究生;B:公务员;C:就业;D:降级math:continuous.//数学:连续值speciality:continuous.
//专业:连续值english:continuous.//英语:连续值phedu:continuous.//体育:连续值moral:continuous.//德育:连续值golf.data文件内容(事务数据文件61个样本)
7l,64,65,9,25,C
79,79,77,10,25,C
74,56,52,9,25,D
图2CA.5决策树输出
从C4.5决策树上可以看出,存在规则(Spaciality>83一A),在1)的属性定义中,“专业课>=85”为“专业课成绩好”,2)中定义“输出(毕业去向):A研究生”,所以此决策树输出存在规则:“专业成绩好一去向(研究生)”,这与1)的挖掘结果完全吻合。
6结语
通过实例对比可以看出,本文提出的Apriori低频挖掘算法克服了经典Apriori算法的缺陷,可按群体特征对数据库进行数据挖掘,发现经典Apriori算法不能发现的或很难发现的强关联规则,发现了事务数据库中潜在的规则。
本文不是简单地对经典Apriori算法进行扩展或改进,因为它从理论』:破坏了Apriori算法全局、高频两个性质,从算法实现过程来看,算法的效率与经典Apfiori算法相同。
参考文献:
【1】毛国君,段立娟,王实,等.数据挖掘原理与算法[M1.2版.北京:清华大学出版社,2007.
【2】KANTARDZICM.数据挖掘——概念、模型、方法和算法【M】.闪四清,陈茵,程雁,译.北京:清华大学出版杜,2003.
【3】DUNHAMMH.数据挖掘教程【M】.郭崇慧,田凤占,靳晓明,译.北京:清华大学出版社,2005.
【4】HANJIAWEI,PEIJIAN,Y1NYIWEN.MiningfrequentpaRenmwithoutcandidategeneration【C】//Proceedingsofthe2000ACMSIGMODInternalConferenceonManagementofData.NewYork:
ACM,2000:1—12.
【5】BERZALF,CUBEROJC,MARINN,eta/.1.BAR:Anefficientmethodforassociationrule
mininginrelationaldatabases【J】.Data&KnowledgeEngineering,2001。37(1):47-64.
【6】皮德常,秦小麟,王宁生.基于动态剪枝的关联规则挖掘算法【J】.小型微型计算机系统,2004,25(10):1850—1852.
【7】刘以安,羊斌.关联规则挖掘中对Apfiofi算法的一种改进研究【J】.计算机应用,2007,27(2):418—420.
【8】宫雨.分组多支持度关联规则研究【J】.计算机工程与设计,2007,28(5):1205—1207.
【9】史原,鲁汉榕,罗菁,等.基于规模约简和多支持度的关联规则挖掘【J】.计算机工程与设计,2006,27(21):4105—410r7.
【lO】阮璐,肖冬荣.周杰,等.利用组合支持度进行关联规则挖掘【J】.微计算机信息,2008(9):239—240.
f11】楼晓鸿,丁宝康.一种多支持度的关联规则采集算法【J】.计算机工程,2001,27(6):102—103.
【12】李刚,董祥军.多支持度关联规则的研究【J】.广西轻工业,2007,23f5):60—61.
【13】uUBING,HSUW,MAY.Miningassociationruleswithmuhipie-minimumsupports【C】//ProceedingsofthefifthACMSIGKDDin-ternationalconferenceonKnowledgediscoveryanddatamining.
NewYork:ACM.1999:143—150.
(上接第431页)
【11】ZHANGYUFANG,XIONGZHONGYANG,MAOJIALI,eta1.【15】都志辉.高性能之并行编程技术——MPI并行程序设计【M1.北
ThestudyofparallelK-me¥fft8algorithm【C】//Proceedingsofthe6thWorldCongressonIntelligentControlandAutomation.
Washington,DC:IEEEComputerSociety,2006:5868—5871.
f12】韩晓红,胡或.K—means聚类算法的研究【J】.太原理工大学学报,2009,40(3):236—239.
【13】SHIYH,EBERHARTRC.Parameterselectioninparticleswarmoptimization【J】.LectureNotesinComputerScience,1998(1447):
591—600.
【14】陈国良.并行计算——结构?算法?编程【M】.北京:高等教育出版社,2001.
京:清华大学出版社,2001.
【16lMPI文档【EB/OL】.【2010一05—10】.http://www.mpi?forum.org/docsddocs/html.
[17JMPICH文档[EB/OL】.【2010—05—10】.http://www.1∞s.anl.gov/researeh/projects/mpich2/.
【18】王华秋,廖晓峰.微粒群并行聚类在客户细分中的应用【J】.计算机应用研究,2008,25(10):2987—2990.
【19】UCI数据库【EB/OL】.【2010一06—20】.http://archive.ics.uei.
edu/ml/machine-leamin8一databases/.万方数据
基于MPI的并行PSO混合K均值聚类算法
作者:吕奕清, 林锦贤, L(U) Yi-qing, LIN Jin-xian
作者单位:福州大学,数学与计算机科学学院,福州,350108
刊名:
计算机应用
英文刊名:JOURNAL OF COMPUTER APPLICATIONS
年,卷(期):2011,31(2)
参考文献(38条)
1.UCI数据库 2010
2.MACQUEEN J B Some methods for classification and analysis of multivariate observations 1967
3.王华秋;廖晓峰微粒群并行聚类在客户细分中的应用[期刊论文]-计算机应用研究 2008(10)
4.AL-DAOUD M B.ROBERTS S A New methods for the initialization of clusters 1996(5)
5.MPICH文档 2010
6.毛韶阳.林肯立优化K-means.初始聚类中心研究 2007(22)
7.MPI 文档 2010
8.王艳华.杨建雄.徐家宁基于免疫遗传的K-Means聚类算法分析 2008(13)
9.都志辉高性能之并行编程技术--MPI并行程序设计 2001
10.KENNEDY J.EBERHART R Particle 8warm optimization 1995
11.陈国良并行计算--结构@算法@编程 2001
12.SU SHENG Image classification based on particle swarm optimization combined with K-means 2009
13.SHI Y H;EBERHART R C Parameter selection in particle swarm optimization 1998(1447)
14.宋凌.李枚毅.李孝源基于粒群优化的K均值算法及其应用 2008(16)
15.韩晓红;胡彧K-means 聚类算法的研究[期刊论文]-太原理工大学学报 2009(03)
16.刘靖明.韩丽川粒子群优化k均值的混合聚类算法研究 2004(z1)
17.ZHANG YUFANG;XIONG ZHONGYANG;MAO JIALI The study of parallel K-means algorithm 2006
18.陶新民.徐晶.杨立标.刘玉一种改进的粒子群和K均值混合聚类算法 2010(1)
19.KAO I W;TSAI C Y;WANG Y C An effective particle swarm optimization method for data clustering 2007
20.KAO I W.TSAI C Y.WANG Y C An effective particle swarm optimization method for data clustering 2007
21.陶新民;徐晶;杨立标一种改进的粒子群和K均值混合聚类算法[期刊论文]-电子与信息学报 2010(01)
22.ZHANG YUFANG.XIONG ZHONGYANG.MAO JIALI The study of parallel K-means algorithm 2006
23.刘靖明;韩丽川粒子群优化K均值的混合聚类算法研究[期刊论文]-中国管理科学 2004(12)
24.韩晓红.胡彧K-means聚类算法的研究 2009(3)
25.宋凌;李枚毅;李孝源基于粒群优化的K均值算法及其应用[期刊论文]-计算机工程 2008(16)
26.SHI Y H.EBERHART R C Parameter selection in particle swarm optimization 1998(1447)
27.SU SHENG Image classification based on particle swarm optimization combined with K-means 2009
28.陈国良并行计算--结构@算法@编程 2001
29.KENNEDY J;EBERHART R Particle 8warm optimization 1995
30.都志辉高性能之并行编程技术--MPI并行程序设计 2001
31.王艳华;杨建雄;徐家宁基于免疫遗传的K-means聚类算法分析[期刊论文]-计算机工程与设计 2008(13)
32.MPI 文档 2010
33.毛韶阳;林肯立优化K-means.初始聚类中心研究 2007(22)
34.MPICH文档 2010
35.AL-DAOUD M B;ROBERTS S A New methods for the initialization of clusters 1996(05)
36.王华秋.廖晓峰微粒群并行聚类在客户细分中的应用 2008(10)
37.MACQUEEN J B Some methods for classification and analysis of multivariate observations 1967
38.UCI数据库 2010
本文链接:https://www.wendangku.net/doc/2b7051714.html,/Periodical_jsjyy201102040.aspx