文档库 最新最全的文档下载
当前位置:文档库 › 基于MPI的并行PSO混合K均值聚类算法

基于MPI的并行PSO混合K均值聚类算法

万方数据

万方数据

万方数据

万方数据

第2期张春生等:Apnori算法低频规则的有效性及实现437

foreach

frequent

iteImetkiIl工

genrules(^,^)

//genrules()递归产生一个频繁项集的关联规则5实验证明

对第1章中的事务集,应用A砸ori低频规则挖掘算法和经典的C4.5算法进行数据挖掘。

1)Apfiofi低频规则挖掘。

估计考研学生的群体人数为5一lO,经典支持度80%,则群体支持度区间[(5/63)×80%,(10/63)×80%]*[6.3%,12.7%]一[5%,15%],选取置信度为80%。

挖掘结果如图1所示,产生频繁项7个,最大频繁项5个,关联规则一个:“去向(研究牛)一专业成绩好”。

图1应用Apfiofi低频挖掘算法的结果

2)C4.5算法挖掘。

golf.nanles文件内容(命名文件)

A,B,C,D.

//输出(毕业去向):A研究生;B:公务员;C:就业;D:降级math:continuous.//数学:连续值speciality:continuous.

//专业:连续值english:continuous.//英语:连续值phedu:continuous.//体育:连续值moral:continuous.//德育:连续值golf.data文件内容(事务数据文件61个样本)

7l,64,65,9,25,C

79,79,77,10,25,C

74,56,52,9,25,D

图2CA.5决策树输出

从C4.5决策树上可以看出,存在规则(Spaciality>83一A),在1)的属性定义中,“专业课>=85”为“专业课成绩好”,2)中定义“输出(毕业去向):A研究生”,所以此决策树输出存在规则:“专业成绩好一去向(研究生)”,这与1)的挖掘结果完全吻合。

6结语

通过实例对比可以看出,本文提出的Apriori低频挖掘算法克服了经典Apriori算法的缺陷,可按群体特征对数据库进行数据挖掘,发现经典Apriori算法不能发现的或很难发现的强关联规则,发现了事务数据库中潜在的规则。

本文不是简单地对经典Apriori算法进行扩展或改进,因为它从理论』:破坏了Apriori算法全局、高频两个性质,从算法实现过程来看,算法的效率与经典Apfiori算法相同。

参考文献:

【1】毛国君,段立娟,王实,等.数据挖掘原理与算法[M1.2版.北京:清华大学出版社,2007.

【2】KANTARDZICM.数据挖掘——概念、模型、方法和算法【M】.闪四清,陈茵,程雁,译.北京:清华大学出版杜,2003.

【3】DUNHAMMH.数据挖掘教程【M】.郭崇慧,田凤占,靳晓明,译.北京:清华大学出版社,2005.

【4】HANJIAWEI,PEIJIAN,Y1NYIWEN.MiningfrequentpaRenmwithoutcandidategeneration【C】//Proceedingsofthe2000ACMSIGMODInternalConferenceonManagementofData.NewYork:

ACM,2000:1—12.

【5】BERZALF,CUBEROJC,MARINN,eta/.1.BAR:Anefficientmethodforassociationrule

mininginrelationaldatabases【J】.Data&KnowledgeEngineering,2001。37(1):47-64.

【6】皮德常,秦小麟,王宁生.基于动态剪枝的关联规则挖掘算法【J】.小型微型计算机系统,2004,25(10):1850—1852.

【7】刘以安,羊斌.关联规则挖掘中对Apfiofi算法的一种改进研究【J】.计算机应用,2007,27(2):418—420.

【8】宫雨.分组多支持度关联规则研究【J】.计算机工程与设计,2007,28(5):1205—1207.

【9】史原,鲁汉榕,罗菁,等.基于规模约简和多支持度的关联规则挖掘【J】.计算机工程与设计,2006,27(21):4105—410r7.

【lO】阮璐,肖冬荣.周杰,等.利用组合支持度进行关联规则挖掘【J】.微计算机信息,2008(9):239—240.

f11】楼晓鸿,丁宝康.一种多支持度的关联规则采集算法【J】.计算机工程,2001,27(6):102—103.

【12】李刚,董祥军.多支持度关联规则的研究【J】.广西轻工业,2007,23f5):60—61.

【13】uUBING,HSUW,MAY.Miningassociationruleswithmuhipie-minimumsupports【C】//ProceedingsofthefifthACMSIGKDDin-ternationalconferenceonKnowledgediscoveryanddatamining.

NewYork:ACM.1999:143—150.

(上接第431页)

【11】ZHANGYUFANG,XIONGZHONGYANG,MAOJIALI,eta1.【15】都志辉.高性能之并行编程技术——MPI并行程序设计【M1.北

ThestudyofparallelK-me¥fft8algorithm【C】//Proceedingsofthe6thWorldCongressonIntelligentControlandAutomation.

Washington,DC:IEEEComputerSociety,2006:5868—5871.

f12】韩晓红,胡或.K—means聚类算法的研究【J】.太原理工大学学报,2009,40(3):236—239.

【13】SHIYH,EBERHARTRC.Parameterselectioninparticleswarmoptimization【J】.LectureNotesinComputerScience,1998(1447):

591—600.

【14】陈国良.并行计算——结构?算法?编程【M】.北京:高等教育出版社,2001.

京:清华大学出版社,2001.

【16lMPI文档【EB/OL】.【2010一05—10】.http://www.mpi?forum.org/docsddocs/html.

[17JMPICH文档[EB/OL】.【2010—05—10】.http://www.1∞s.anl.gov/researeh/projects/mpich2/.

【18】王华秋,廖晓峰.微粒群并行聚类在客户细分中的应用【J】.计算机应用研究,2008,25(10):2987—2990.

【19】UCI数据库【EB/OL】.【2010一06—20】.http://archive.ics.uei.

edu/ml/machine-leamin8一databases/.万方数据

基于MPI的并行PSO混合K均值聚类算法

作者:吕奕清, 林锦贤, L(U) Yi-qing, LIN Jin-xian

作者单位:福州大学,数学与计算机科学学院,福州,350108

刊名:

计算机应用

英文刊名:JOURNAL OF COMPUTER APPLICATIONS

年,卷(期):2011,31(2)

参考文献(38条)

1.UCI数据库 2010

2.MACQUEEN J B Some methods for classification and analysis of multivariate observations 1967

3.王华秋;廖晓峰微粒群并行聚类在客户细分中的应用[期刊论文]-计算机应用研究 2008(10)

4.AL-DAOUD M B.ROBERTS S A New methods for the initialization of clusters 1996(5)

5.MPICH文档 2010

6.毛韶阳.林肯立优化K-means.初始聚类中心研究 2007(22)

7.MPI 文档 2010

8.王艳华.杨建雄.徐家宁基于免疫遗传的K-Means聚类算法分析 2008(13)

9.都志辉高性能之并行编程技术--MPI并行程序设计 2001

10.KENNEDY J.EBERHART R Particle 8warm optimization 1995

11.陈国良并行计算--结构@算法@编程 2001

12.SU SHENG Image classification based on particle swarm optimization combined with K-means 2009

13.SHI Y H;EBERHART R C Parameter selection in particle swarm optimization 1998(1447)

14.宋凌.李枚毅.李孝源基于粒群优化的K均值算法及其应用 2008(16)

15.韩晓红;胡彧K-means 聚类算法的研究[期刊论文]-太原理工大学学报 2009(03)

16.刘靖明.韩丽川粒子群优化k均值的混合聚类算法研究 2004(z1)

17.ZHANG YUFANG;XIONG ZHONGYANG;MAO JIALI The study of parallel K-means algorithm 2006

18.陶新民.徐晶.杨立标.刘玉一种改进的粒子群和K均值混合聚类算法 2010(1)

19.KAO I W;TSAI C Y;WANG Y C An effective particle swarm optimization method for data clustering 2007

20.KAO I W.TSAI C Y.WANG Y C An effective particle swarm optimization method for data clustering 2007

21.陶新民;徐晶;杨立标一种改进的粒子群和K均值混合聚类算法[期刊论文]-电子与信息学报 2010(01)

22.ZHANG YUFANG.XIONG ZHONGYANG.MAO JIALI The study of parallel K-means algorithm 2006

23.刘靖明;韩丽川粒子群优化K均值的混合聚类算法研究[期刊论文]-中国管理科学 2004(12)

24.韩晓红.胡彧K-means聚类算法的研究 2009(3)

25.宋凌;李枚毅;李孝源基于粒群优化的K均值算法及其应用[期刊论文]-计算机工程 2008(16)

26.SHI Y H.EBERHART R C Parameter selection in particle swarm optimization 1998(1447)

27.SU SHENG Image classification based on particle swarm optimization combined with K-means 2009

28.陈国良并行计算--结构@算法@编程 2001

29.KENNEDY J;EBERHART R Particle 8warm optimization 1995

30.都志辉高性能之并行编程技术--MPI并行程序设计 2001

31.王艳华;杨建雄;徐家宁基于免疫遗传的K-means聚类算法分析[期刊论文]-计算机工程与设计 2008(13)

32.MPI 文档 2010

33.毛韶阳;林肯立优化K-means.初始聚类中心研究 2007(22)

34.MPICH文档 2010

35.AL-DAOUD M B;ROBERTS S A New methods for the initialization of clusters 1996(05)

36.王华秋.廖晓峰微粒群并行聚类在客户细分中的应用 2008(10)

37.MACQUEEN J B Some methods for classification and analysis of multivariate observations 1967

38.UCI数据库 2010

本文链接:https://www.wendangku.net/doc/2b7051714.html,/Periodical_jsjyy201102040.aspx

相关文档