文档库 最新最全的文档下载
当前位置:文档库 › 基于数据流的任意形状聚类算法

基于数据流的任意形状聚类算法

ISSN1000—9825,CODENRUXUEW

JournalofSoftware,Vol17。No3,March2006,PP379—387

DOI:101360/josl70379

o2006byJournalofSoftwareAllrightsreserved

基于数据流的任意形状聚类算法。

束蔚恒+,印鉴,谢益煌

(中山大学计算机科学系,广东广州510275)

ArbitraryShapeClusterAlgorithmforClusteringDataStreamZHUWei—Heng,YINJian,XIEYi—Huang

(DepanmentofComputerScience,SunYat-SenUniversity,Guangzhnu510275,China)

+Correspondingauthor:E-mail:gz_zwh@263ilet,http://wwwsysueducn

E—mail:jos@iscasaccnhttp://www.josorgcnTel/Fax:+86-10.62562563

ZhuWH,YinJ_XieYH.Arbitraryshapeclusteralgorithmforclusteringdatastream.JournalofSoftware,2006,17(3):379—387.http://www.jos.orgen/1000?9825/17/379.htm

Abstract:CluStreamisapopulardatastreamclusteralgorithm,however,itisnotcapableenoughtoclusterarbitraryshapesandmakeclustersinperiodicdata.ThispaperintroducesanewalgorithmACluStreamtosolvetheseproblems.TheACluStreamisbasedonthepartitionandassembleofthespaceandclusterbydensityIntheexperiment,itisshownthatACluStreamisbetterthanCluStreaminspeedandaccuracy

Keywords:datastream;clustering;datamining

摘要:详细分析了数据流聚粪算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等.并针对这些不足之处提出了一种采用空问分割、组合以及按密度聚类的算法ACluStream.实验结果表明,ACluStream在准确度和速度上都比CluStream有较大的提高.

关键词:数据流;聚类;数据挖掘

中图法分类号:TP311文献标识码:A

近年来,由于硬件技术的高速发展,人们获取数据的能力得到了极大的提高现实生活中,经常可以看到这样的情况:大量需要处理的数据以很快的速度产生例如,美国条高速公路上的传感器网络每天可以收集到高达几百万条的数据.而电讯电话公司大型交换机上每天记录的通话记录就高达几下万条.由于数据量太大、数据产生的速度太快,按传统的数据库应用模式处理这些数据,即完整、详细地收集这些数据,清洗后将其储存在数据库中,再交由计算机仔细处理已成为不可能完成的任务.由有限的数据到有限的数据处理能力,计算机工作者们面临着新的挑战.

.SupportedbvtheNationalNaturaiScienceFoundationofChinaunderGrantNo60573097(国家自然科学基金);theResearchFoundationofNatienalScienceandTechnologyPlanProjectofChinaunderGrantNo2004BA72IA02(国家科技计划):theResearchFoundationofDisciplinesLeadingtoDoctorateDegreeofChineseUniversitiesunderGrantNo20050558017(高等学校博士学科点专项科研基金1:theNaturalScienceFoundationofC,uangdongProvinceofChinaunderGrantNos05200302,04300462(广东省自然科学基金1,theResearchFoundationofScienceandTechnologyPlanProjectinGuangdongProvinceofChinaunderGrantNo2005810101032r广东省科技计划项目)

Received2004.09-28;Accepkd2005—03—11

万方数据

相关文档