文档库 最新最全的文档下载
当前位置:文档库 › 决策表属性约简的相对划分粒度表示

决策表属性约简的相对划分粒度表示

小型微型计算机系统JournalofChineseComputerSystems2008年12月第12期V01.29No.122008

决策表属性约简的相对划分粒度表示

冯琴荣z一,苗夺谦1,程跌1

1(同济大学计算机科学与技术系.上海.201804)

。(山西师范大学数学与计算机科学学院,山西临汾041004)

E-mail;Fengqr72@163.COm

摘要:粗糙集理论认为知识就是分类.表文对知识的分类能力给予了量化.提出利用划分粒度来定量地表示知识的分类能力.在划分粒度概念基础上。针对决簋表定义了相对划分粒度并研究了它的性质,相对划分粒度可以定量表示决策表的条件属性子集相对于决策属性的分类能力的强弱}最后证明了对一致决策表的属性约简来说,相对划分粒度表示与Pawlak提出的代数表示是等价的.

关键词:粗糙集;划分粒度;决策表;相对划分粒度

中图分类号:TPl8文献标识码:A文章编号:1000-1220(2008)12—2305.04

PresentationofRelativePartitionGranularityofAttributesReductionforDecisionTable

FENGQin—ton91“.MIAODuo-qianl。CHENGYil

1(Departmento,ComputerScienceandTechnology.TongjiUniversity,Shanghai201804,China)

2(College0,MathematicsandComputerScience。ShanziNormal

University?口咖n041004?China)

Abstract:Knowledgeandclassificationsarerelatedtogetherbythetheoryofroughsetswhichclaimisthatknowledgeisdeep-seatedintheclassificatoryabilitiesofhumanbeings.Inthispaper,wefirstlygiveaquantitativerepresentationoftheabilityofknowledge’sclassification.andprovideanovelrepresentationforknowledge?thatis,itcanbeexpressedbypartitiongranular-ity.Secondly,therelativepartitiongranularityisdefined?anditsqualitiesarediscussed,wheretherelativepartitiongranulari_tycan

beusedtodeseripttheclassificationabilityofconditionalattributesrelatetodecisionattribute.Finally,theequivalencebetweenthealgebraicrepresentationandtherelativepartitiongranularityrepresentationisprovedforaconsistentdecisiontable.

Keywords:roughset;granularityofpartition,decisiontable;relativegranularityofpartition

1引官

粗糙集理论[1。。]是1982年由波兰学者Pawlak教授提出的,它是一种处理不完备、不精确和不确定知识的新的数学工具.粗糙集理论认为知识就是对论域的划分,而划分与等价关系是一一对应的,因此Pawlak教授基于等价关系和集合运算提出了知识的代效表示.在知识的代数表示中,粗糙集理论的许多概念与运算的直观性较差,不容易使人理解其本质,并且在此表示下许多算法的效率也不高.我们知道,同一问题在不同知识表示下的算法复杂性是不同的[“.籍于此苗夺谦教授从一个全新的角度重新审视了知识。他认为知识可以看成是论域的子集组成的争代数上的随机变量。并以信息论为基础,借助于信息熵的良好的解释性。提出利用信息嫡来表示知识。从而提出了知识的信息表示[“],信息表示从更深层次上揭示了知识的本质,并且基于知识的信息表示可以设计一些高效的算法.

信息表示虽然有较好的解释性,然而它的运算仍较复杂.本文直接从划分出发来研究知识.我们知道,每个划分包含若干个划分块,而每个划分块又是论域的一个子集,本文称之为一个划分粒.对一个划分粒来说如何度量它的大小呢?自然会想到用集合基数来度量.由粗糙集理论知,一个划分它包含的划分粒越多,它的分类能力就越强(因为论域中元素个数是固定不变的).而粒度是对粒大小的一种平均度量,因此对一个划分来说.可以使用其划分粒的平均大小来度量它的分类能力.本文将知识看成是定义在由它导出的划分粒基数上的随机变量,并定义了随机变量的概率分布,基于此概率分布定义了知识的划分粒度,它是划分粒大小的概率平均,从而可以使用划分粒度来定量地表示知识的分类能力.

知识约简是粗糙集理论的核,b内容之一,对信息系统而言,知识约简就是在保持其分类能力不变的前提下,删除其中的冗余属性I而对决策表而言,知识约简就是在保持其条件属性集相对于决策属性分类能力不变的前提下,删除其中的冗余属性.在决策表中。如何来度量决策表的条件属性子集相对于决策属性的分类能力呢?本文在划分粒度概念基础上针对

收稿日期:2007—07—16基金项目:国家自然科学基金项目(60475019.60775036)资助;教育部博士点专项基金项目(20060247039)劁J.作者简介t冯琴荣.女,1972年生.博士研究生,副教授.研究方向为粗糙集理论、粒计算;苗夺谦,男,1964年生.教授.博士生导师,研究方向为粗糙集理论、粒计算、Web智能,模式识别等I程映.女。1977年生。博士研究生.讲师。研究方向为粗糙模糊集理论、模糊粗糙集理论.

 万方数据

相关文档