资源预览内容
第1页 / 共29页
第2页 / 共29页
第3页 / 共29页
第4页 / 共29页
第5页 / 共29页
第6页 / 共29页
第7页 / 共29页
第8页 / 共29页
第9页 / 共29页
第10页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2 粗糙集粗糙集2.1 2.1 信息系统信息系统设设S=(U,A,V,f)S=(U,A,V,f)为一个信息系统,也称为知识表示系统。其为一个信息系统,也称为知识表示系统。其中,中,U= UU= U1,U,U2,U,U3,U,U|u|为有限非空集合,称为论域对为有限非空集合,称为论域对象空间;象空间;A=aA=a1,a,a2,a,a3,a,a|A|为属性的非空有限集合。若为属性的非空有限集合。若A A中的属性又可分为两个不相交的子集,即条件属性集中的属性又可分为两个不相交的子集,即条件属性集C C和和决策属性集决策属性集D D,A=CD,CD= ,A=CD,CD= ,则则S S也称为决策表。也称为决策表。 V=VV=Va 其中其中aA, V Va为属性为属性a的值域;的值域;f:UAVV为信息为信息函数,对于函数,对于aA,xU,f(x,a)Va,它指定了,它指定了U中每一中每一对象的属性值。对象的属性值。巡支陵砒啸驾柞戍鲤崇啪缩吃拭喜褪机羌镜赐洽啄钟祟农狂葱萄莽尊窗弟经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.2 不可分辨关系不可分辨关系(Indiscribility relation 令令aA,xU,f(x,a)Va;对于任一子集;对于任一子集P A A,在,在U U上的不可分上的不可分辨关系辨关系I I定义为:定义为:I=(x,y)I=(x,y)UU:f(x,q)=f(y,q) qP 若若(x,y)I I,则则称称x x和和y y是是不不可分辨的。可分辨的。简茎磕拼唾兑技赵绎砚畜缄功薪沟角勇勃份庐谋笛匠烦瞪被绞阉浦芯枪孜经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.2 不可分辨关系不可分辨关系Indiscernibility relation 显然,这样定义的不显然,这样定义的不可分辨关系是一个等价可分辨关系是一个等价关系关系( (自反自反 的、对称的、的、对称的、传递的)。传递的)。 包含对象包含对象x的等价类的等价类记为记为I(x)。等价类与知等价类与知识粒度的表达相对应,识粒度的表达相对应,它是粗糙集主要概念,它是粗糙集主要概念,如近似、依赖及约简等,如近似、依赖及约简等,定义的基础定义的基础带镰膨幂润团端肪噪氓素叮沪粤闻翱窟睦现腹浑敬柳钡爱氏毫乓纹淹之臃经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法 粗糙集的主要思想粗糙集的主要思想 粗糙集的主要思想是基于不可分辨关系,粗糙集的主要思想是基于不可分辨关系,每一个对象与一些信息相联系,且对象仅能每一个对象与一些信息相联系,且对象仅能用获得的信息表示。因此,具有相同或相似用获得的信息表示。因此,具有相同或相似信息的对象不能被识别。论域的不可分辨对信息的对象不能被识别。论域的不可分辨对象形成了不可分辨对象的聚类,即知识粒度。象形成了不可分辨对象的聚类,即知识粒度。用于近似的知识将用于近似的知识将U划分为由条件属性集判划分为由条件属性集判断是不可分辨的对象元素集,元素集被视为断是不可分辨的对象元素集,元素集被视为用于近似的用于近似的“知识粒度知识粒度”;被近似的知识将;被近似的知识将U划分为由决策属性集生成的决策类,在此划分为由决策属性集生成的决策类,在此基础上,用一种知识近似另一种知识。基础上,用一种知识近似另一种知识。鸿牲革径酷粉碗沥屹缝乏呈嫩袍旬聘汾鹤频谆察攒捍嚏甸咙潮汲蚀仑绘婪经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.3 粗糙近似粗糙近似黔差尼寓剥芭贞烩陶冗连失搓墨衡震氧奥钝忌狄军率逮管蹿扫惶漫替冯谓经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.3 粗糙近似粗糙近似定义定义 给定一个信息系统(知识表示系统)给定一个信息系统(知识表示系统)S=(U,A,V,f),A=CD卑钮西浓拱坯吾冗搜榆抢歌仍颖宰毫围越驭咕矗就拍剃喀策袁啼株恋甭忿经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.3 粗糙近似粗糙近似 集合集合X的下近似实际上是由那些根据已有知识判断的下近似实际上是由那些根据已有知识判断肯肯定属于定属于X的对象所组成的最大的集合,也称为的对象所组成的最大的集合,也称为X的正区的正区,记记作作pos(X)(X); 集合集合X X的负区的负区neg(X)neg(X)为为根据已有知识判断根据已有知识判断肯定不属于肯定不属于X的对象组成的集合的对象组成的集合; ; 集合集合X的上近似的上近似由所有与由所有与X相交非空的等价类的并集组相交非空的等价类的并集组成成,即那些可能属于,即那些可能属于X的对象组成的最小集合。的对象组成的最小集合。 集合集合X的边界区的边界区bnd(X)bnd(X)为集合为集合X的上近似与下近似之差的上近似与下近似之差,如果如果bnd(X)bnd(X)是空集,则称是空集,则称X关于关于I是清晰的;反之如果是清晰的;反之如果bnd bnd (X)(X)不是空集,则称集合不是空集,则称集合X关于关于I是粗糙的。是粗糙的。河搜窒性抢壕多课姑母趁幽糯丝戎街熟垮婪烬粹展捕藤咋坑乍遵士足形铡经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.4 粗糙隶属函数粗糙隶属函数缉废哗狮收擎钥管珐晃养儒序渺廊锈矗崇尉趁谗脐坠谆味互旧鼓峦松锐使经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.4 近似精度与近似质量近似精度与近似质量遮赚茸廖蜡捌钎绿惕苹护睫渠数独犹台滁石贩包疫韩谓闽寡强鹏焕袍运姬经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例表表1所示的关于全球变暖的一个信息系统所示的关于全球变暖的一个信息系统, a1太阳能太阳能(Solar energy),a2火山活动火山活动(Volcanic activity) , a3二氧化碳含量(二氧化碳含量(Residual CO2,),),d温度温度(Temperature)昔闰瓜殷镑厉撅斡颖背电结袖唤赊未壕报诗埠厩彼敖败汰粕刑逮气惭刚孤经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例 对论域进行划分,可得如下等价类对论域进行划分,可得如下等价类 U/C=X1, X2, X3, X4, X5, X6其中:其中:X1=n1,X2=n2,X3=n3,X4=n4,n5,n6,n9,X5=n7,X6=n8YL=n2,n3,n4,n5,n6, n8,YH=n1, n7, n9洞胜羞娱磋彦舔诵宿切纯快罚匿痹察垛混升笑归鸡膳烩褐兄揍桂旭殃栋驼经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例X1=n1,X2=n2,X3=n3,X4=n4,n5,n6,n9,X5=n7,X6=n8YL=n2,n3,n4,n5,n6, n8,YH=n1, n7, n9据此可求得粗糙近似如下据此可求得粗糙近似如下:YL的下近似:的下近似:aprapr( (Yn) )=n2 , n3 ,n8YL的上近似:的上近似: n2 ,n3 ,n4,n5,n6,n9YH的下近似:的下近似:aprapr( (Yp)=)= n1, n7YH的上近似:的上近似: n1,n7,n4,n5,n6,n9 YL的分类精度的分类精度=3/6=0.5YH的分类精度的分类精度=2/6=0.33 分类质量分类质量=5/9=0.56耍脾求毅岩嚎袄鹅晚峦拖兴潦诅担冤辫沮押茨态吞瞒盐衰怖斯汛斧飘莹旗经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2. 5 属性约简与核属性约简与核狙任均同惟脐捍傻抓持继钠搐晃醒耍狮睬座失织郑啸镇晾性颖呆暗坷矢几经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.6 决策规则决策规则吭挡捣埂竣劝奈钎成餐摊滴职犁瓤楞雁晒甄坛踌厄迄垦衫苟佛欧垒庚盐咖经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.7 约简算法约简算法撒诫依戳恬况盎眨萧岛巢凝放一沛举括狠荣始铬睦论宫坛给粳灼苛忍灭悬经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.7 约简算法约简算法 约简对于在模型中分类对象最终构建约简对于在模型中分类对象最终构建一系列规则是重要的,有关的文献探讨一系列规则是重要的,有关的文献探讨了约简的两个主要方面,一方面是为给了约简的两个主要方面,一方面是为给定的系统寻找约简的问题,这个问题是定的系统寻找约简的问题,这个问题是一个一个NP完全问题,常见的约简算法有:完全问题,常见的约简算法有:快速约简、遗传算法、动态约简、相容快速约简、遗传算法、动态约简、相容性约简等。性约简等。藐明被辣癸膊时脑舵屏派辜愁构撞忻吃裔稻呈希桃察蔚学兼惶隶懦殉悲筏经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例 下面通过一个简单的例子说明,如表下面通过一个简单的例子说明,如表1所示,所示,S=(U,A,V,f),其中,其中U= n1, n2, n3, n4, n5, n6, n7,条件条件属性集属性集C=a1, a2, a3 , a4, a5, a6,决策属性集,决策属性集D=d。扳拭贿猖耙蹬累冀猫菊冯茸形博贺粉硒好坡蓟啄那召茫搬轰疵训敞旗躯蜕经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例对论域进行划分,可得如下等价类对论域进行划分,可得如下等价类U/C=X1, X2, X3, X4, X5其其 中中 : X1=n1,n4,n6, X2=n2, X3=n3, X4=n5, X5=n7U/D=YN,YP其中:其中:YN=n1, n2,n3,YP=n4, n5,n6, n7贬传筋鲤涩蒲弯够菠流缨驰挫儿悯儡堰妹剔誉侍窗喻碱衷叠袒蝶韧紫宋炬经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例X1=n1,n4,n6, X2=n2, X3=n3, X4=n5,X5=n7YN=n1, n2,n3,YP=n4, n5,n6, n7Yn的下近似:的下近似:aprapr( (Yn) ) =n2, n3 Yn的上近似:的上近似:apr(apr(Yn) ) =n2, n3 , n4, n1, n6Yp的下近似:的下近似:aprapr( (Yp)=)= n5, n7 Yp的上近似:的上近似:apr(apr(Yp)=)= n5, n7 , n4, n1, n6 Yn的分类精度的分类精度=2/5=0.4YP的分类精度的分类精度=2/5=0.4 分类质量分类质量=4/7=0.57跳帅蛤乔凳喝著坛每左吻栽挠味事急趁聋垢泉咒液颁班坞甭纳志碍裴陈侮经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例U/D=YN,YP以以a1对对论论域域进进行行划划分分,我我们们求求分分类类质量:质量:YN=n1, n2,n3,YP=n4, n5,n6, n7X1=n1, n2,n4,n6,X2=n3, n5 , n7,因此分类质量为:因此分类质量为:分类质量分类质量=0/7=0 显然属性显然属性a1不是约简。不是约简。宾阮疤心藏蜂团秋削挤显户夹跨昏挥臂读毛捶陀沙湍淫屎职屯蚕仍南波辰经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例U/D=YN,YP以以属属性性集集a1,a2对对论论域域进进行行划划分分,我们求分类质量:我们求分类质量:YN=n1, n2,n3,YP=n4, n5,n6, n7X1=n1, n2,n4,n6,X2=n3, n5,n7,因此分类质量为:因此分类质量为:分类质量分类质量=0/7=0 显然显然属性集属性集a1,a2不是约简。不是约简。惠双父具效母垣进伤常犀凶凄网融掇吕营嚏糖越竭诸切肛眼抓陌血圃湃泊经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例U/D=YN,YP以以属属性性集集a1,a3对对论论域域进进行行划划分分,我们求分类质量:我们求分类质量:YN=n1, n2,n3,YP=n4, n5,n6, n7X1=n1,n4,n6,X2=n2,X3=n3,X4=n5,n7因此分类质量为:因此分类质量为:分类质量分类质量=4/7=0.57 由于由于a1,a3与全部条件属性集具与全部条件属性集具有相同的分类质量,且为最小的条件有相同的分类质量,且为最小的条件属性子集,因此为约简。属性子集,因此为约简。勇惩密楷晕毕渐竿局您牺通取面革符伙瞳屑愈兢称腰信落追街绑散彝缔鸳经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例可求得约简为:可求得约简为:a1,a3,a4,a5,a5,a6由由约约简简a1 ,a3构构造造的的决决策策规则为规则为: :If a11a3=2 then d=N 支持对象数支持对象数 1If a12a3=1 thend=N 支持对象数支持对象数 1a12a3=2 then d=P 支持对象数为支持对象数为2分类质量分类质量=4/7=0.57圆滇渭污恢脑宙付血橡咆赁酱粳娶荤义泼梗蔼簧苛缺未频绝评淳蜗秸蛰昂经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 算例算例表表1所示的关于全球变暖的一个信息系统所示的关于全球变暖的一个信息系统, a1太阳能太阳能(Solar energy),a2火山活动火山活动(Volcanic activity) , a3二氧化碳含量(二氧化碳含量(Residual CO2,),),d温度温度(Temperature)婿偿卢蚕平鬃釜额献珠玫丘珍雹镶酣啄炽啄呐晴么邯斋淘凿削池几寸偿恬经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例(1) 求整个条件属性集的分类质量:求整个条件属性集的分类质量:分类质量分类质量=5/9=0.56(2) 求约简求约简由属性由属性a1对论域进行划分,可得如下等价类对论域进行划分,可得如下等价类 U/a1=X1, X2, X3, X4, X5, X6其中:其中:X1=n1,n3,n8,X2=n2,n4,n5,n6,n9,X3=n7YL=n2,n3,n4,n5,n6, n8,YH=n1, n7, n9显然,属性显然,属性a1的的分类质量小于总的分类质量,属性分类质量小于总的分类质量,属性a1不是约简不是约简缺桓种痔泰乌温仔妊穿子块辕厘厅密砒鸭韶墨池哨枚吗丹琶滞靴涎巾斗湾经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例由属性由属性a1 , a2对论域进行划分,可得如下等价类对论域进行划分,可得如下等价类 U/C=X1, X2, X3, X4, X5, X6其中:其中:X1=n1,X2=n2,X3=n3, n8,X4=n4,n5,n6,n9,X5=n7YL=n2,n3,n4,n5,n6, n8,YH=n1, n7, n9分类质量分类质量=5/9=0.56,与整个属性集的分类质量相同,与整个属性集的分类质量相同因此,属性子集因此,属性子集a1,a2是约简。是约简。孽拴暗所答定眉妥碟恍侥庆毛菇营名来倔舰啥茂史猎陆力匣周划简泅酌并经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例由属性由属性a1 , a3对论域进行划分,可得如下等价类对论域进行划分,可得如下等价类 U/C=X1, X2, X3, X4, X5, X6其中:其中:X1=n1,X2=n2,X3=n3,X4=n4,n5,n6,n9,X5=n7,X6=n8YL=n2,n3,n4,n5,n6, n8,YH=n1, n7, n9分类质量分类质量=5/9=0.56,与整个属性集的分类质量相同,与整个属性集的分类质量相同因此,属性子集因此,属性子集a1,a3也是约简。也是约简。敬始则公鸡安肆菌戍翌怀半远莆厘邯侈臃影恐厌遵泉咙霓氦母摊蛤踞肩俗经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法2.8 求约简算例求约简算例婚朔佛组翅篇辅卑庐破闪芬雀孺怂掇阔诧醚变刚阳希催帘措弛生潜渗构弟经典粗糙集理论经典粗糙集理论上一页上一页下一页下一页返回本章首页返回本章首页粗糙集的基础理论和方法粗糙集的基础理论和方法数据离散数据离散 粗糙集理论分析要求,数据必须以类别的形式出现。因粗糙集理论分析要求,数据必须以类别的形式出现。因此,连续数据必须首先进行离散化处理,离散的结果可能会此,连续数据必须首先进行离散化处理,离散的结果可能会减小原始数据的精度,但将会提高它的一般性。减小原始数据的精度,但将会提高它的一般性。 数据离散问题是一个数据离散问题是一个NP完全问题,数据离散可分为专家完全问题,数据离散可分为专家离散与自动离散,专家离散指由某一领域的专家根据他的判离散与自动离散,专家离散指由某一领域的专家根据他的判断或使用该领域确定的标准进行的离散;自动离散指按自动断或使用该领域确定的标准进行的离散;自动离散指按自动定义的方式进行的离散,定义的方式进行的离散,自动离散方法又可分为有监督离散法和无监督自动离散法,自动离散方法又可分为有监督离散法和无监督自动离散法,无监督离散法可视为一个简单的聚类过程,无监督离散法可视为一个简单的聚类过程,如等频率区间法、如等频率区间法、等大小宽度区间法。有监督的的离散化方法又可分为两类,等大小宽度区间法。有监督的的离散化方法又可分为两类,全局离散方法与局部离散方法。全局离散方法与局部离散方法。 注注:将信息系统中的连续型数据离散为粗糙集模型可用的数将信息系统中的连续型数据离散为粗糙集模型可用的数据时,会产生潜在的信息损失,这个问题值得探讨。据时,会产生潜在的信息损失,这个问题值得探讨。椽截描侄腆枝泡烹农买键蔬凯摘跳摆吱饿壳服蓄邵瞒文晴丁芋炉赁嘎旭碾经典粗糙集理论经典粗糙集理论
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号