资源预览内容
第1页 / 共31页
第2页 / 共31页
第3页 / 共31页
第4页 / 共31页
第5页 / 共31页
第6页 / 共31页
第7页 / 共31页
第8页 / 共31页
第9页 / 共31页
第10页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
实验一 Bayes分类器设计本实验旨在让同学对模式识别有一个初步的理解能够根据自己的设计对贝叶斯决策理 论算法有一个深刻地认识,理解二类分类器的设计原理。1实验原理最小风险贝叶斯决策可按下列步骤进行:在已知P(气),P(X|气),i=1 ,.,c及给出待识别的X的情况下,根据贝叶斯公 式计算出后验概率:,P(X )P()P(3.|X ) = ii j = 1,., X u P(X g )P() i i j=1(2)利用计算出的后验概率及决策表,按下面的公式计算出采取,i=1,a的条件风 险R(atX) = / 人(气,.)P(.|X),i = 1,2,.,a j=1对(2)中得到的a个条件风险值R(a X) ,i=1,.,a进行比较,找出使其条件风险最 I小的决策气,即则匕就是最小风险贝叶斯决策。2实验内容假定某个局部区域细胞识别中正常(g 1)和非正常(也)两类先验概率分别为正常状态:P(g 1 ) =0.9 ;异常状态:P( g2 ) =0.1。现有一系列待观察的细胞,其观察值为X :-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.4885-0.7431-0.4221-1.11864.2532已知类条件概率密度曲线如下图:P(x I气)p(x I2)类条件概率分布正态分布分别为(-2,0.25)( 2,4)试对观察的结果进 彳亍分类。3实验要求1)用matlab完成分类器的设计,要求程序相应语句有说明文字。2)根据例子画出后验概率的分布曲线以及分类的结果示意图。3)如果是最小风险贝叶斯决策,决策表如下:最小风险贝叶斯决策表:请重新设计程序,画出相应的后验概率的分布曲线和分类结果并比较两个结果。最小错误率贝叶斯决策试验程序x=-3.9847,-3.5549,-1.2401,-0.9780,-0.7932,-2.8531,-2.7605,-3.7287,-3.5414 ,-2.2692,-3.4549,-3.0752,-3.9934,2.8792,.-0.9780,0.7932,1.1882 ,3.0682,-1.5799 ,-1.4885 ,-0.7431 ,-0.4221 ,-1.1186 ,4.2532 ;num=24; %输入的特征值个数result=zeros(1,num);%存放分类结果e1 = -2;%正常细胞的特征均值a1=0.5;%正常细胞的特征标准差e2=2;%异常细胞的特征均值a2=2;%异常细胞的特征标准差pw1=0.9;%正常细胞出现的概率pw2=0.1;%异常细胞出现的概率for i = 1:numpw1_x=normpdf(x(i),e1,a1)*pw1; %正常细胞后验概率的分子pw2_x=normpdf(x(i),e2,a2)*pw2; %异常细胞后验概率的分子if pw1_xpw2_xresult(i) = 1;%识别结果为正常细胞endenda=-5:0.05:5;n二numel(a);pw1_plot=zeros(1,n);pw2_plot=zeros(1,n);for j = 1:npw1_plot(j) = (pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1) + pw2*normpdf(a(j),e2,a2);%正常细胞后验概率pw2_plot(j) = (pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1) + pw2*normpdf(a(j),e2,a2);%异常细胞后验概率endfigure(1);hold on;plot(a,pw1_plot,k-,a,pw2_plot,r-.);for k=1:numif result(k) = = 1plot(x(k),-0.1,b*);% 正常细胞分布elseplot(x(k),-0.1,rp);%异常细胞分布endendlegend(正常细胞后验概率曲线,异常细胞后验概率曲线,正常细胞,异常细胞);xlabel (样品细胞特征值);ylabel(后验概率);title(后验概率分布曲线);grid on;实验结果后验概率分布曲线带的曲线为判决成异常细胞的后验概率曲线;另一条平滑的曲线为判为正常细胞的后验概率曲线。根据最小错误概率准则,判决结果见曲线下方,其中*代表判决为正常细胞,五角星 代表异常细胞各细胞分类结果。最小风险贝叶斯决策分类器设计实验程序x = -3.9847 , -3.5549 , -1.2401 , -0.9780 , -0.7932 , -2.8531,-2.7605 ,-3.7287 , -3.5414 , -2.2692,-3.4549 , -3.0752 , -3.9934 , 2.8792 , -0.9780 , 0.7932 , 1.1882 , 3.0682, -1.5799 , -1.4885 , -0.7431 , -0.4221 , -1.1186 , 4.2532 ;disp(x)pw1=0.9 ;%第一类的先验概率pw2=0.1 ;%第二类的先验概率m = numel(x); %样品个数R1_x=zeros(1,m) ;%判为第一类的条件风险R2_x=zeros(1,m) ;%判为第二类的条件风险result二zeros(1,m) ;%识别结果e1 = -2; %第一类的均值a1=0.5 ;%第一类的标准差e2=2 ;%第二类的均值a2=2 ;%第二类的标准差%决策表r11=0 ;r12=2 ;r21=4 ;r22=0 ;%计算条件风险for i = 1:mR1_x(i)=r11*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1) + pw2*normpdf(x(i), e2,a2) + r21*pw2*normpdf(x(i) ,e2,a2)/(pw1*normpdf(x(i),e1,a1) + pw2*normpdf(x(i), e2,a2);R2_x(i) = r12*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1) + pw2*normpdf(x(i), e2,a2) + r22*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1) + pw2*normpdf(x(i), e2,a2);endfor i = 1:mif R2_x(i)R1_x(i)%result(i)=0;elseresult(i) = 1;endend a=-5:0.05:5;n=numel(a);R1_plot=zeros(1,n);R2_plot=zeros(1,n);for j = 1:nR1_plot(j) = r11*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1) + pw2*normpdf( a(j),e2,a2) + r21*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1) + pw2*normpdf (a(j),e2,a2);R2_plot(j) = r12*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1) + pw2*normpdf( a(j),e2,a2) + r22*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1) + pw2*normpdf (a(j),e2,a2);endfigure(1)hold onplot(a,R1_plot,b-,a,R2_plot,g*-)for k=1:mif result(k) =0plot(x(k),-0.1,bA,)elseplot(x(k),-0.1,,go,)end;end;legend(正常细胞,异常细胞,Location,Best)xlabel(细胞分类结果)ylabel(条件风险)title(风险决策曲线)grid on实验结果风险决策曲线4正常细胞 异常细胞3.5险风件条-0.50.50-5-4-3-2-1012345细胞分类结果3其中带*的绿色曲线代表异常细胞的条件风险曲线;另一条光滑的蓝色曲线为判为正常细胞的条件风险曲线。根据贝叶斯最小风险判决准则,判决结果见曲线下方,其中上三角代表判决为正常细胞,圆圈代表异常细胞。比较分析:在图1中,这两个样本点下两类决策的后验概率相差很小,当结合最小风险贝叶斯决策表进行计算时,损失因素就起了主导作用,导致出现了相反的结果。实验二三多分类Bayes分类器设计数据集为Mnistall数据集,加载到内存,解析数据集的组织结构,完成10类手写体数据 集的分类问题。实验原理首先提取手写体的特征,训练集为28*28的手写体图片,将手写体图片等分为7*7份,每 一份的大小为4*4,统计每份中非0像素(即手写体)的个数n,像素占有率大于T(设为0.05) 取特征值1,否则取特征值0。对于要识别的手写体,首先提取特征值,然后计算09类的后验概率,后验概率最大即为对应类别实验内容%手写体特征值提取函数function sample_feature=feature_extraction(sample)%单个样品的行数,单个样品的列数,训练集的个数image_row,image_col,sample_num=size(sample);sample_feature二zeros(49,sample_num);%存储训练集的特彳正yuzhi=0.05;%窗口面积比阈值%提取训练集的特征for k=1:sample_nump=1;for i = 1:4:image_row-3for j = 1:4:image_col-3for m=i:i+3for n=j:j + 3if (sample(m,n,k)=0)%统计手写体中每个窗口中非零像素的个数sample_feature(p,k)=sample_feature(p,k) + 1;endendend%面积占有率大于yuzhi取特征值为1if ( (sample_feature(p,k)/16)yuzhi )sample_feature(p,k) = 1;elsesample_feature(p,k)=0;endp=p+1;endend
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号