资源预览内容
第1页 / 共27页
第2页 / 共27页
第3页 / 共27页
第4页 / 共27页
第5页 / 共27页
第6页 / 共27页
第7页 / 共27页
第8页 / 共27页
第9页 / 共27页
第10页 / 共27页
亲,该文档总共27页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
数据的统计描述和分析(1),内容,统计的基本概念 正态总体统计量的分布 参数估计 假设检验,统计的基本概念,总体和样本 频数与直方图 统计量 MATLAB 统计工具箱中的概率分布,总体和样本,总体:研究对象的某项数量指标的全体。 例: 某校某次六级考试成绩的全体 某城市全体市民的年龄 对总体的研究方法: 逐一研究和抽样调查,总体和样本,样本: 在抽样过程中,被抽出的那部分个体称为总体的一个样本。 样本容量n:被抽出的那部分个体的数量 简单随机样本:简称样本,简单随机样本(样本),频数表和直方图 对数据的初步整理与判断,频数:,将一组数据的取值范围划分成若干区间,该组数据落在各区间中的次数,称为频数。,直方图,根据频数表画出的矩形构成的图形。,格式:,用MATLAB获得直方图 hist,hist(data,k) k=10(缺省),用MATLAB获得频数表 dlmread 与hist,常用步骤:,1.先生成一个数据文件:.txt,2.从数据文件中读数据:,格式:矩阵名dlmread(文件名 ,t),注(1)文件名要写明路径, (2)t 表示每行数据间以制表符(tab)分开 (3)用Excel生成txt文件较好,用MATLAB获得频数表 hist,常用步骤:,3. N,X=hist(data,k),(1) 给出数组data(由前面的矩阵生成)的频数表,(2)data为行、列向量均可,(3)K为将min(data),max(data)等分的份数,(4)N为K个小区间的频数, X为K个小区间的中点,说明:,统计量:不含未知参数的样本的函数,设总体为X,样本(观察值)为 几种常用的统计量: 平均值和中位数 样本方差(标准差)、极差 偏度和峰度,平均值和中位数,平均值: 中位数: 需将数据从小到大排列 数据个数为奇数时,为中间位置的数 数据个数为偶数时,为中间位置的两个数的平均值,标准差(均方差):方差的平方根,方差,样本方差(标准差),极差,一组数据中最大值和最小值之差,偏度和峰度,偏度(skewness(x))衡量对称性,峰度(kurtosis(x))衡量偏离正态分布的尺度之一,MATLAB 统计工具箱中的概率分布,MATLAB 工具箱中有20种概率分布. 表中是几种常用的分布的MATLAB命令字符,MATLAB 统计工具箱中的概率分布,MATLAB 工具箱对每一种分布都提供5类函数. 当需要一种分布的某一类函数时,将以上所列的分布命令与函数命令拼接起来,并输入自变量和参数即可.,MATLAB 统计工具箱中的概率分布,注:求某种分布的上分位数用inv.,p=normpdf(x,mu,sigma),求均值mu, 标准差sigma 的正态分布在x处的密度函数值p=p(x)(mu=0,sigma=1时可缺省),MATLAB 统计工具箱中的概率分布,注:求某种分布的上分位数用inv.,P=tcdf(x,n),求t分布(自由度n)在x的分布函数值P=F(x),MATLAB 统计工具箱中的概率分布,注:求某种分布的上分位数用inv.,X=chi2inv(P,n),分布(自由度n)使分布函数值F(x)=P 的x(即P分位数),MATLAB 统计工具箱中的概率分布,m,v=fstat(n1,n2),分布(自由度n1,n2)的均值m和方差v,MATLAB 统计工具箱中的概率分布,画出以下图形 均值为0,自由度分别为2,20的t分布的概率密度曲线 自由度分别为5,10的x2分布的概率密度曲线 自由度分别为(10,50),(10,5)的F分布的概率密度曲线 标准正态分布的密度函数曲线 均值为0,均方差分别为1/4,1的正态分布的概率密度曲线,
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号