资源预览内容
第1页 / 共66页
第2页 / 共66页
第3页 / 共66页
第4页 / 共66页
第5页 / 共66页
第6页 / 共66页
第7页 / 共66页
第8页 / 共66页
第9页 / 共66页
第10页 / 共66页
亲,该文档总共66页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第四章 随机变量、概率和概率分 布 本章内容 第一节 概率的有关概念 第二节 随机变量及其概率分布概述 第三节 常用的概率分布 二项分布、正态分布 第四节 常用的抽样分布 卡方分布、t分布、F分布 第一节 概率的有关概念 样本的实际发生率称为频率。设在相同 条件下,独立重复进行n次试验,事件A出现 f 次,则事件A出现的频率为f/n。 概率:随机事件发生的可能性大小,用 大写的P 表示;取值0,1。 一、频率与概率 frequency and probability 必然事件 P = 1 随机事件 0 P 1 不可能事件 P = 0 P 0.05(5)或P 0.01(1)称为 小概率事件(习惯),统计学上认为不大可能发生。 二、随机事件 Random events CertainCertain ImpossibleImpossible 0.50.5 0 0 1 1 样本空间(sampling space):随机试 验的所有可能的结果称为样本空间。 频率与概率间的关系: 1. 样本频率总是围绕概率上下波动 2. 样本含量n越大,波动幅度越小,频 率越接近概率。 三、概率的定义 后验概率后验概率(或统计概率) 随机事件的频率 当n无限增大时,随机事件A的频率会稳 定在一个常数P,这个常数就是随机事件A 的概率。 (61) 先验概率(古典概率) 古典概率模型要求满足两个条件: 试验的所有可能结果是有限的; 每一种可能结果出现的可能性相等 。 (62) 四概率的性质 1任何随机事件任何随机事件的概率都是在0与1 之间的正数,即 0 P(A)1 2不可能事件不可能事件的概率等于零,即 P(A )= 0 3必然事件必然事件的概率等于1,即 P(A)= 1 五概率的加法定理和乘法定理 概率的加法定理概率的加法定理 若事件发生,则事件就一定不发生 ,这样的两个事件为互不相容事件。 两互不相容事件互不相容事件和的概率,等于这两个 事件概率之和,即 (63) (64) 概率的乘法定理 若事件发生不影响事件是否发生,这 样的两个事件为互相独立事件。 两个互相独立事件互相独立事件积的概率,等于这两个 事件概率的乘积,即 (95) (96) 例1:某一学生从个试题中任意 抽取一题,进行口试。如果抽到每一 题的概率为15,则抽到试题或试 题的概率是多少? 如果前一个学生 把抽过的试题还回后,后一个学生再 抽,则个学生都抽到试题1的概率是 多少? 计 算 抽到第一题或第二题的概率应为抽到第一 题的概率和抽到第二题的概率之和,即 四个学生都抽到第一题即四个学生同时抽 到第一题,其概率应为抽到第一题的概率的 乘积,即 例2:从30个白球和 20个黑球共50个球中 随机抽取两次(放回 抽样),问抽出一个 黑球和一个白球的概 率是多少? 抽出一个白球的概率为35,抽出一个 黑球的概率为25。 抽出一个黑球和一个白球的情况应包 括先抽出一个黑球、后抽出一个白球和 先抽出一个白球、后抽出一个黑球两种 情况。因此: 第二节 随机变量及其概率分布 概述 一、随机变量 每次抛两个硬币,记录正、反面结果;结果可记 录为: 硬币1正面朝上,硬币2正面朝上; 2个正面 硬币1正面朝上,硬币2反面朝上; 1个正面 硬币1反面朝上,硬币2正面朝上; 1个正面 硬币1反面朝上,硬币2反面朝上 0个正面 正面数就是一个随机变量,记为x,我们通常对x 的每个取值的概率感兴趣。 对于本例,x的取值为0、1、2。 二、概率分布及其类型 概率分布(probability distribution ):描述随机变量值xi及这些值对应概率 P(X=xi)的表格、公式或图形。一般用概率 分布函数进行描述。 依不同的标准,对概率分布可作不 同的分类。 (一)离散型随机变量与连续型随机 变量 依随机变量的类型,可 将概率分布分为离散型概率离散型概率 分布分布与连续型概率分布连续型概率分布。心 理与教育统计学中最常用的 离散型分布是二项分布,最 常用的连续型分布是正态分 布。 离散型随机变量(discrete random variable): 数据间有缝隙,其取值可以列举。 例如抛硬币10次,正面的可能取值x为0、1、2、3 、4、5、6、7、8、9、10 连续型随机变量(continous random variable)数 据间无缝隙,其取值充满整个区间,无法一一列举每 一可能值 例如身高、体重、血清胆固醇含量 (二)经验分布与理论分布 依分布函数的来源,可将概率分布 分为经验分布与理论分布。 经验分布经验分布(empirical distribution) 是指根据观察或实验所获得的数据而编 制的次数分布或相对频率分布。 理论分布理论分布(theoretical distribution) 是按某种数学模型计算出的概率分布。 (三)基本随机变量分布与抽样分 布 依所描述的数据的样本特性,可 将概率分布分为基本随机变量分布与 抽样分布(sampling distribution)。 基本随机变量分布基本随机变量分布是随机变量各 种不同取值情况的概率分布,抽样分抽样分 布布是从同一总体内抽取的不同样本的 统计量的概率分布。 1. 离散型随机变量的概率分布 离散型随机变量的概率分布举例 2. 连续型随机变量的概率分布 变量的取值充满整个数值区间,无 法一一列出其每一个可能值。 一般将连续型随机变量整理成频数 表,对频数作直方图,直方图的每个 矩形顶端连接的阶梯形曲线来描述连 续型变量的频数分布。 如果样本量很大,组段很多,矩形顶端 组成的阶梯型曲线可变成光滑的分布曲线。 大多数情况下,可采用一个函数拟合这一光 滑曲线。这种函数称为概率密度函数( probability density function) 如果连续型随机变量X的概率密度函数 记为: 则在区间x1,x2 范围内的概率可由微 积分函数定义 第三节 常用的概率分布 离散型随机变量分布 一、二项分布、泊松分布 连续型随机变量分布 二、正态分布 一二项分布 二项分布( bionimal distribution) 是一种具有广泛用途 的离散型随机变量的 概率分布,它是由贝 努里创始的,因此又 称为贝努里分布。 (一)二项试验 满足以下条件的试验称为二项试 验: 一次试验只有两种两种可能的结果结果, 即成功和失败; 各次试验相互独立独立,即各次试验 之间互不影响; 各次试验中成功成功的概率相等,失失 败败的概率也相等相等。 (二)二项分布函数 二项分布是一种离散型随机变 量的概率分布。 用 n 次方的二项展开式来表达 在 n 次二项试验中成功事件出现 的不同次数(X0,1)的概率 分布,叫做二项分布函数。 二项展开式的通式(即二项分布函数): (67 ) 二项展开式的要点: 项数:二项展开式中共有n1项 。 方次:p的方次,从n0为降幂; q的方次从0n为升幂。每项p与q方 次之和等于n。 系数:各项系数是成功事件次数 的组合数。 例:从男生占/的学校中随机 抽取个学生,问正好抽到个 男生的概率是多少?最多抽到 个男生的概率是多少? 解:将n=6,p=2/5,q=3/5,X=4 代入(67)式,则恰好抽到4个男 生的概率为 最多抽到个男生的概率,等于 个也没有抽到、抽到个和抽到 两个男生的概率之和,即 (三)二项分布图 以成功事件出现的次数为横坐 标,以成功事件出现不同次数的概 率为纵坐标,绘制直方图或多边图 ,即为二项分布图。 二项分布是离散型分布,其概 率直方图是跃阶式。 二项分布的性质 从概率直方图可以看到,二项 分布有如下性质: 当p=q时,图形是对称的。 当pq时,直方图呈偏态。 pq与pq时的偏斜方向相反。 (四)二项分布的平均数和标准差 如果二项分布满足pq且 nq5(或 者pq且 np5时,二项分布接近于正态 分布。可用下面的方法计算二项分布的平 均数和标准差。 二项分布的平均数为 二项分布的标准 差为 (68) (69) (五)二项分布的应用 二项分布函数除 了用来求成功事件恰 好出现X次的概率之 外,在教育中主要用 来判断试验结果的机 遇性与真实性的界限 。 例如,一个学生凭猜测做10个是 非题,平均可以猜对5题。什么情况 下可以说他是真会而不是猜测呢? 这种问题需要用累积概率来算。 当做对题或题以上时,累积概 率为0.989,也就是说,猜对题或 10题的概率不足0.05。 表6-1 一个学生做10个正误题做对不同题数的概率 分布 做对题对题 目 数 出现现方式 数 概率P(X)累积积概率 010.0010.001 1100.0100.011 2450.0440.055 31200.1170.172 42100.2050.377 52520.2460.623 62100.2050.828 71200.1170.945 8450.0440.989 9100.0100.999 1010.0011.000 总总和10241.000 例题:一个教师对8个学生的作 业成绩进行猜测,如果教师猜对的 可能性为13,问: 平均能猜对几个学生的成绩 ? 假如规定猜对95,才算这 个教师有一定的评判能力,那么这 个教师至少要猜对几个学生? 解: Poisson分布概率的计 算 Poisson分布的性质(1) 一、Poisson分布的均数与方差相 等 即2=m 二、Poisson分布的可加性 Poisson分布的性质(2) 三、Poisson分布的正态近似 m相当大(20)时,近似服从 正态分布:N(m, m ) 四、二项分布的Poisson分布近似 1. 概率密度函数 二 正态分布 (Normal Distribution) 2. 概率分布函数 (1)正态分布在横轴上方均数处最高。 (2) 正态分布以均数为中心,左右对称 。 (3)正态分布由参数和确定。是位置 参数,当不变时,越大,则曲线沿横轴越向 右移动;反之,越小,曲线沿横轴越向左移动 。是变异度参数,当不变时,越大,表示 数据越分散,曲线越平坦;越小,表示数据越 集中,曲线越陡峭。 (4)正态分布曲线与X轴所围成的面积为1。 (5)在的区间内占总面积的68.27%, 在1.96的区间内占总面积的95%;在 2.58的区间内占总面积的99%。 正态分布特征 标准正态分布 标准正态离差 标准正态分布:N(0,1) 此概率密度函数实质上就是正态分布 的概率密度函数中=0,=1的情形。 从几何意义上说,此变换实质上是作了 一个坐标轴的平移和尺度变换,使正态 分布具有平均数为=0,标准差=1。 这种变换称为标准化正态变换。因此将 这种具有平均数为=0,标准差=1的 正态分布称为标准正态分布,记为N(0 ,1)。 普通正态分布与标准正态分 布 X Z (Z) (Z) 标准正态分布的累积概率函 数 正态分布概率密度曲线在-1+1的区间内 占总面积的68.27%,在-1.96+1.96的区间内 占总面积的95%;在-2.58 +2.58的区间内占 总面积的99%。 曲线下面积分布规律 0-1 1 -1.96 1.96-2.582.58 68.27% 95.00% 99.00% -+-1.96+1.96-2.58 +2.58 68.27% 95.00% 99.00% Z值分布曲线下面积与概率 正态分布的特征,归纳起来有两点 : 一是对称性(symmetry) 若分布不对称就是偏态,长尾拖向 右侧(变量值较大的一侧)叫做正偏态,或 右偏态;
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号