资源预览内容
第1页 / 共60页
第2页 / 共60页
第3页 / 共60页
第4页 / 共60页
第5页 / 共60页
第6页 / 共60页
第7页 / 共60页
第8页 / 共60页
第9页 / 共60页
第10页 / 共60页
亲,该文档总共60页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
关于初中概率统计教学的关于初中概率统计教学的几点注释几点注释北京大学数学学院北京大学数学学院数理统计研究所数理统计研究所谢衷洁谢衷洁 1. 1. 关于中学概率统计教学的几点看法关于中学概率统计教学的几点看法: 在中学阶段,概率统计教育的目的是为将来学习严格是为将来学习严格而系统的概率统计理论和方法奠定一个初步的基础而系统的概率统计理论和方法奠定一个初步的基础,因而有别于大学和其它(如商业和职业)的教育。A.初中阶段初中阶段:建议重点应该是学习初等概率论,以古典 概型作为重点;统计则学会一些直观 的数据处理方法即可。B. 概率统计概率统计:是一门严格的数学分支,应该按严格的:是一门严格的数学分支,应该按严格的规范进行教学。规范进行教学。切切不可把它(特别是概率论)当成切切不可把它(特别是概率论)当成一门一门 “实验科学实验科学”来进行教学!来进行教学!2 概率论在初中阶段的教学是一个大难题。概率论在初中阶段的教学是一个大难题。 先问一问题: 升学考试有一道题是:任意三角形的内角之和是任意三角形的内角之和是;试证明你的结论。;试证明你的结论。 :小明当场在考卷上画了一个任意三角形并用直尺、半圆尺 进行测量得如下结果(按升序): 178.5,179,179.5,180,180,180.5,181,181.5答答:用平均数或用中位数皆得用平均数或用中位数皆得 180, 由此,任意三角形的内角之和是由此,任意三角形的内角之和是 180. 问:如何判分? 涉及到:用实验方法证明数学命题是否为真?# 第第7、下教本、下教本,p.120 是用是用 ”已知已知“ ”几何推理几何推理“”结论结论“ 的的 ”规规范证明范证明“3 例如有题:袋中有 X个黑球,Y个白球,有放回随机取一球,从复 n 次。问:从取出白球和黑球数,能判断它们的X,Y的大小吗?吗? 解:“ 动手实验吧动手实验吧 * ” 球的颜色 黑球 白球 摸的次数 18 22答:不一样大,据上述实验,白球比黑球多。白球比黑球多。* “ 动手实验动手实验” 是书中常出现的话,但它解决不了概率论问题的是书中常出现的话,但它解决不了概率论问题的: 真实的是:真实的是:4个黑球,个黑球,3个白球!个白球! 记录记录 40 次实验结果如下次实验结果如下:(:(真实的实验记录真实的实验记录) B, B, B, B,W, B, B, W,B, W, W,W,B, W,B, B, W,W,B, B, W,B, W,W,W, B, W, B, W,B, W,W,W,W,W, W,W,B, W, B.对吗?对吗?4初中阶段概率论学习重点初中阶段概率论学习重点I. 随机实验与随机事件随机实验与随机事件: Df 1. 设设 S 是一组可重复(实验)的条件组是一组可重复(实验)的条件组,在在 S 实现之下事件实现之下事件 A 可发生也可能不发生,可发生也可能不发生,则则 A 称为是随机事件。称为是随机事件。 特例:特例:如果在如果在 S 实现之下事件实现之下事件 A 一定发生,一定发生,则则 A 称为必然事件,常记为称为必然事件,常记为 ;若一定不发;若一定不发生则称为不可能事件,常记为生则称为不可能事件,常记为。条件组条件组S 要列全,问要列全,问: “通常加热到1000 C,水沸腾” 是何类事件? (书中题)5 Df 2:在在S S 实现的条件下实现的条件下, ,A A 出现的可能出现的可能 性的数值度量称为是性的数值度量称为是A A 出现的概率,出现的概率, 记为记为P P( (A A).). 若干问题:若干问题:1.请给我算算,请给我算算,“我孩子今年高考能考上我孩子今年高考能考上 北大北大” 的概率有多大?的概率有多大?:关键点是:关键点是 A 必须和必须和 S 联系在一起,而联系在一起,而S 必须是必须是可重复的实验可重复的实验 才能讨论才能讨论 A 的概率的概率:S= “我孩子,我孩子,今年,今年,高考高考” A= “能考上北大能考上北大” A 确实可能出现也可能不出现,但确实可能出现也可能不出现,但S不可重复!不可重复! 62. 我将于我将于2012-12-25乘乘HL205 航班,问:航班,问: 能安全到达的概率有多大?能安全到达的概率有多大?:S= “2012-12-25,HL航线,航线,205航班航班” A= “安全到达安全到达” A 可能出现也可能不出现,可能出现也可能不出现, 但但 S 不可重复!不可重复!3. . X X先生将进行心脏移植,先生将进行心脏移植,问:能活问:能活1 1年以上年以上 的概率有多大?的概率有多大?4. 2012-12-21 据称地球上将出现大灾难,试据称地球上将出现大灾难,试 求其发生的概率有多大?求其发生的概率有多大? :以上皆属不可重复的事件。:以上皆属不可重复的事件。7 如果将以上问题改一改如果将以上问题改一改:1.从北大附中的从北大附中的应届毕业生中任选应届毕业生中任选1人人, 他(她)能考上北大(够分数线)他(她)能考上北大(够分数线) 的概率有多大?的概率有多大?则则 “ 毕业生中选一人毕业生中选一人” 是可重复的(原则上)是可重复的(原则上) 2.乘乘HL205 航班,问能安全到达的概率多大?航班,问能安全到达的概率多大?有意义:因有意义:因可重复观察它的飞行记录。可重复观察它的飞行记录。3. 当前技术条件下,心脏移植存活天数超过当前技术条件下,心脏移植存活天数超过 1 年的年的 概率有多大?概率有多大? 国外已经有大量的医学记录可查。国外已经有大量的医学记录可查。8II. II. 随机事件的概率随机事件的概率1. 随机事件概率的计算随机事件概率的计算: 随机事件A 的概率的获得,一般讲是通过以下两条途径:数学的理论计算数学的理论计算(精确值或近似值精确值或近似值)以及通过统计实验统计实验以获得 概率的近似估计值。概率的近似估计值。2. 频率与概率的关系:频率与概率的关系:Df:对对S 进行进行n 次重复的实验,随机事件次重复的实验,随机事件A,出现了,出现了 f n 次,若存在一个值次,若存在一个值 pA , 并有并有 则:称 pA 为 A 事件的概率。 9注注1. “存在一个值 pA ” , 是理论上说的,实际上往往谁也不知道,而且由于现实生活中 n 是有限的,因而 f n 将围绕什么 pA 摆动,有时是有争议的。: 用样本是不可能定出真正的概率值的用样本是不可能定出真正的概率值的, 永远只能是估计值。估计值。例如:2003年,在中国发生严重的SARS 疫情,问:SARS的死亡率 pA 是多少?是多少?n 已由几百逐渐升到几千,pA 的估计值:0.06,0.070.15,当 n =5327,也是个估计值。10答:是辩证的统一答:是辩证的统一。客观上 pA 是未知的,我们是通过 f n 来认识它的大小,然而 f n 又受到 pA 的 制约,即 fn /n 必须在它的邻域内,这就是置信区间置信区间。其中 ,而上述论断的保证概率为而上述论断的保证概率为 0.95 (= 1-):要彻底地理解 f n 与 pA 关系,就是:当样本量 n 充分大时, 有以下关系式成立:注注2:有老师问频率与概率的辩证关系是什么?:有老师问频率与概率的辩证关系是什么?11 例如:SARS,n = 5327, 保证率为 0.95:由此看出:当时估计 SARS 死亡概率为:0.06-(钟教授)是正确的,而0.12- (HK)0.15- (WHO)是错误的!置信区间估计概率图示置信区间估计概率图示12 问题:Pearson 投掷他的硬币 24000 次,出正面 12012 次,得: fn /n = 0.5005问:他的硬币真的是问:他的硬币真的是 “ 两面绝对匀称两面绝对匀称 ” 吗吗?P = 0.5 ?答:不知道!但,可断言: 如果要求我的回答的可信度是:99% 则:断言其硬币出正面的概率 P = 0.5005 0.016628 :P 0.492186,0.50881413III. 古典概型:古典概型:1. Df :一个随机实验 S ,如果满足以下条件: (1). 一切可能的实验结果只有有限多种有限多种,记为 (2). 每次实验,必定而且而且只出现一个只出现一个 Ai (3). 中各元素 地位匀称地位匀称。 满足以上条件的S 就称为是古典概率模型。以后称满足以上3条件的 为基本事件集基本事件集。14 有书称:实验中,有 n 种可能, 出现机会均等,事件 A 包含 m 种结果,则 :此中没有讲 n 种结果是否构成 “基本事件组基本事件组”如:右图,考虑: A1,A2,A3,A4,A5,投1个点,出现在它们之一的可能性相等,n = 5, 设 A= 投投1个点出现在上半部个点出现在上半部 , 包含 3 个 Ai 其概率为 P(A)=3/5 ?152. 古典概型的概率计算古典概型的概率计算:设 S 是古典概型,基本事件集为 , B 是由 m(B) 个基本事件个基本事件所组成的随机事件,即: 其中 是 的子集,则:B 出现的概率为 。 :例如:S 是 掷骰子的实验, 是基本事件集,问 B =出满足 的解事件的概率是多少?答:1/3 (即 1,3)16b. 130页:有转盘如右图, 求转动转盘后,能停在 “红或黄红或黄“ 的概率。解:基本事件组为 “红(R)”,“黄(Y)”,“绿(G)” 对吗?:应按面积和颜色分为: R1, R2, R3 , G1, G2, Y1, Y2 则,它们组成了 “基本事件组”于是所求:P(“红” 或 “黄”)=(3+2)/7 =5/7不对:因为上述3个事件,出现不是 “等可能性”。173. 若干常用的计算古典概型的定理若干常用的计算古典概型的定理:定理定理1. N 个号码写在 m 个格子上,号码允许重复允许重复,但与次序有关,则一切可能的总数是 N m . 定理定理2. 以上若号码不允许不允许重复重复,m N ,则一切可能的总数是 特别:特别: 当 m = N, 则一切可能的总数是 18 与次序无关的定理:与次序无关的定理: 有 n 个不同的数,写在 k 个格子上,数不重复数不重复也不计次不计次序序, 问:一切可能结果有多少种?(问:一切可能结果有多少种?( 0 k n ) 解:n 个不同数 1. 有次序地写在有次序地写在 k 个格子上个格子上, 符号不重复则可能结果为: m = n(n-1)(n-2)(n-k+1) 2. 此 k 个结果的有序排列有有序排列有 k ! 种 3. 若 取出 的 k 个符号不计次序,19定理定理 3. N 个不同的元素中取 m 个,只看内容不看次序,则一切可能总数是 与次序无关的定理与次序无关的定理: 在一个口袋中有四个大小、质地相同的小球,上面分别标有数字1,2,3,4。现从中随机抽取一个(不放回),再从剩下的3个中随机抽取第二个小球。 计算前后两次取出的两个小球上的数字之积为奇数的概率 是多少? (以上及以下2题皆出自某名校中考概率统计总复习中考概率统计总复习)20解:上述问题由于无放回,最后结果与次序无关无放回,最后结果与次序无关。 故本题等价于:袋中有1,2,3,4 号球, 从中取两个(不看次序),问:球上的 两数之积为奇数的概率。此题为典型的古典概型问题之一:总数 积为奇数, 2,4 必不出现其中,只能 ( 1, 3 ) 一种: P =1/621 又问:如果有放回有放回取两数,求积为奇数的概率。解:相当于4个号码写在2个格子内,符号允许重复,用定理1,N = 4,m = 2, 则 总数 n = 42 =16 种。如今(2,4)不能出现,变为2 个符号写在2个格内,有22=4 种,则: P = 4/16 =1/422书书184页(九下)页(九下)。袋中有。袋中有4 个绿球个绿球,4 个红球个红球,从中取,从中取 4 球球(按题意是无放回),规则为(按题意是无放回),规则为: 摸到球的颜色 收益 4 个全红 得 50 元 3 红 1 绿 得 20 元 2 红 2 绿 失 30 元 1 红 3 绿 得 20 元 4 个全 绿 得 50 元问:问:1. 玩玩 1 次,收益为正的概率是多少?次,收益为正的概率是多少? 2. 玩玩10次,平均收益为正的概率是多少?次,平均收益为正的概率是多少?# 书中号召“与同伴合作,多做实验与同伴合作,多做实验”,看来是 用统计方法来解决概率论问题。如果用数学方法,需用组合公式的知识:23# 通过实验,还是不知此游戏是否一定赔。 要解决这一问题,靠实验是不行的,必须用数学方法。 列表法,理论上是对的,但操作起来,并非易事。列表法,理论上是对的,但操作起来,并非易事。1.(4,0),(1,3),(2,2),(1,3),(2,2) (2,2),(1,3), (1,3),(3,1),(3,1) M-C 实验记录,n = 10: 出 2 红,2 绿 3次,赔 330=90 元; 出 4 红 1 次,得 50 元,其它 6 次得 6 20=120元 总共:得 170 90 =80元,小明赚了!2. (2,2),(2,2),(2,2),(2,2),(1,3) (1,3),(3,1),(3,1),(2,2),(2,2): 出 2 红,2 绿 6次,赔 630=180 元; 出 其它 4 次得 4 20=80元 总共:得 180 80 =100 元,小明赔了!24 4 红红 4 绿,从中取绿,从中取 4 个的一切可能结果如下:个的一切可能结果如下: 数学上应用排列、组合的公式:25 以上问题,如何计算其中的 “ 基本事件组 ” 数,数学上需用到以下的超几何分布模型:答: 袋中有 n1 个 红球,n2 个绿球,从中无放回 取 m 个球 (m n1, n2 ), 问:能取中红球数为 k = 0, 1, 2, ., m 的概率 分别是多少?26 8球,每次取 m = 4 个,只看颜色不看次序,则 一切可能总数为 全红 或 全绿: (1 红,3 绿)= (3 红,1 绿)= (2 红,红,2 绿)绿)=其它可能出现的结果,和相应的概率为:: P=1/70=0.014286: P=16/70=0.228571: P=16/70=0.228571: P=36/70=0.5142: P( 赢钱赢钱 )=20.014286+20.228571= 0.4858 (或(或 P =1-0.5142=0.4858 )27初中阶段统计学的学习重点初中阶段统计学的学习重点I.I.总体与样本总体与样本A.A.总体总体:我们:我们研究对象的全体,研究对象的全体,如果抛开具体背景,如果抛开具体背景,从数学上看,总体就是可能出现的从数学上看,总体就是可能出现的“一堆数的集一堆数的集合合”,各个数出现的可能性可能大小不一。,各个数出现的可能性可能大小不一。B.B.样本样本:从总体中抽取一批个体从总体中抽取一批个体 即称为该总体的一个样本,即称为该总体的一个样本,n 称为样本容量。称为样本容量。 :须注意的是:样本必须满足以下两个条件:1. 必须是相互独立的;2. xi ,i=1,2,.,n 必须和总体具有相同的概率性质和总体具有相同的概率性质28 举例:1. 设我们要研究的总体是总体是 “北京市职工的工资北京市职工的工资“ (Z), 在朝阳CBD地区,随机地抽查在不同岗位的职 工的工资得记录 ,n=10000人:随机性是可信的,但不能说 xi ,i=1,2,.,n 具有和 Z 相同的概率性质。因为 CBD 职工工资太高了,不能代表全北京市。(相互独立但不具有与相互独立但不具有与 Z 的相同概率分布的相同概率分布)2. 美国 Literary Digest 为何在罗斯福当选后垮台了?问卷达230多万份,但预报罗斯福不会当选。错误在有偏抽样错误在有偏抽样!:记住:如果抽样有偏,样本再大也是在重复同样的错误!:记住:如果抽样有偏,样本再大也是在重复同样的错误!29 统计学上,抽样理论与方法是很不简单的事。 如果要学生搞抽样调查,一定要注意: 1. 什么是你的总体 Z ? 2. 如果想用局部样本对 Z 说话,则一定要注意: 随机性随机性、相互独立相互独立、与 Z 总体有相同性质总体有相同性质 本人主张,老师应收集公报、年鉴等比较可信公报、年鉴等比较可信的统计数据的统计数据让学生来做题。通过分析真实数据,学生可以学到许多知识,了解社会。不主张让学生去街上作调查,或做实验。30 比如:SARS 期间, 可从每周公报中,得到 Nk=传染人数,和 mk=死亡人数,计算:Nk /mk 的序列, 大致在 0.60.7 左右,而非 0.120.15 八下,第20章,有:农科院种甜玉米农科院种甜玉米 2 品种的实品种的实验记录验记录,很好(7.54 tn/公顷)。 以下是:Stanford 19671980年心脏移植存活天数(见见普通统计学普通统计学,Andrews&Herzberg(1985) ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 15 3 46 623126 641350 232781024 10 397301961136 1 836 96 97 98 99100101102103104105106107108109110111112 1328 86132 221 90 36169122382 10 5136 50138 2214531 以下是2005年普通统计学学生325名学生的期末考试成绩记录: 一点建议一点建议:请老师将本年级(如:初三)全体学生的(身高、体重)的纪录给以编号, 如: 班级班级 1 班级班级 2 身高身高 1.46 1.35 1.43 身高身高 1.33 1.47 1.45 体重体重 42 41 39 体重体重 48 46 35 班级班级 3 班级班级 4 身高身高 1.50 1,43 1.39 身高身高 1.44 1.46 1.38 体重体重 38 39 41 体重体重 47 44 4532 随机抽样:随机抽样:充分利用 随机数表。192237367647150454670987097755800095328632948582226900566841735013155297276580891. 任一起点顺序抽取。任一起点顺序抽取。2. 不分班整体抽取不分班整体抽取: 如共320人,取10人,需取3位数,大于320则舍去,如:(192),(237),(150),(097)3. 分班抽取:两位数,第一位表班级,第二位是样本号,如:(2,16),(2,30),(5,71)33II. II. 观测数据的代表性指标观测数据的代表性指标问:谁的意见对呢? 一个故事:某大学新聘来一位数学教授给研究生上课,期末15位学生考试成绩如下: 72,81,90,85,76,90,80,83,78,75,63,73,30,82,90:其实,他们3人是用3种指标来衡量的。 成绩上报后,院长很不满意,说:题目出得太容易,90分的就有分的就有3人人;但系主任则相反,认为题目出得太难,因为平均分数只有平均分数只有76.5分分;该教授则认为他的考题是合适的,因为从总体上看,80分是有代表性的,因为高于高于80分分和低于和低于80分的人数相等分的人数相等,都是7个人。341. 平均数与加权平均数平均数与加权平均数 设样本观测值为 ,如同那15个考 试分数,n=15 。则称 为这组观测值的(算术)平均数。:如上述考分:(72+81+30+82+90)/15=76.5优点优点:计算简单,意义明确,对每个数平等对待等 (统计学理论还有一些优点)。 缺点缺点:容易受两端极大、极小值的影响。如:76.5 低分主要是受一个30分的“拖累”。:能把:能把 30 分从成绩单上剔除吗?分从成绩单上剔除吗?有代表性吗? 352. 2. 关于加权平均数关于加权平均数 Df. 设 X= 为一组样本, 是一组非负实数,满足 , 则称 为X 的加权平均数。加权平均数。例如:设 ,则:36注1:权数的引入,是代表对各个权数的引入,是代表对各个 xk 可以有不同的可以有不同的 重视重视,如有公司招聘人才,将(口语、听力、 词汇 等)考分给以不同的权数,考察其 加权平均数加权平均数。可见加权平均有一定的主观性。可见加权平均有一定的主观性。注2:在算术平均中,如果将 中,合并合并 同类项同类项,假定只有 4个数,并且 相应出现次数分别为 ,则:注3:当给的列表式数据:x1 出现 k1, x2 出现 k2 求平均数,上式有用。37 关于中位数:关于中位数: 将 ,按升序排序(不合并同类) 记成:1. 如 n = 2m+1, 则 Md = ym+12. 如 n = 2m, 则 Md = (ym+ym+1)/2优点优点:大于 Md 和小于它的,各占50%(概率),不 受极值的影响等(统计学理论还有一些优点)缺点缺点:没有反应总体的整体状况,当样本量较大时, 人工排序是不太容易的。38 关于众数:关于众数:出现最多的数出现最多的数 mod优点优点:计算简单,意义明确.缺点缺点: 没有反应整体的特性;最大的问题是可以出现多个众 数,也可能不出现(观测值皆不同)。1.普鲁士兵团18771894年间,士兵被马踢伤致死的人数纪录: 0 0 1 1 2 0 1 2 3 0 1 0 4 0 3 1 1 29493929190898887868584838281807978772. 20C, 90年代,联合国统计月报公布部分国家男女平均寿命(以下为男性记录)635961626764676767647474737373767368菲巴印越韩巴泰 罗 墨 俄 澳 意 法 英德日 美中:对连续型的观测记录则容易出现 无众数无众数 39 均值、中位数、众数在概率分布中示意图50% 50%最大值403. 3. 关于数据波动的度量关于数据波动的度量: 样本方差: 样本标准差 (SD):要求一个常数 a ,使得以下平方离差最小平方离差最小答: 为何要用平方的指标而不用绝对差值? 为何方差中要减一 平均值?注:有的定义方差的除数是 (n-1 ) 而非 n , 涉及无偏性问题,可不必解释,n 大时两者差不多。414. 关于异常值的识别问题:关于异常值的识别问题: 在考试分数问题时,发现平均数过低是因为出现了一个 30 分,能认为它无代表性把它剔除无代表性把它剔除吗? 书中有题书中有题:调查员工月薪14人 如下(千元): 8,6,2.5,1.7,2.5,4.6,4.2,2.5,5.1, 2.5,4.4,2.5,25,12.4问 :代表性的月薪是多少?25,12.4 是否太高了? 用中位数:Md1=6.3 (14个数全用) Md2=3.35 (用12 个数) 用平均数:如何判断 25,12.4 此二数是否异常值?42异常值的识别问题:异常值的识别问题:已超出中学教学范围,以下只介绍已超出中学教学范围,以下只介绍3种方法,种方法,而且仅为老师备课用的而且仅为老师备课用的.1. 原则:如果总体为正态分布总体为正态分布 , 则落入此区间,将占99%。区间外数据可视为 异常值。实用中,用以下公式计算: 432.一般分布一般分布: 用3. 用分位点方法用分位点方法:记 Q1 = xmin + Md / 2 Q3 = xmax+ Md / 2 = Q3 Q1:44 员工工资问题的上限员工工资问题的上限:12.4,25 ? 方法1. 方法2. 例如:考试分数可得: 用方法1: 则最底端的值为: 30 分在区间外,可以去掉。可见 3 种方法都将 12.4, 25.0 排除在外,可见此 2 数不能作为合适的样本加入计算。方法3.452. 要进行异常值识别,删除“ 野值”。 对学生可能有一定困难。但老师心中要有数! 如果数据比较多(2030以上),看出有点像正态 分布,则可用第一种方法鉴别。 如果数据比较多(2030以上),有偏,则可用方 法2。 如果学生要算中位数,数据已排序,则可用分位 点法。它也是目前国际上比较简单而普遍采用的 删除“ 野值”的方法。46III. 关于直方图的问题:关于直方图的问题:主要是对连续型变量主要是对连续型变量1. 数据的收集:相互独立、与总体 Z 有相同概率性质,设为 ,n 应大于40以上。:相互独立、同分布性,往往被人们所忽略。A.设 Z 为中国年GDP,19802010 各年记录如下: 求中国 GDP 值的直方图.B. Literary Digest 在总统竞选问卷调查时,数量达上千万, 的获得是通过电话和俱乐部花通过电话和俱乐部花名册名册寄信。为何失败? 答:相互独立是对的,但样本不代表 Z(全美)。当时, 每4家庭才有一部电话,俱乐部成员也不是穷人能进的!472. 关于分隔区间问题:关于分隔区间问题: 在取得 n 个样本之后,第一步是算极差 D。 第二步是将大区间 xmin , xmax分为若干个等宽度的小区间,问:如何分割?III. 关于直方图的问题:关于直方图的问题:1.主要是对连续型变量主要是对连续型变量, 离散型直接计数即可。离散型直接计数即可。 3. 区间应考虑半开闭区间,区间应考虑半开闭区间,) 以解决端点问题。以解决端点问题。 这是最大的难点,没有确切的说法,理论上讲是 ,大约 (取整数) 如100个点分个点分 710: 直方图解决不了理论分布问题,只是定性地看个大概。直方图解决不了理论分布问题,只是定性地看个大概。48 最后几句话:最后几句话:1.概率统计对中学生的全面教育,非常重要。特别是能让学生接触到以前从来未学过的概念: 随机现象及其规律性。随机现象及其规律性。2. 概率统计是属于严密的数学学科概率统计是属于严密的数学学科。概率论有公理化体系,它也是统计学的基础。我们要让学生接触实际,但一定不能把概率统计作为一门实验科学来教。一定不能把概率统计作为一门实验科学来教。3. 初中应更多地注意让学生学好初等概率论的知识学好初等概率论的知识。对统计知识不能要求过高,数据的收集老师应是主角。说要通过数据分析能 “对实际问题提出 预测和决策” 是过高的要求。49本讲座的内容,仅代表个人对概率统计本讲座的内容,仅代表个人对概率统计学的理解,不当之处,敬请批评指正!学的理解,不当之处,敬请批评指正!谢谢大家的听讲!谢谢大家的听讲!5051 用杨辉三角形来计算组合数用杨辉三角形来计算组合数 C(n, k )n = 7 C (7, 5 )=21 杨辉:杨辉:南宋数学家, 杭州人,生平不详。 写有5种21卷书。 杨辉三角形出现在详解九章算法详解九章算法(1261年)年) 西方称为Pascal 三角形比杨辉要晚3百多年!522010中国各省市中国各省市GDP排名排名省市 广东 山东 江苏 浙江 河南 河北 辽宁 上海 四川 湖南 GDP 37775 33621 33478 22716 19724 17067 14696 14344 14050 12939常住人口 9449 9367 7625 5060 9360 6943 4298 1858 8127 6355 人均 39978 35893 43907 44895 21073 24583 34193 77205 17289 19355 湖北 福建 北京 安徽 内蒙古 黑龙江 广西 陕西 吉林 天津 山西12866 11855 11469 10191 8967 8257 7903 7752 7072 7068 7050 5699 3581 1633 6118 2405 3824 4768 3748 2730 1115 339322050 33106 70234 16656 37287 21593 16576 20497 25906 63395 20779 江西 云南 重庆 新疆 贵州 甘肃 海南 宁夏 青海 西藏 6954 6178 5693 4005 3662 3373 1585 1198 1012 4344368 4514 2816 2095 3975 2619 845 610 552 28415921 13687 20219 19119 9214 12882 18760 19642 18346 15294530808盐城(方程)盐城(方程) 一只不透明的袋子中装有一只不透明的袋子中装有4 4个小球,分别标有数字个小球,分别标有数字2 2,3 3,4 4,x,这些球,这些球除数字外都相同甲、乙两人每次同时从袋中各随机摸出除数字外都相同甲、乙两人每次同时从袋中各随机摸出1 1个球,并计算摸个球,并计算摸出的这出的这2 2个小球上数字之和记录后都将小球放回袋中搅匀,进行重复实验个小球上数字之和记录后都将小球放回袋中搅匀,进行重复实验实验数据如下表:实验数据如下表:解答下列问题:解答下列问题:(1)如果实验继续进行下去,根据上表数据,出现)如果实验继续进行下去,根据上表数据,出现“和为和为7”的频率将稳定的频率将稳定在它的概率附近,试估计出现在它的概率附近,试估计出现“和为和为7”的概率;的概率;(2)根据()根据(1),若),若x是不等于是不等于2,3,4的自然数,试求的自然数,试求x的值的值答案:(答案:(1)约为)约为0.33;(;(2)x =5五、命题趋势分析五、命题趋势分析 :54例例10、A、B两布袋中装有除颜色外其他都两布袋中装有除颜色外其他都相同的红、白两种玻璃球,相同的红、白两种玻璃球,A袋中装有袋中装有2只红只红球和球和6只白球,只白球,B袋中装有袋中装有10只红球和只红球和30只白只白球,有甲、乙二人分别从球,有甲、乙二人分别从A、B两袋中去摸球,两袋中去摸球,每次摸每次摸1只看一下放回袋中搅匀,继续摸,只看一下放回袋中搅匀,继续摸,两人摸的次数相同,乙摸到红球的机会一定两人摸的次数相同,乙摸到红球的机会一定比甲摸到红球的机会大吗?谈谈你的看法。比甲摸到红球的机会大吗?谈谈你的看法。五、命题趋势分析五、命题趋势分析 :55 一个真实的问题:一个真实的问题:中国农业银行邯郸分行的任晓峰和马向景2007年盗窃金库4300万受到社会广泛关注。二人据称盗出的钱二人据称盗出的钱全部买了彩票。全部买了彩票。 邯郸市2007年,4月14日电脑体育彩票销量达 1.048亿亿,成为河北省2007年第一个销售跨越亿元大关的城市。据警方介绍这正是任, 马二人疯狂购买彩票的时间。 他们认为:用他们的方法,如果实现,必可赚他们认为:用他们的方法,如果实现,必可赚1 千千多万奖金,但结果却多万奖金,但结果却 全部泡汤,一分钱没得!全部泡汤,一分钱没得! 概率论如何解释?概率论如何解释?56 他们买的是 3D 彩票:即 0,1,2,.,9 10个号,写在 3 个格子内,出 (1,0,9), (2,4,8),(3,3,0) 2 元买一注 ( X, Y, Z )。他们投注是:有对子的,如 (3,2,3),(2,2,0),(5,9,9),.,并把有 “对子” 的,全包下来(不包括3数相同的头等奖)。但为何1414万元同时买,竟然全部泡汤? 试算一算:试算一算:把把有有 “对子对子” 的,全包下来,可中奖的,全包下来,可中奖的的 概率有多大?概率有多大?57解本题的方法主要还是定理解本题的方法主要还是定理1 1。将问题提为:1.3D的一切可能结果 n 是多少?2. 一切有“对子”的结果有多少种?(不包括全等) 第一问题好回答:10个号写在3个格子内,一切可能为 ; 第二个问题分两步:A. 设“对子”的号为 Y,单个的号为 x, 如 (Y,x ) Y有10 种,而 x 只有 9 种(因不能全同),用定理2, 共有 109=90 种;B.但 (3,3,2)可派生(3,2,3),(2,3,3)三种,因而总数 m=90 3=270 : P = m/n = 270/1000 =0.2758P( 赢钱赢钱 )=20.014286+20.228571= 0.4858P( 输钱)输钱)=0.5142 上述问题,因 赢钱赢钱 和 输钱输钱 的概率相差不大:的概率相差不大: “尽可能多地做实验” 以下是我们的实验结果 n = 30:(4,0),(1,3),(2,2),(1,3),(2,2)(2,2),(1,3),(2,2),(2,2),(3,1)(3,1),(3,1),(1,3),(2,2),(3,1) (2,2),(2,2),(2,2),(2,2),(1,3)(1,3),(3,1),(3,1),(2,2),(2,2)(3,1),(2,2),(2,2),(2,2), (2, 2) 30次抽取中16 次 2 红 2 绿,赔3016= 480元; 赢钱赢钱 = 50+1320=310, 还陪170元:n =30 次抽取,(次抽取,(2红,红,2绿绿)出)出 k = 16 次次, k / n = 0.533 ( 理论值理论值=0.5142 )59真实异常值的记录真实异常值的记录 有人想了解目前我国城市有人想了解目前我国城市 “打工仔打工仔” 的日平均收入的日平均收入,调查结果如下(元):,调查结果如下(元): 50,30,90,70,20,150,45,100, 60,80,70,35,40,500000问:用平均数能代表现状吗?问:用平均数能代表现状吗? 60
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号