资源预览内容
第1页 / 共61页
第2页 / 共61页
第3页 / 共61页
第4页 / 共61页
第5页 / 共61页
第6页 / 共61页
第7页 / 共61页
第8页 / 共61页
第9页 / 共61页
第10页 / 共61页
亲,该文档总共61页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第一章第一章 统计数据的收集、整理统计数据的收集、整理教学基本要求:了解资料的类型;理解次数分布表与次数分布图的概 念;掌握次数分布表与次数分布图的制作方法。了解 常用统计量的种类;理解样本平均数、样本标准差、 样本变异系数的意义、作用;掌握样本平均数、样本 标准差、样本变异系数的计算方法。 教学重点难点:重点:大样本连续型变数资料的分组方法,次数分布表 与次数分布图的制作。样本平均数、样本标准差、样 本变异系数的意义、作用和计算方法。难点:分组数列的确定。样本标准差的统计意义 教学建议:分组收集资料1一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一章第一章 实验数据的收集、整理实验数据的收集、整理n1.1 资料的分类n1.2 数据的收集n1.3 资料的检查和核对n1.4 资料的整理和分组n1.5 特征数n 1.5.1 平均数n 1.5.2 变异数2一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为:n数量性状资料n质量性状资料 3一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n一、数量性状资料n n能由计数和量测的方式获得的性状能由计数和量测的方式获得的性状数量资料为数量资料为数量性状资料数量性状资料。因数量。因数量性状性状(quantitative trait)(quantitative trait)的度量有的度量有计数和量测两种方式,其所得数据计数和量测两种方式,其所得数据不同。不同。4一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n n1 1、连续型数据连续型数据(continuous continuous variablevariable):指由称量、度量或测):指由称量、度量或测 量、分析化验等方法所得到的数据量、分析化验等方法所得到的数据 。其各个变量并不仅限于整数,在。其各个变量并不仅限于整数,在 两个相邻数值之间可以有微量差异两个相邻数值之间可以有微量差异 的其他数值存在。的其他数值存在。n n例如:测定粒重,产量、株高、长例如:测定粒重,产量、株高、长 度、营养元素的含量等。度、营养元素的含量等。5一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n n2 2、间断型数据、间断型数据(discrete variablediscrete variable): 是指由是指由计数计数方法所获得的数据,其各方法所获得的数据,其各个数据必须以个数据必须以整数整数表示,在两个相邻的表示,在两个相邻的整数间不能有带小数的数值存在。由于整数间不能有带小数的数值存在。由于两个整数间是不连续的故称为不连续型两个整数间是不连续的故称为不连续型或间断型数据。或间断型数据。n n如动物头数、穗数、每穗粒数等。如动物头数、穗数、每穗粒数等。6一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n二、质量性状资料n质量性状(qualitative trait) 指能观察而不能量测的性状,即属性性状,如肤色,花、子粒等器官的颜色,绒毛的有无等。n由只能观察描述或感觉而难以量测的性状获得的数量资料为质量性状资料。这些性状本身不能以数字来表示,要获得这类性状的数量资料,可采用下列两种方法进行数量化: 7一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n1.统计次数法 在一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数,以次数作为质量性状的数据。n例如在320株水稻植株中有240株为紫色柱头的, 80株黄色柱头的。这类由质量性状数量化得来的资料也称为次数(或频次)资料。8一、攻关目标一、攻关目标建立节水型的优质高效农业发展 模式。提高区域农业水资源利用率及生 产效率。为节水条件下农业高效持续发展 提供技术支持和示范模式。第一节第一节 资料的分类资料的分类n2. 给予每类性状以相对数量的方法(给分法) 对某一质量性状,因其类别不同,分别给予不同的级别或分值,例如,小麦子粒颜色有白有红,可令白色的数量值为0,呈红色的数量值为1。从这类变异所得资料,处理方法同间断型变数资料。9第二节第二节 数据的收集数据的收集n1、数据的收集方法:n 调查n 试验n2、收集数据的要求:n1.突出研究目的n2.严格执行研究方案n3.控制误差10一、攻关目标一、攻关目标第三节第三节 资料的检查和核对资料的检查和核对检查和核对原始资料的目的在于确保原始资料的完整性 和正确性。完整性是指原始资料无遗缺或重复。正确性是指原始资料的测量和记载无差错或未进行不合 理的归并。要特别注意特大、特小和异常数据;有重复、异常或遗漏的资料 ,应予以删除或补齐 ;有错误、相互矛盾的资料应进行更正,必要时复查。资料的检查与核对工作虽然简单,但却是一项非常重要 的步骤,只有完整、正确的资料,才能真实地反映出调查或 试验的客观情况,才能经过统计分析得出正确的结论。11第四节第四节 资料的整理和分组资料的整理和分组n n试验或调查研究所得资料,经检查核对后,根据试验或调查研究所得资料,经检查核对后,根据 资料中观测值的多少确定是否分组。资料中观测值的多少确定是否分组。n n当观测值不多当观测值不多( (n30n30) )时,不必分组,直接进行时,不必分组,直接进行 统计分析。统计分析。n n倘包含很多观察值,未加整理很难得到明确的概倘包含很多观察值,未加整理很难得到明确的概 念。如果把这些观察值按数值大小或数据的类别进念。如果把这些观察值按数值大小或数据的类别进 行分组,制成不同组别或不同分类单位的频数分布行分组,制成不同组别或不同分类单位的频数分布 表,就可以看出资料中不同表现的观察值与其频率表,就可以看出资料中不同表现的观察值与其频率 间的规律性,即可以看出资料的频率分布的初步情间的规律性,即可以看出资料的频率分布的初步情 况,从而对资料得到一个初步概念,以便统计分析况,从而对资料得到一个初步概念,以便统计分析 。12一、攻关目标一、攻关目标第四节第四节 资料的整理和分组资料的整理和分组n n一、次一、次( (频频) )数分布表的编制数分布表的编制n n将数据可能出现的整个范围化分成若干个互斥的将数据可能出现的整个范围化分成若干个互斥的 组区间,再统计出现在各个组区间内的数据个数(组区间,再统计出现在各个组区间内的数据个数( 次数),可以发现数据都有着一定的分布规律。次数),可以发现数据都有着一定的分布规律。n n由不同区间内数据出现的次数组成的分布,就叫由不同区间内数据出现的次数组成的分布,就叫 做变数的次数分布,简称次做变数的次数分布,简称次( (频频) )数分布数分布。n n资料整理方法之一,就是编制次资料整理方法之一,就是编制次( (频频) )数分布表。数分布表。n n次次( (频频) )数分布表的制作方法因数据种类不同而略数分布表的制作方法因数据种类不同而略有不同,分述如下。有不同,分述如下。 13一、攻关目标一、攻关目标第四节第四节 资料的整理和分组资料的整理和分组n n( (一一) )、间断型数据资料的整理、间断型数据资料的整理n n1 1、相同观察值归一组、相同观察值归一组n n以某小麦品种的每穗小穗数为例,随机采取以某小麦品种的每穗小穗数为例,随机采取100100 个麦穗,计数每穗小穗数,未加整理的资料列成表个麦穗,计数每穗小穗数,未加整理的资料列成表 。 14第四节第四节 资料的整理和分组资料的整理和分组n n上述资料为间断型数据资料,每穗小穗数在上述资料为间断型数据资料,每穗小穗数在 15 - 2015 - 20的范的范 围内变动,有围内变动,有6 6个不同的观察值,把所有观察值按每穗小穗个不同的观察值,把所有观察值按每穗小穗 数多少加以归类,共分为数多少加以归类,共分为6 6组,组与组间相差为组,组与组间相差为1 1小穗,称小穗,称 为组距。这样可得次数分布表:为组距。这样可得次数分布表:n n从表中看到,一堆杂乱的原始资料,经初步整理后,就可从表中看到,一堆杂乱的原始资料,经初步整理后,就可 了解资料的大致情况。另外,经过整理的资料也便于进一步了解资料的大致情况。另外,经过整理的资料也便于进一步 的分析。的分析。P3P3例例1.11.1属此类属此类。15第四节第四节 资料的整理和分组资料的整理和分组n n2 2、相邻几个观察值归一组、相邻几个观察值归一组 n n资料观察值较多,变异幅度较大,若以每一观察资料观察值较多,变异幅度较大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。对这类资料,可扩少,资料的规律性显示不出来。对这类资料,可扩大为以大为以几个相邻观察值几个相邻观察值为一组,适当减少组数,资为一组,适当减少组数,资料的规律性就较明显,对资料进一步计算分析也比料的规律性就较明显,对资料进一步计算分析也比较方便。较方便。n n如每组包含若干粒数的幅度,例如以如每组包含若干粒数的幅度,例如以5 5粒为一组粒为一组,则可使组数适当减少。,则可使组数适当减少。 16一、攻关目标一、攻关目标第四节第四节 资料的整理和分组资料的整理和分组n n从下表可以看出,半数多的稻穗的每穗粒数在从下表可以看出,半数多的稻穗的每穗粒数在46-6046-60粒间粒间,大部分稻穗的每穗粒数在,大部分稻穗的每穗粒数在41 -70 41 -70 间间; ;但也有少数稻穗少到但也有少数稻穗少到26-3026-30粒的,多到粒的,多到81818585的。的。17一、攻关目标一、攻关目标第四节第四节 资料的整理和分组资料的整理和分组n n( (二二) )、连续型数据资料的整理、连续型数据资料的整理 n n连续型数据资料不能按间断型数据资料的分组方连续型数据资料不能按间断型数据资料的分组方 法进行整理,在分组前需要确定全距、组数、组距法进行整理,在分组前需要确定全距、组数、组距 、组中值及组限,然后将全部观测值划线计数归组、组中值及组限,然后将全部观测值划线计数归组 ,制作成,制作成次次( (频频) )数分布表数分布表。n n以以140140行水稻试验的产量为例,说明整理方法。行水稻试验的产量为例,说明整理方法。 18第四节第四节 资料的整理和分组资料的整理和分组n n次次( (频频) )数分布表的制作步骤:数分布表的制作步骤:n n1. 1. 数据排序:将所取得的数据按从小到大排列数据排序:将所取得的数据按从小到大排列( ( 升序升序) )或从大到小排列或从大到小排列( (降序降序) )。n n2.2.求极差求极差R R:资料中最大
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号