资源预览内容
第1页 / 共47页
第2页 / 共47页
第3页 / 共47页
第4页 / 共47页
第5页 / 共47页
第6页 / 共47页
第7页 / 共47页
第8页 / 共47页
第9页 / 共47页
第10页 / 共47页
亲,该文档总共47页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第第1章章 统计学:处理不确定性问题的算术统计学:处理不确定性问题的算术1.1 什么是统计学什么是统计学每位同学都是非常老道,善于决策的统计工具每位同学都是非常老道,善于决策的统计工具 假设你在光华大道上一边开车,一边聊天。在假设你在光华大道上一边开车,一边聊天。在你前面的司机突然刹车,你会怎么办?你前面的司机突然刹车,你会怎么办? 生命的每一天,都要进行大量的抽样评估和作生命的每一天,都要进行大量的抽样评估和作出决定,大脑具有一种卓越机制,能够进行复杂出决定,大脑具有一种卓越机制,能够进行复杂统计,换句话说,你已经是某种类型的统计学家统计,换句话说,你已经是某种类型的统计学家了。了。1.2 研究的基本原则研究的基本原则什么是研究?为什么要进行研究?什么是研究?为什么要进行研究?研究是对周围世界及自身系统性提出一系列问题的研究是对周围世界及自身系统性提出一系列问题的行为。行为。大学生进食障碍研究:大学生进食障碍研究:1. 查阅相关文献并进行描述进食障碍如何发生查阅相关文献并进行描述进食障碍如何发生2. 设计研究方案预测谁可能受到影响设计研究方案预测谁可能受到影响3.寻找引起障碍的原因,以期寻找方法进行预防和寻找引起障碍的原因,以期寻找方法进行预防和控制控制统计学统计学(statistics) 是一种处理数据的方法是一种处理数据的方法研究设计:搜集数据以便为具体问题提供答案的研究设计:搜集数据以便为具体问题提供答案的系统性计划就称为研究设计系统性计划就称为研究设计 (research design)。1. 提出问题提出问题 问题答案往往具有不确定性,研究与问题答案往往具有不确定性,研究与分析往往发生在不确定情境之中分析往往发生在不确定情境之中 2.详细计划与精确观察、记录决定研究的成败详细计划与精确观察、记录决定研究的成败3.研究可以在任何情景下进行,涉及各种问题研究可以在任何情景下进行,涉及各种问题4. 多数研究的结果会以数字呈现,称为数据。多数研究的结果会以数字呈现,称为数据。结论的有效性取决于研究设计的性质和搜集数据结论的有效性取决于研究设计的性质和搜集数据的质量的质量如果输入的数据是无用的,则统计输出的结果就如果输入的数据是无用的,则统计输出的结果就是一堆垃圾是一堆垃圾研究开始就必须考虑统计学工具,如果先搜集数研究开始就必须考虑统计学工具,如果先搜集数据,再考虑怎样分析数据,就会遇到许多麻烦和据,再考虑怎样分析数据,就会遇到许多麻烦和痛苦痛苦 1.3 基本统计术语基本统计术语 变量变量(variable) 根据研究目的,对研究对象的某个特征根据研究目的,对研究对象的某个特征(研究指标或研究指标或项目项目)实施观测,这些特征实施观测,这些特征 (指标或项目指标或项目)称为变量称为变量(variable编号编号医院医院年龄年龄性别性别体重体重痰涂片痰涂片 痰培养痰培养 皮试直径皮试直径 6月后存活月后存活001A68F56.4阳性阳性阴性阴性18是是002B63M74.5阳性阳性阴性阴性16是是003D65F57.3阴性阴性阳性阳性21否否004C70F65.6可疑可疑阳性阳性28是是100D43M66.4可疑可疑阳性阳性14是是表表1-1 肺结核治疗部分病例的观察结果肺结核治疗部分病例的观察结果自变量自变量 (independent variable)指实验者能够操纵和控制的变量,其目的在于预测指实验者能够操纵和控制的变量,其目的在于预测自变量对因变量的效果。或描述和解释不同的自变自变量对因变量的效果。或描述和解释不同的自变量水平或数量所导致的因变量的差异。量水平或数量所导致的因变量的差异。因变量因变量 (dependent variable)指研究者进行检验、测量和描述的变量。指研究者进行检验、测量和描述的变量。例如百米短跑比赛,先接受具体指导,再记录跑例如百米短跑比赛,先接受具体指导,再记录跑完完100米所用的时间,则具体指导是自变量,时间米所用的时间,则具体指导是自变量,时间是因变量。是因变量。数据数据 (data)指研究者搜集到的作为观测结果的数字或测量结指研究者搜集到的作为观测结果的数字或测量结果。数据可以是计数数据、等级数据、测量数据果。数据可以是计数数据、等级数据、测量数据总体总体 (population) 总体是指具有某些共同特征的所有个体、事物或测总体是指具有某些共同特征的所有个体、事物或测量数据的集合量数据的集合总体可能是一个观测到的假设集合,而不是真正总体可能是一个观测到的假设集合,而不是真正的的“完全集合完全集合” 。例如测试一种新的药物效能,。例如测试一种新的药物效能,总体可以是理论上能够加以施测的所有个体。总体可以是理论上能够加以施测的所有个体。样本(样本(sample) 样本是总体的一个子集,通常用来代表总体。样本是总体的一个子集,通常用来代表总体。参数参数(parameter)描述总体的特征数称为总体参数,简称参数,用描述总体的特征数称为总体参数,简称参数,用(猫的叫声猫的叫声)和和(西格玛西格玛)表示表示 。样本平均数用。样本平均数用 表表示示从样本搜集到的数据的有效性取决于样本的代表从样本搜集到的数据的有效性取决于样本的代表性和样本的抽取方法。性和样本的抽取方法。被试:样本中那些被选择的个体称为被试被试:样本中那些被选择的个体称为被试(subject)参与者:期刊文章中用于实验的人类参与者:期刊文章中用于实验的人类(participant)随机样本随机样本(random sample):总体中每个个体都有:总体中每个个体都有等可能被选上,用这种方法选择的样本就是随机等可能被选上,用这种方法选择的样本就是随机样本,是总体的一个子集。样本,是总体的一个子集。多数实验中,研究被试都不是随机选取的,例如多数实验中,研究被试都不是随机选取的,例如心理学家、医生通常用身边的被试进行研究。心理学家、医生通常用身边的被试进行研究。被被试试年龄年龄(月月)性别性别 时间(秒)时间(秒)男孩玩具男孩玩具女孩玩具女孩玩具0135F19280229M27240326M13140431F9290537M2515资料栏资料栏1-1 常用术语举例常用术语举例从一个幼儿园全体儿童中随机抽取从一个幼儿园全体儿童中随机抽取20名,单独观测每名,单独观测每个儿童一小时,用秒表记录儿童玩玩具所用的时间。个儿童一小时,用秒表记录儿童玩玩具所用的时间。数据见表,进行填空。数据见表,进行填空。1.全体儿童称为:全体儿童称为:2.这这20名儿童称为:名儿童称为:3.年龄、性别和时间年龄、性别和时间称为:称为:4.秒表测量结果称为:秒表测量结果称为:5. 20名儿童的平均年龄和玩耍时间称为名儿童的平均年龄和玩耍时间称为( ),为什么为什么?抽样的原则:避免选样方法与研究变量之间有任何抽样的原则:避免选样方法与研究变量之间有任何联系。联系。随机分配随机分配(random assignment)是将每一被试分配到实验情形的一种方法,每一是将每一被试分配到实验情形的一种方法,每一被试被分配到每一情境中的机会是均等的。其目被试被分配到每一情境中的机会是均等的。其目的是减少偏差,尽量保证每个实验组的被试的同的是减少偏差,尽量保证每个实验组的被试的同质性。质性。统计量统计量(statistics)根据一定程序对样本数据进行处理所得的数字根据一定程序对样本数据进行处理所得的数字1.4 关于研究目标的一些术语关于研究目标的一些术语随研究者使用其技能的环境不同,研究问题的类随研究者使用其技能的环境不同,研究问题的类型也不同。研究目标可以界定为:搜集信息、描型也不同。研究目标可以界定为:搜集信息、描述关系、组间比较、建立因果关系。述关系、组间比较、建立因果关系。1.4.1 搜集信息搜集信息-描述性研究描述性研究描述性研究描述性研究(descriptive study) 是对事物当前是对事物当前状态的一种精确描述状态的一种精确描述研究结果常与先前研究进行比较,借以判断它是研究结果常与先前研究进行比较,借以判断它是否随时间变化而发生系统变化?或者看一下研究否随时间变化而发生系统变化?或者看一下研究组与其他组或与总体比较有无不同?组与其他组或与总体比较有无不同?研究研究1:“给你给你500万,你会将你家宠物丢到悬崖万,你会将你家宠物丢到悬崖下吗?下吗?”研究研究2:体重自我觉察的研究:体重自我觉察的研究 自我觉察自我觉察 行合计行合计 体重不足体重不足超重超重女性女性41919952414男性男性9598551814列合计列合计137828504228表表1-2 青少年认为自己体重不足或超重的一个样本数据青少年认为自己体重不足或超重的一个样本数据1.4.2 描述关系描述关系-相关性研究相关性研究研究两个或多个变量是否研究两个或多个变量是否“相关相关”?*统计课上,同学的统计课上,同学的“数学焦虑数学焦虑”与选择座位与与选择座位与讲台的距离有关吗?高焦虑的同学是往前坐还是讲台的距离有关吗?高焦虑的同学是往前坐还是往后坐呢?往后坐呢?*高考分数与大一平均绩点之间有关吗?高考分数与大一平均绩点之间有关吗?*病人的不同年龄与门诊费用有关吗?病人的不同年龄与门诊费用有关吗?*学生人数与某餐饮连锁季度销售收入有关吗?学生人数与某餐饮连锁季度销售收入有关吗?类似问题的研究称为类似问题的研究称为“相关相关”(correlational)研研究。究。1.4.3 完整组比较完整组比较-非随机分配被试的个体组非随机分配被试的个体组有时我们观测的个体组成员在许多方面特点不同有时我们观测的个体组成员在许多方面特点不同*社会情境中,吸烟者比不吸烟者看起来更烦躁或社会情境中,吸烟者比不吸烟者看起来更烦躁或紧张。紧张。*男生喜欢放大摇滚音量,而女生则不然。男生喜欢放大摇滚音量,而女生则不然。*甲老师比乙老师给分高甲老师比乙老师给分高如果你的确曾经考虑过组间差异的问题,你能够如果你的确曾经考虑过组间差异的问题,你能够理解你所生活的世界并预测未来。理解你所生活的世界并预测未来。完整组比较研究完整组比较研究(intact group comparison study)定义:完整组比较研究是对多个完整组进行比较,定义:完整组比较研究是对多个完整组进行比较,以确定两个或多个特点或变量是否存在组间差异以确定两个或多个特点或变量是否存在组间差异的研究。的研究。构成:完整组的成员是由被试在研究中的共同行构成:完整组的成员是由被试在研究中的共同行为、特点或特质所决定的。组中的个体既不是根为、特点或特质所决定的。组中的个体既不是根据研究者命令进行分配,也不是随机分配。据研究者命令进行分配,也不是随机分配。*吸烟组与非吸烟组的行为或健康比较研究吸烟组与非吸烟组的行为或健康比较研究*抑郁症与非抑郁症病人的比较研究抑郁症与非抑郁症病人的比较研究* 两性的比较研究,就是分为男性和女性两组两性的比较研究,就是分为男性和女性两组要区分已经存在的研究组和实验者控制分配被试的要区分已经存在的研究组和实验者控制分配被试的研究组。因为分配被试的方法会影响到数据乃至结研究组。因为分配被试的方法会影响到数据乃至结论。论。完整组设计探讨的只是两组之间是否存在某些测量完整组设计探讨的只是两组之间是否存在某些测量差异。不一定能够推论出因果关系。差异。不一定能够推论出因果关系。* 例如民主党人和共和党人之间是否有差异。例如民主党人和共和党人之间是否有差异。*吸烟和不吸烟的母亲,所生婴儿体重有差异吗?吸烟和不吸烟的母亲,所生婴儿体重有差异吗?*从夏令营中随机选取从夏令营中随机选取10名肥胖儿童和名肥胖儿童和10名正常体名正常体重儿童,安排他们在游泳池玩重儿童,安排他们在游泳池玩1小时,用秒表记录小时,用秒表记录他们在游泳、跑步或跳跃上所花费的时间。他们在游泳、跑步或跳跃上所花费的时间。如果研究者用秒表记录了肥胖儿童活动时间为如果研究者用秒表记录了肥胖儿童活动时间为120分钟,正常儿童活动时间为分钟,正常儿童活动时间为300分钟,是否能够得分钟,是否能够得出肥胖儿童会引发运动减少的推论吗?出肥胖儿童会引发运动减少的推论吗?完整组未弄清楚的问题:完整组未弄清楚的问题:AB 体重影响活动水平体重影响活动水平BA 活动影响体重水平活动影响体重水平第三因素影响体重与活动水平第三因素影响体重与活动水平1.4.4 建立因果关系建立因果关系-实验研究实验研究“若若A则则B”的论断是任何科学研究的最终目标,但的论断是任何科学研究的最终目标,但并非易事并非易事1.契合法契合法(method of agreement) 需要认真研究发生同一事件的若干案例,目的是寻需要认真研究发生同一事件的若干案例,目的是寻找其共同要素。如果能够找到一个,则可以怀疑这找其共同要素。如果能够找到一个,则可以怀疑这个要素是引发事件的原因。个要素是引发事件的原因。*吸烟是引发肺癌的一个共同要素,正确吗吸烟是引发肺癌的一个共同要素,正确吗?*酒鬼说:水喝多了我就会醉,正确吗?酒鬼说:水喝多了我就会醉,正确吗?契合法本身对因果关系的确定并不充分。契合法本身对因果关系的确定并不充分。2.差异法差异法(method of difference) 我们观察的两个情境,如果所有方面都相同而仅有我们观察的两个情境,如果所有方面都相同而仅有一点不同。如果发现有不同的效果,我们就认为是一点不同。如果发现有不同的效果,我们就认为是这一点不同造成的,实验法源于此。这一点不同造成的,实验法源于此。*例:研究酒精对完成感觉活动任务所产生的影响。例:研究酒精对完成感觉活动任务所产生的影响。完成任务的成绩是因变量,是我们关心的结果。而完成任务的成绩是因变量,是我们关心的结果。而酒精是自变量。酒精是自变量。将被试随机分为两组,一组喝酒精,另外一组喝安将被试随机分为两组,一组喝酒精,另外一组喝安慰剂,使用双盲法。让这两组人进行模拟驾驶活动慰剂,使用双盲法。让这两组人进行模拟驾驶活动如果在两组中发现足够大如果在两组中发现足够大 的差异,则可以推断是酒的差异,则可以推断是酒精导致了这种差异。而判断精导致了这种差异。而判断“足够大足够大 的差异的差异”是推是推论统计的核心。论统计的核心。3.契合差异综合法:契合差异综合法:契合法提出假设,差异法检验假设。契合法提出假设,差异法检验假设。酒鬼的假设是酒鬼的假设是“水能让我喝醉水能让我喝醉”,可以通过差异法,可以通过差异法来检验这个假设,让酒鬼一个晚上喝水,另外一个来检验这个假设,让酒鬼一个晚上喝水,另外一个晚上喝酒。假定他愿意诚实和客观,他会得出正确晚上喝酒。假定他愿意诚实和客观,他会得出正确结论。结论。但是,推理并不总是理性的,酒鬼可能会说:但是,推理并不总是理性的,酒鬼可能会说:“这是一种神奇的酒,如果我头天晚上喝了他,它这是一种神奇的酒,如果我头天晚上喝了他,它能使我在第二天晚上喝水不会喝醉能使我在第二天晚上喝水不会喝醉”。1.5 实验法实验法真实验真实验(true experiment):真实验情境中有自变量、因变量和干扰变量。真实验情境中有自变量、因变量和干扰变量。 实验者必须控制自变量实验者必须控制自变量 被试必须随机分配到实验组与控制组被试必须随机分配到实验组与控制组这种实验必须回答:这种实验必须回答:_对对_的影响是什么?的影响是什么?自变量对因变量的影响是什么?自变量对因变量的影响是什么?*高强度运动高强度运动1个半小时对心境有什么影响?个半小时对心境有什么影响?*对于减肥者而言,具有重要意义的人出现在减对于减肥者而言,具有重要意义的人出现在减肥中心,对减肥效果是否有影响?肥中心,对减肥效果是否有影响?如果随机分配被试到每一实验情境中,如果随机分配被试到每一实验情境中,如果在不同组之间发现有因变量如果在不同组之间发现有因变量(心境改心境改变和体重减轻变和体重减轻),可假定这种差异是自变,可假定这种差异是自变量引起的,而不是起始差异引起的量引起的,而不是起始差异引起的1.6 统计分析在研究中的作用统计分析在研究中的作用研究设计是非常吸引人的主题,但不会贯穿在整个研究设计是非常吸引人的主题,但不会贯穿在整个主题中。我们的目标是说明统计是研究中的工具。主题中。我们的目标是说明统计是研究中的工具。首先得做研究设计,然后考虑利用统计来组织、总首先得做研究设计,然后考虑利用统计来组织、总结、解释研究中获得的数据。结、解释研究中获得的数据。要注意:再好的统计技术也不能够挽救一个设计很要注意:再好的统计技术也不能够挽救一个设计很差的研究。研究的顺序是:差的研究。研究的顺序是:1.确定研究问题确定研究问题 2.设计研究方案设计研究方案3.确定有效的统计方法确定有效的统计方法4.实施研究实施研究5.分析数据分析数据数据分析:描述阶段与推论阶段数据分析:描述阶段与推论阶段1.6.1 统计的描述功能统计的描述功能原始数据杂乱无章,无法直接获得有用信息,可采原始数据杂乱无章,无法直接获得有用信息,可采用描述统计用描述统计(descriptive ststistics),其作用:,其作用:1.组织所搜集的样本数据组织所搜集的样本数据2.总结由样本得到的结果总结由样本得到的结果(图形、平均数、比率等图形、平均数、比率等)3.以容易辨识的方式呈现给人们以容易辨识的方式呈现给人们641127569212843658115311110932979410 4547938667575810293X X XXXX X XX XXX X X X X XX X X XX X XX X X X X X X X X X X X X X X X X X X X X X X X1 2 3 4 5 6 7 8 9 1011121 2 3 4 5 6 7 8 9 101112641127569212843658115311110932979410 45479386675758102931.6.2 统计的推论功能统计的推论功能推论统计推论统计(inferential statistics)是通过样本信息对是通过样本信息对总体进行广泛概括或推论的方法。所有的医学、药总体进行广泛概括或推论的方法。所有的医学、药学和行为数据都可以进行推论统计。例如我们无法学和行为数据都可以进行推论统计。例如我们无法确切知道某种疾病的患病率,但是可采取适当的抽确切知道某种疾病的患病率,但是可采取适当的抽样方法来获得。样方法来获得。推论统计的基础是概率论:对世界的终极意义而推论统计的基础是概率论:对世界的终极意义而言,推论统计无法证明任何东西。结论是概率性言,推论统计无法证明任何东西。结论是概率性质而不是绝对的:质而不是绝对的:“概率越大,说明实验变量对概率越大,说明实验变量对因变量的影响的可能性越大因变量的影响的可能性越大”。图图1-1 总体由失眠者组成,一些失眠者药物成瘾总体由失眠者组成,一些失眠者药物成瘾(a),其他不是,其他不是()总体总体样本样本描述统计描述统计(成瘾成瘾者者所占比例所占比例)推论统计推论统计( (总体成总体成瘾者所占比例瘾者所占比例) )数据数据(样本中每个失样本中每个失眠者药物成瘾的情况眠者药物成瘾的情况1.7 统计观测案例统计观测案例某地一名牙医观测两名年龄分别为某地一名牙医观测两名年龄分别为17和和28岁牙腐蚀岁牙腐蚀的病人。的病人。对他们的个案历史研究发现,他们在药物、职业和对他们的个案历史研究发现,他们在药物、职业和饮食均未接触酸性物质。但是,牙医发现一个共同饮食均未接触酸性物质。但是,牙医发现一个共同因素因素(common factor)-他们是游泳运动员他们是游泳运动员疾病控制中心给两名运动员所在的游泳俱乐部发放了疾病控制中心给两名运动员所在的游泳俱乐部发放了调查问卷,回收调查问卷,回收747份。数据由每个人的自我观测结份。数据由每个人的自我观测结果组成。有以个或以上选择果组成。有以个或以上选择“许多许多”,或两个以上选,或两个以上选择择“有时有时”,就认为有牙腐蚀。,就认为有牙腐蚀。747份样本分为两组:一组成员有牙腐蚀,另外一份样本分为两组:一组成员有牙腐蚀,另外一组没有一牙腐蚀。组没有一牙腐蚀。问:这算是一个实验吗?为什么?问:这算是一个实验吗?为什么?问:统计分析产生的是什么数据?问:统计分析产生的是什么数据?问:疾病控制中心的目的是什么?问:疾病控制中心的目的是什么?回答:这不是一个实验,而是两个完整组的比较,回答:这不是一个实验,而是两个完整组的比较,统计分析是计数数据。统计分析是计数数据。统计方法是区分不同两组统计方法是区分不同两组(经常游泳和不常游泳经常游泳和不常游泳) ,计算适当的统计量,利用推论统计确定是否有,计算适当的统计量,利用推论统计确定是否有足够大的数字确认两组之间存在差异。足够大的数字确认两组之间存在差异。案例案例例例1-1 着手撰写一份研究计划书,所选研究问题事关着手撰写一份研究计划书,所选研究问题事关人类健康。简单叙述立题依据、研究背景、研究目人类健康。简单叙述立题依据、研究背景、研究目的、研究内容、研究方法和需要什么样的资料,如的、研究内容、研究方法和需要什么样的资料,如何获得和分析资料,使用什么方法去表达和展示结何获得和分析资料,使用什么方法去表达和展示结果等。请保留您的这份作业,并在学完本书后重新果等。请保留您的这份作业,并在学完本书后重新翻阅。您发现了什么问题?如何修改?您的收获是翻阅。您发现了什么问题?如何修改?您的收获是什么?什么? 小结小结 1、统计学是关于数据收集、整理、分析、表达和、统计学是关于数据收集、整理、分析、表达和解释的普遍原理与方法,而不是单纯搜集数据资解释的普遍原理与方法,而不是单纯搜集数据资料。料。2、研究目标包括搜集信息、建立联系、完整组比、研究目标包括搜集信息、建立联系、完整组比较以及建立因果关系。完成目标需要进行研究设较以及建立因果关系。完成目标需要进行研究设计。计。3、统计分析的常用术语、统计分析的常用术语4、统计分析有两种功能、统计分析有两种功能描述统计与推论统计描述统计与推论统计需要牢记的术语需要牢记的术语统计学统计学 研究设计研究设计 变量变量 自变量自变量 因变量因变量数据数据 总体总体 参数参数 样本样本 随机样本随机样本随机分配随机分配 统计量统计量 描述性研究描述性研究 相关研究相关研究完整组比较完整组比较 安慰剂安慰剂 实验实验 干扰变量干扰变量 描述统计描述统计 推论统计推论统计 人口普查人口普查附录附录 关于统计软件的说明关于统计软件的说明 一、一、 DPS3.1安装、注册安装、注册1、DPS3.1安装、注册安装、注册 运行运行“DPS3.1的的SETUP.EXE,指定,指定“C:DPS数据数据处理系统处理系统”或或“D:DPS数据处理系统数据处理系统”文件夹进行安文件夹进行安装。装。 把把DPS3.1注册注册C-DPS.EXE文件粘贴到安装的文件文件粘贴到安装的文件夹并运行夹并运行 C-DPS.EXE。 关闭出现白菜乐园对话框,关闭出现白菜乐园对话框,会自动打开会自动打开 DPS窗口,出现机器码。窗口,出现机器码。 把机器码粘贴把机器码粘贴到注册框,击到注册框,击 “注册注册” 按钮,会出现正确的注册码。按钮,会出现正确的注册码。把正确的注册码粘贴到注册框,击把正确的注册码粘贴到注册框,击 “注册注册” 按钮,按钮,即完成注册。即完成注册。运行运行“DPS3.1的的SETUP.EXE二、二、 SPSS13.0 安装、注册安装、注册1.双击双击setup.exe安装英文原版安装英文原版2.将将regedit.exe复制到复制到SPSS安装目录,双击后点击安装目录,双击后点击patch it!完成注册完成注册3.双击双击cn.exe,选择,选择SPSS安装目录,应用汉化补丁安装目录,应用汉化补丁SPSS(Statistical Product and Service Solution,统,统计产品与服务解决方案),是非专业统计人员的首计产品与服务解决方案),是非专业统计人员的首选软件。选软件。 File New Data,会出现新数据编辑窗。,会出现新数据编辑窗。 数据文件扩展名为数据文件扩展名为.sav , 结果文件扩展名为结果文件扩展名为.spo,图形文件扩展名为图形文件扩展名为.cht,程序文件扩展名为,程序文件扩展名为.sps。 二、二、SAS统计软件简介统计软件简介 SAS8.1安装、注册安装、注册 运行运行 SAS8.1菜单的菜单的SETUP,完成安装后,将光盘,完成安装后,将光盘内内CRACK文件夹中的文件夹中的SASHOST.DLL文件复制到文件复制到C:program fileSAS institute SASV8(或(或D:program fileSAS institute SASV8)安装文件夹,覆盖原有的)安装文件夹,覆盖原有的SASHOST.DLL文件。文件。 在程序栏在程序栏SAS下运行下运行update SAS v8 Authorization Code,完成授权。完成授权。SAS(Stati-stical Ana-lysis System 统计分析系统)统计分析系统)是世界权威统计分析软件。是世界权威统计分析软件。 文件文件(F)编辑编辑(E)查看查看(V)工具工具(T)运行运行(R)解决方案解决方案(S)窗口窗口(W)帮助帮助(H)新建程序新建程序撤消撤消Ctrl+Z增强编辑器增强编辑器查询查询提交提交分析分析新建窗口新建窗口使用该窗口使用该窗口打开程序打开程序恢复恢复程序编辑器程序编辑器表格编辑表格编辑重新调提交重新调提交开发和编程开发和编程最小化窗口最小化窗口帮助文档帮助文档关闭关闭剪切剪切Ctrl+X日志日志图形编辑器图形编辑器提交每一行提交每一行报表报表层叠层叠软件入门软件入门追加追加复制复制Ctrl+C输出输出报表编辑器报表编辑器提交提交N行行附件附件垂直平铺垂直平铺学习程序学习程序打开对象打开对象粘贴粘贴Ctrl+V图形图形图象编辑器图象编辑器登录登录ASSIST水平平铺水平平铺SAS网站网站保存保存清除清除Del结果结果文本编辑器文本编辑器远程提交远程提交桌面桌面调整大小调整大小关于关于SAS另存为另存为全部清除全部清除资源管理器资源管理器键盘宏键盘宏远程获取远程获取EIS/OLAP调停放视图调停放视图另存为对象另存为对象全部选定全部选定只显示内容只显示内容添加缩写添加缩写远程显示远程显示停放停放导入数据导入数据全部折叠全部折叠收藏夹收藏夹定制定制注销注销资源管理器资源管理器导出数据导出数据全部展开全部展开选项选项结果结果页面设置页面设置查找查找编辑器编辑器打印设置打印设置替换替换日志日志打印预览打印预览输出输出打印打印Ctrl+P发送邮件发送邮件退出退出SAS程序由程序由SAS语句组成,通常可以分为数据集和语句组成,通常可以分为数据集和过程语句两部分。过程语句两部分。SAS常用语句,有数据集定义语常用语句,有数据集定义语句、数据语句、注释语句、过程语句等。句、数据语句、注释语句、过程语句等。 格式格式名称名称功能功能变量变量=表达式表达式;赋值语句赋值语句把表达式的值赋给变量把表达式的值赋给变量/*输出数据输出数据*/注释语句注释语句只起注释作用,运行时不执行只起注释作用,运行时不执行array 变量名变量名(长度长度) 变量列表变量列表;数组语句数组语句定义下标变量组的字母名及变量个数定义下标变量组的字母名及变量个数datalines或或cards;数据数据 数据数据;数据语句数据语句数据用空格分隔,数据用空格分隔,cards和数据后分号各独占一行和数据后分号各独占一行data 数据集名数据集名;定义语句定义语句定义数据集定义数据集do 变量变量=初值初值 to 终值终值 by增量增量;语句语句;end;循环语句循环语句变量在初值至终值范围时反复执行循环体语句变量在初值至终值范围时反复执行循环体语句drop变量变量;删除语句删除语句删除变量,临时数据集不包含变量删除变量,临时数据集不包含变量goto 标签标签;转向语句转向语句改变执行顺序,转到指定标签语句执行改变执行顺序,转到指定标签语句执行if 条件式条件式 then 语句语句; else 语句语句;条件语句条件语句条件成立执行条件成立执行then 语句,否则执行语句,否则执行else 语句语句input变量变量 变量变量; 输入语句输入语句从从cards数据数据读入,读入,指定不同变量数据不分行指定不同变量数据不分行label:语句语句;标签语句标签语句为指定语句作标签为指定语句作标签output;输出语句输出语句用于循环语句输出数据,避免循环变量取值错误用于循环语句输出数据,避免循环变量取值错误proc 过程名过程名;语句语句;run;过程语句过程语句调用调用SAS过程运行并返回主程序过程运行并返回主程序title 字符串字符串;标题语句标题语句指定字符串为标题指定字符串为标题run;结束语句结束语句数据集结束数据集结束SAS语句均以分号结束,其一般格式可以表示为语句均以分号结束,其一般格式可以表示为命令字命令字 参数字参数字 参数参数; 输出变量值的过程语句为输出变量值的过程语句为proc print noobs; title 标题标题; var 变量变量 变量变量; run; 其中,其中,proc为命令字,为命令字,print为过程名,参数字为过程名,参数字noobs不显示观察对象编号不显示观察对象编号obs;参数字;参数字title输出标输出标题,题,标题标题为用户指定的标题字符串,可以在指定为用户指定的标题字符串,可以在指定字符左右两边同时使用单引号或双引号;参数字字符左右两边同时使用单引号或双引号;参数字var确定变量,变量名称用空格分隔,由用户指定;参确定变量,变量名称用空格分隔,由用户指定;参数字数字run结束过程调用。结束过程调用。
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号