资源预览内容
第1页 / 共131页
第2页 / 共131页
第3页 / 共131页
第4页 / 共131页
第5页 / 共131页
第6页 / 共131页
第7页 / 共131页
第8页 / 共131页
第9页 / 共131页
第10页 / 共131页
亲,该文档总共131页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
SPSS社会统计软件学习MARKETING INVESTIGATION李彬彬 王亮SPSS课程安排统计学基本知识SPSS软件简介数据的输入与整理常用数据分析方法统计学基本知识统计学定义:它是关于收集分析表述和解释统计数据的方法论科学统计的功能:主要是信息咨询和监督现代统计学分科:描述统计学与推断统计学(统计方法构成)理论统计学与应用统计学(方法研究与应用)基本概念 统计总体:是指客观存在的,在同一性质基础上结合起来的许多个别单位的整体,如上海地区的人口总数样本总体:在统计总体里,按照一定抽样方法抽取的部分个体,这些个体客观地反映总体的特征,如合理抽样100个学生样本进行相关统计指 标 :反映现象总体数量特征的概念,如样本平均数变 量: 统计总体个单位所具有的共同特征。如年龄,性别一 基本概念二 统计数据分布特征的描述1 统计变量集中趋势的测定 2 统计变量离散程度的测定 3 变量分布偏度与峰度的描述 1 统计变量集中趋势的测定定义:统计数据的集中趋势是指数据向其中心值靠近或集中的趋势测定集中趋势的作用1)反映总体各单位变量分布的集中趋势和一般水平2)比较同类现象在不同单位的发展水平3)比较同类现象在不同时期的发展变化趋势或规律4)分析现象之间的依存关系测量集中趋势的度量:位置平均数和数值平均数位置平均数众数(Mode):总体中出现次数最多的那个变量值,众数在描述数据集中 趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众 数来安排生产。求某医院当天出生新生儿的体重的众数,数据如表1-1所示。体重(斤)8 7 6 7 5 4 5 6 8 7 5 6 4 7 6 5.5 7 4中位数(Median):将总体中的数据按顺序排列后,处于数列中点位置上 的那个数据或变量值。它是一种位置代表值,所以不会受到极端数值的 影响,具有较高的稳健性。如果N为奇数,那么该数列的中位数就是位置 上的数;如果N为偶数,中位数则是该数列中第 与第 +1位置上两个数值的 平均数求某班级学生身高的中位数,数据如表1-2所示。 身高(cm) 174 168 164 174 176 150 183 162 171 146 189 167四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分 为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数 )、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一 半又称为四分位差,记为Q。四分位差越小,说明中间的数据越集中;四分位差 越大,则意味着中间部分的数据越分散。频数(Frequency):一个变量在各个变量值上取值的个案数。如要了解学 生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数 取值有多少个人,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清 楚地了解变量取值的分布情况。例子 10个学生在某次数学、语文、化学考试中成绩如表1-3所示,试求学生在3门课程上的频数分布。姓 名数 学语 文化 学hxh99.0098.00100.00yaju88.0089.0045.00yu99.0080.0056.00shizg89.0078.0067.00hah94.0078.0078.00lisa90.0089.0087.00watet79.0087.0089.00jess75.0076.0097.00wish89.0056.0076.00iiakii80.0076.00100.00 数值平均数 算术平均数(mean):是表现数据的集中趋势和代表性水品,基本形式为 总体标志总量比上总体单位总数。例如,学生某门学科的平均成绩、公 司员工的平均收入、某班级学生的平均身高等。 加权算术平均数(weighted mean):主要用于数据已经分组,并编制出 次数分布的条件下,这时必须先将各组标志值乘以相应的次数,得到各 组的标志总量,然后再相加得到总体标志总量。三个常用描述性度量比较 2 统计变量离散程度的测定集中趋势是统计总体数据特征之一,但由于个体的差异性,总体中的各数据还呈现相分散 的离中趋势,因此对数据的统计分析,除了要反映其分布的集中趋势外,还要反映数据的离散 程度,以到达对数据变动规律的全面描述。定义:离散程度是度量统计分布离中趋势的指标,同时反映了总体中各个单位标志值 的变异程度和平均数的代表水平。测定变量离散程度的作用1)反映现象总体中变量分布的离中趋势2)衡量均值的代表性3)测定现象变动的均匀性或稳定性程度测量离中趋势的度量:极差平均差四分位差方差标准差离散系数等极差(range):又称全距,离散程度的最简单测度值,是最大和最小变 量值之间的距离在相同样本容量情况下的两组数据,全距大的一组数据 要比全距小的一组数据更为分散。例子,某地农民人均年收入最高是8000元,最地是2600元一年,则该地区 农民收入的极差是8000-2600等于5400元。方差(variance):所有变量值与平均数偏差平方的平均值,它是测定 离散程度最常用的指标,离散程度最灵敏的指标。标准差(standard deviation): 它是方差的平方根。它表示了一组数 据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。四分位差(quartile deviation): 分位差是极差的一种改进,四分位差是在数 列中剔除最大和最小各四分之一的数据,是第一和第三个分位数之间距 离的二分之一,表明中位数到这两个四分位数的平均距离,是说明中位 数代表性高低的测量值。平均差(mean absolute deviation): 是分配数列中各单位标志值与其计算 平均数之间离差绝对值的平均数。离散系数:适用于比较不同现象或不同水平数据的变异程度的情况。 3 变量分布偏度与峰度的描述集中趋势和离中趋势是数据分布的两个重要特征,但是要全面了解数据分布的特点, 还要知道数据分布的形态特征。偏度:指分布不对称的方向和程度。偏度指标为,=0 数列分布为正态分布0数列分布正(右)偏分布0时,频率分布的峰度比正态分布的峰度要高尖态峰,表明集中趋势 显著,离中趋势低当0时,频率分布的峰度比正态分布的峰度要低平坦峰,表明离中趋势 显著,集中趋势低小结本节主要介绍平均数、中位数、众数、方差、百分位、频数、峰度、 偏度等统计学相关基本知识,基本统计知识是进行SPSS统计分析的基础 和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比 较准确的把握,从而有助于选择其他更为深入的统计分析方法。希望大家课后多查阅相关资料书籍,以更好的运用SPSS社会学统计软 件!欢迎你进入SPSS学习SPSS简介一SPSS的产生、发展和应用领域二SPSS13.0的安装、启动和退出三SPSS的窗口简介四SPSS13.0的Help系统一 SPSS的产生、发展和应用领域 社会科学统计软件包(Statistical Package for the Social Science, SPSS)是世界著名的统计分析软件之一。 1968年,3位美国斯坦福大学的学生开发了最早的SPSS系统,并基于这 一系统于1975年在芝加哥合伙成立了SPSS公司。 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。 经近40年的发展,在全球已拥有大量的用户, SPSS主要应用于农业、工 业、商业、医学、交通运输、公检法、社会学、市场分析、股市行情、 军事地理、旅游业等多个领域和行业,是世界上应用最广泛的专业统计 软件。 SPSS的最新版本为19.0,主要开发为vista使用系统,SPSS13.0的经典 版,稳定性比较高。 总之,可以这么说,有需要数据分析的地方,就可以用到SPSS,同学们 要认真学。请见演示 二 SPSS13.0的安装、启动和退出三 SPSS的窗口简介 SPSS主界面主要有两个,一个是SPSS数据编辑窗口,另一个是SPSS 输出窗口。 数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名栏、内容区 、窗口切换标签页和状态栏组成,见下图。数据编辑窗口1、菜单介绍 File:“文件”菜单用于新建SPSS 各种类型文件,打开一个已存在的文 件,从文本文件或其它数据源读入数据。 Edit:“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变 SPSS 默认设置等。 View:运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标签 和改变字体。 Data:运用“数据”菜单对SPSS 数据文件进行全局变化,例如定义变量 ,合并文件,转置变量和记录,或产生分析的观测值子集等。 Transform:“转换”菜单在数据文件中对所选择的变量进行变换,并在 已有变量值的基础上计算新的变量。 Analyze:“分析”菜单在以前版本中为“统计(Statistics)”,可进行 各种统计分析,包括各种统计过程(Procedure),如回归分析、相 关分析、因子分析等等。 Graphs:“图表”菜单产生条形图、饼图、直方图、散点图和其它全 颜色、高分辨率的图形,以及动态的交互式图形。有些统计过程 也产生图形,所有的图形都可以编辑。 Utilities:“工具”菜单可以显示数据文件和变量的信息,定义子集, 运行脚本程序,自定义SPSS 菜单等。 Window:“窗口”菜单用于选择不同窗口和最小化所有窗口。 Help:“帮助”菜单包含SPSS 帮助主题、SPSS 教程、SPSS 公司 主页、统计教练等菜单项。 该窗口下方有两个标签:“Data View”(数据视图)和 “Variable View”(变量视图)。(1) 一个列对应一个变量,即每一列代表一个变量( Variable)或一个被观测量的特征。例如问卷上的每一项就 是一个变量。(2) 行是观测,即每一行代表一个个体、一个观测、一 个样品,在SPSS中称为事件(Case)。例如,问卷上的每一 个人就是一个观测。 SPSS结果输出窗口名为Viewer,它是显示和管理SPSS统计分析结果、 报表及图形的窗口。SPSS结果输出窗口 用鼠标双击结果输出窗口中的图形,进入图形编辑窗口,可以对图形进行定 义编辑图形编辑窗口四 SPSS13.0的Help系统在运行SPSS的任何时候,单击“Help”菜单中的“topics”命令,会弹 出帮助主题窗口。在其中选择相关的命令,即可得到所需的各种帮助。Help系统可以为不同级别的用户提供不同阶段的指导,有如入门级用户 的tutorial”命令,实例学习“Case studies”过程,还有手把手的 “Statistics Coach”的过程小结SPSS是在当前社会经济分析中应用最广泛的软件之一。继 SPSS13.0之后,SPSS公司推出了最新的SPSS19.0,这是一个功能强 大、设计人性化的统计学软件。 SPSS的主界面有两个,一个是SPSS数据编辑窗口,一个是SPSS结 果输出窗口,例外还有一个图形编辑窗口。下面让我们进入主题吧!数据输入和整理一 定义变量SPSS对数据的处理是以变量为前提的,因此本节主要介绍 定义变量、输入数据和数据整理。输入数据前首先要定义变量。定义变量即要定义变量名、变 量类型、变量长度(小数位数)、变量标签(或值标签)和 变量的格式。单击数据编辑窗口左下方的“Variable View”标签或双击列的 题头(Var),进入如下图所示的变量定义视图窗口,在此 窗口中即可定义变量。在上图所示的窗口中每一行表示一个变量的定义信息,包括 Name、T
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号