资源预览内容
第1页 / 共144页
第2页 / 共144页
第3页 / 共144页
第4页 / 共144页
第5页 / 共144页
第6页 / 共144页
第7页 / 共144页
第8页 / 共144页
第9页 / 共144页
第10页 / 共144页
亲,该文档总共144页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
统计分析系统SAS软件敖 雁 (扬州大学)Tel:7979358 E-mail:ayyzcn.netSAS概述nSAS含义:Statistical Analysis SystemnSAS是美国使用最为广泛的三大著名统计分析软件SAS SPSS和SYSTAT)之一SAS的广泛应用n电信(运用SAS软件产品进行网络运营分析和管理)n金融(SAS帮我们发现 有竞争力的商机)n保险n制造(SAS软件帮助日本富士通集团了解客户的需求,上海宝钢利用 SAS软件改善产品质量和运输过 程)n证券n公共事业(香港选择 SAS来做2001年的人口普查)美国SAS软件研究所n1966年开始研制n1976年商品化n1985年SAS PC微机版本n1987年DOS下的SAS6.03版(6.04版)n推出WINDOWS下运行,SAS6.11版,SAS6.12 版,SAS8.0版,SAS8.2版,SAS9.0版,SAS9.1 版nftp:/ftp.yzu.edu.cnIncomingScience统计软件SAS8.2 SAS8nwww.sasor.com操作系统nUNIXnWINDOWSnDOS适用人群具有不同水平与经验的用户n初学者可以较快掌握其基本操作n熟练者可用于完成各种复杂的数据处理(科研 工作者和统计学家)统计分析n常用生物统计分析n多变数分析n试验设计n次数资料的测验n非参数测验常用生物统计分析n描述性统计n统计推断n方差分析n线性相关和回归分析n协方差分析n非线性回归分析多变数分析n多元方差分析n主成份分析n因子分析n聚类分析n典范相关分析第一章 SAS系统的工作环境n进入SAS系统nSAS主窗口与发布命令n浏览SAS常用子窗口的功能与提交程序n进入帮助菜单浏览SAS主窗口与发布命令nSas主窗口 -应用工作空间AWS:application Work Space-显示管理界面DMS:Display Management System 第二章 SAS程序初步SAS系统对数据的管理SAS数据集 (数据文件) SAS数据库(存数据集)文件夹(与数据库相对应)使用Libname命令可以指定库标记。它的 一般格式如下: Libname 库标记 文件夹位置 选项;如:libname a c:user;n临时库 个 名为WORKn永久库 多个SAS自动指定两个库标记nSASUSER:永久库 c:sassasuser nWORK:临时库 在程序中引用该库中 的数据集可以省略库标记,即它被认为 是缺省的数据库。c:sassaswork SAS数据集则对应文件,文件名为数据 集名,而扩展名为.sd2的文件。数据集名库标记.数据集名 如:libname a c:user;Data a.new 数据步创建和处理数据集的一些语句: 1)DATA语句 它的主要功能是:n标志数据步的开始。 n命名将要创建的SAS数据集。 DATA语句的一般形式如下: DATA 数据集名; Data new; (work.new)INFILE语句2)INFILE语句 用于从外部文件读入数据 ,必须出现在INPUT语句之前。它的主要功能是:n确定一个包含原始数据的外部文本文件。 INFILE语句的格式如下: INFILE 外部文件的所在位置及名称 选项;CARDS语句n3)CARDS语句 用于直接输入数据,标 志着数据块的开始。格式如下:nCARDS;n 数据块n; INPUT语句4)INPUT语句 用于向系统表明如何读入每一条 记录。它的主要功能有:n读入由语句指定的数据列。 n为相应的数据域定义变量名。 n确定变量的读入模式。 INPUT语句的格式如下:INPUT 变量名 变量类型 起止列数.;方括号表示其中的内容为可选,如果不输入 ,系统会以默认值代替。数据的三种输入方式n【直接输入方式】n【外部文件读入方式】n【读入其他格式的数据文件】例子:data temp; 命名将要建立的数据集为work.temp input x y; 要输入的变量为x、y,并且连续输 入 cards; 直接输入数据,数据块开始 34 56 78 90 35 67 89 10 23 65 77 45数据块 ; 数据块结束【外部文件读入方式】n如果刚才的数据已经事先输好,在硬盘 上的“C:USER”文件夹内存为temp.dat 文件,该文件内容如下(纯文本):34 56 78 90 35 67 89 10 23 65 77 45程序ndata temp;命名将要建立的数据集为 work.tempnInfile c:usertemp.dat;指定 外部数据文本文件名ninput x y;要输入的变量为x、y, 并且连续输入nRun;数据步结束,以上语句可以执行 了【读入其他格式的数据文件】nSAS可以利用FILE菜单上的import命令 将其他格式的数据文件导入SAS系统, 创建SAS自己的数据集。n可以导入的数据文件格式有:dBase数据库,EXCEL工作表,LOTUS 的数据库,纯文本的数据文件等 n1. 选择导入的数据格式,从下拉式菜单上选 择DBF格式,单击NEXT按钮。 n2. 给出数据文件的位置和文件名,在对话框 中键入C:USERtemp.DBF,或点BROWSE直 接从上面选择文件,选好后单击NEXT按钮。 n3. 选择导入的目的地,即指定要创建的数据 集的名字和存放的数据库名,先在左面的对 话框选择数据库名WORK(临时库),在右面 的对话框键入数据集的名字li1_1,此名可任 意起,少于8个字符,选择完后,单击FINISH 按钮,就完成了此次操作。SAS程序的程序步nPROC 过程名 DATA=数据集名 选项 ; 该过程的专用语句描述; VAR 变量序列;WHERE 条件表达式.; BY 变量序列;nRun;方括号里的语句均可以省略,在这时该 过程按最通常的情况来处理,即: n处理最新建立的SAS数据集。 n处理所有的变量(或对一个计算过程来 说处理全部数值变量)。 n一次处理整个数据集而不是某个子集。DATA参数、 VAR语句 n但有时我们的要求超出了默认方式所提供的 范围,这时就要动用方括号里的秘密武器了 。nDATA参数 指明所需处理的数据集名,请注意 在这里它是一个参数而不是语句。 nVAR语句 如果只想分析某一个或几个特定的 变量,则可用VAR语句指定它们。例如只想显 示变量x的列表,则PRINT过程如下:nProc print ; Var x;Run;如果想显示x和y两个变量,则将VAR语句 改为如下形式即可: var x y;Where语句nWhere语句 如果你想处理的不是整个数据集 而只是其中符合某种条件的子集,那么 WHERE语句将会非常有用,如上例中我们只 想显示大于50的x变量的值,则在PRINT过程 中加入where语句如下:nWhere x50;n如果条件变为x、y两个变量的值都要大于50 ,则where语句改为:nwhere x50 and y50;nSAS语言中常用的逻辑表达符号有and( 和)、or(或)、xor(异或)、ne( 不等)等。By语句nBy语句 如果你需要分组处理数据,例 如要按性别分组输出统计结果,你有两 种选择,一是用不同的where语句将同 一个程序步反复写几遍;另一种显然更 酷的方法就是采用by语句。如上例我们 想按不同的y值输出x值,则加入by语句 如下:nBy y;nPROC SORT DATA=数据集名; BY 变量名列;RUN;结构化语句简介n分支(条件)语句n循环语句分支(条件)语句n【语法格式】n语法格式如下:IF 条件 THEN 程序块;ELSE程序块;【应用实例】n例3.1 在产生数据集temp的同时为其增加变量 class,当x50时1,否则2。n解:程序如下:ndata temp; 数据步开始,定义要建立的数据集为 WORK.TEMPn input x y; 要输入的变量为X和Y,采用数据连续读入 方式if x50 then 1;建立新变量,如果X50,则 CLASS=1n else 2; 否则,CLASS=2ncards; 数据块开始n34 56 78 90 35 67 89 10 23 65 77 45数据块n; 数据块结束nproc print; 列表输出数据集中的数据,检查有无错 误nrun; 程序结束,开始运行以上程序 循环语句n【语法格式】DO 起始条件 TO 终止条件; 程序块; END;【应用实例】n例3.2 在产生数据集temp的同时为其增加变量class ,取值依次为1、2。n解:程序如下:nData temp; 数据步开始,定义要建立的数据集为WORK库的TEMPn do to 2; 循环开始,循环控制变量为CLASS,取值从1到2n input x y; 输入的变量为X和Y,并且采用数据连续读入方式n output; 用OUTPUT语句将循环控制变量写入数据集中n end; 循环结束ncards; 数据块开始n34 56 78 90 35 67 89 10 23 65 77 45 数据块n; 数据块结束nrun; 程序结束,开始运行以上程序第三章 统计图两个专门用于绘图的程序步nGCHART过程,用于绘制各种常用的统计图nGPLOT过程,而后者则用于绘制散点图。3.1 GCHART过程【绘图语句选项】 MISSING 指定绘图时要将变量的缺失值也包 括在内。 TYPE=做图类型关键字 指定要做图的类型, 即图中条块代表的含义:缺省值是频数( FREQ);如果指定了选择项SUMVAR,则缺 省值为总和(SUM)。可选的关键字有: FREQ 要求按指定变量的频数做图。 PERCENT 要求按在横轴刻度表示范围内出现 的频数占总数的百分比做图。 CFREQ 按累计频数做图。 CPERCENT 按累计百分比做图。 SUM 只能与SUMVAR选项同时使用,要求图 中的每一条代表:变量在横轴表示的取值范 围内时,SUMVAR指定变量的总和。 MEAN 只能与SUMVAR选项同时使用,要求图 中的每一条代表:变量在横轴表示的取值范 围内时,SUMVAR指定变量的均数。 SUMVAR=求和变量 指定使用TYPE=SUM或 MEAN时,用于求总和、均值的变量。 LEVAL=n 如果绘图变量是连续变量,用该选 项产生有N个组段的图形。 GROUP=分组变量 要求产生以分组变量的值 分组的并排图。 SUBGROUP=亚组变量 要求每个图形内部再 按亚组变量的值分块。 CAXIS=颜色 指定坐标轴的颜色。 CTEXT=颜色 指定坐标轴文本的颜色。 应用实例3.2 GPLOT过程 【GPLOT过程的选项】分层变量 表示所做的散点图按指定变量的取值分层,默认 按 不同颜色来区分。语句选项 OVERLAY 同一语句做的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号