资源预览内容
第1页 / 共107页
第2页 / 共107页
第3页 / 共107页
第4页 / 共107页
第5页 / 共107页
第6页 / 共107页
第7页 / 共107页
第8页 / 共107页
第9页 / 共107页
第10页 / 共107页
亲,该文档总共107页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Slide 1 第二讲第二讲 SASSAS的数据存储与读取的数据存储与读取 金融学院金融学院 冯建芬冯建芬 博学楼博学楼 707, 64495048 danxin_97 Slide 2 内容提要内容提要 SAS对数据文件的管理;对数据文件的管理; SAS逻辑库与逻辑库与SAS数据集功能及其属性数据集功能及其属性 建立逻辑库,读入文件;建立逻辑库,读入文件; 建立数据集,读入原始数据;建立数据集,读入原始数据; 建立空数据集建立空数据集 直接对变量赋值建立数据集直接对变量赋值建立数据集 直接输入数据建立数据集直接输入数据建立数据集 从其他数据集导入数据建立数据集从其他数据集导入数据建立数据集 从外部文件导入数据建立数据集从外部文件导入数据建立数据集 输出原始数据输出原始数据 输出到输出窗口;输出到输出窗口; 导出到外部文件;导出到外部文件; 输出单个变量的记录;输出单个变量的记录; Slide 3 涉及章节涉及章节 SAS编程技术教程(第二版): 第二章,第三章,第四章:4.1-4.4,4.14,第8章, 第9章 帮助目录:SAS productsBase SASSAS statements reference,fourth edition dictionary of SAS elements Slide 4 本章目的本章目的 了解SAS管理数据的方式,掌握SAS的两种关键 语句:data步和proc步; 掌握各种引擎的逻辑库的建立; 熟悉SAS程序的编写规则; 掌握各种建立数据集的方式; 掌握部分常用SAS语句的使用: libname ,data, input, cards, put , file, infile,set; 掌握部分过程的应用: print, sort, import, export 熟悉SAS的表达式规则; 学习如何导入导出数据; Slide 5 2.1 SAS对数据文件的管理对数据文件的管理 参见SAS编程技术教程第二章2.1-2.2 Slide 6 SAS作为一个信息加工和提交工具,对数据具有很作为一个信息加工和提交工具,对数据具有很 强的分析和呈现功能,这些功能通过强的分析和呈现功能,这些功能通过过程过程来实现,如来实现,如 print过程实现打印输出功能, means过程实现基本统计量计算功能, reg过程实现回归功能 IML过程实现矩阵运算功能 surveyselect,随机抽样过程等; 所有这些功能只面向SAS数据集;数据集; 为此为此SAS也提供了很多工具,用于方便实现各种格也提供了很多工具,用于方便实现各种格 式数据文件与式数据文件与SAS数据集的转换,方便用户发挥各种软数据集的转换,方便用户发挥各种软 件的优势,这也是为什么很多金融机构使用件的优势,这也是为什么很多金融机构使用SAS处理数处理数 据的原因之一;据的原因之一; Slide 7 其它格式数据处理流程其它格式数据处理流程 文本格式 数据(txt,.csv) 流行的数据库 Access,oracle,DB2, Sybase 其他文件格 式(excel,spss等) SAS数据集 SAS程序 SAS数据集 Slide 8 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 SAS逻辑库逻辑库 SAS数据集数据集可以按需可以按需要要存入存入windows的不同子目录的不同子目录 下,但在下,但在SAS系统下,不能类似系统下,不能类似word,excel等通过浏览文等通过浏览文 件的件的windows地址直接访问文件,必须为文件所在文件地址直接访问文件,必须为文件所在文件 夹建立夹建立逻辑库逻辑库,然后通过逻辑库对文件进行操作。,然后通过逻辑库对文件进行操作。 逻辑库 文件文件 Slide 9 SAS名称及命名规则名称及命名规则 SAS名的类型:名的类型: 1)逻辑库名逻辑库名; 2)数据集名数据集名; 3)变量名变量名; 6)数组名数组名; 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 Slide 10 首字符首字符必须为必须为英文字母(英文字母(A A- -Z Z,包括大写和小,包括大写和小 写)或下划线(写)或下划线(_ _);); 由数字、字母和下划线组成;由数字、字母和下划线组成; 不区分大小写不区分大小写 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 命名长度:命名长度: 逻辑库名:逻辑库名:最多不超过最多不超过8个字符;个字符; 数据集名,变量名,数组名:数据集名,变量名,数组名:最最多不超过多不超过32 个字符个字符 Slide 11 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 例例2.1: _, data_1, data_b, _abc_ 正确正确 数据库数据库_1, data-1 不正确不正确 Slide 12 建立逻辑库建立逻辑库 工具栏方式工具栏方式 打开打开explorer的的library, 单击工具栏中的单击工具栏中的 “ “;“; 程序方式:程序方式: LIBNAME libref SAS-data- library ; 例例2.2 建立逻辑库建立逻辑库data_1, 指向指向D: libname data_1 d: ; 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 Slide 13 逻辑库的种类逻辑库的种类 分为分为临时逻辑库临时逻辑库和和永久逻辑库永久逻辑库两种。两种。 临时逻辑库临时逻辑库中的文件只在中的文件只在SAS进程中存进程中存 在,在, 关闭关闭SAS系统就会被自动删除,系统就会被自动删除,SAS只有一个只有一个 临时逻辑库临时逻辑库work; 永久逻辑库:永久逻辑库:其他系统默认逻辑库和用户其他系统默认逻辑库和用户 建立的逻辑库都是永久逻辑库,其中的文件一建立的逻辑库都是永久逻辑库,其中的文件一 旦建立不会被自动删除,可以永久保留在指定旦建立不会被自动删除,可以永久保留在指定 的的windows文件夹中,但逻辑库名在文件夹中,但逻辑库名在SAS进程进程 结束(即关闭结束(即关闭SAS系统)后可能失效,除非选系统)后可能失效,除非选 中中“启动时启用启动时启用”选项。选项。 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 Slide 14 引用引用SAS文件文件 指定逻辑库名以后,就可以用两级命名方式引 用SAS文件: 逻辑库名逻辑库名. .文件名文件名 第一级为逻辑库名,第二级为文件名,中间用英第一级为逻辑库名,第二级为文件名,中间用英 文句点分开。文句点分开。 例2.3 在逻辑库data1中建立数据集a; Data data1.a; /*数据集数据集a在在data1逻辑库中逻辑库中*/ Run; Data a; /* 数据集数据集a在在work逻辑库中逻辑库中*/ Run; 一、一、SAS文件和文件和SAS逻辑库逻辑库逻辑库逻辑库 Slide 15 数据集数据集 SAS数据集是一种由数据集是一种由SAS系统建立、维护和管系统建立、维护和管 理的数据文件,只有数据集才能被大部分过程理的数据文件,只有数据集才能被大部分过程 作为处理的数据对象。作为处理的数据对象。 SAS数据集格式的数据可以被快速打开,并进 行浏览、修改和加工; SAS数据集格式的数据可以进行各种分析处理 和用表格及图形进行展示; 一、一、SAS文件和文件和SAS逻辑库数据集逻辑库数据集 Slide 16 数据集构成数据集构成 一个数据集包括两个组成部分:描述部分和数据部 分; 数据部分数据部分是打开逻辑库中的文件时展现在我们眼 前的部分,是数据值的集合。 Name Sex Age Height Weight 1 Joyce F 11 51.3 50.5 2 Thomas M 11 57.5 85 3 Jane F 12 59.8 84.5 4 Louise F 12 56.3 77 5 James M 12 57.3 83 6 John M 12 59 99.5 7 Robert M 12 64.8 128 变量名 观测号 观测 一、一、SAS文件和文件和SAS逻辑库数据集逻辑库数据集 Slide 17 描述部分:即属性,包含以下部分描述部分:即属性,包含以下部分 数据集的名称 创建数据集的日期和时间 观测的个数 变量的个数 数据集的属性除名字(name)外,还可以添加 标签(标签(label),),方便描述数据集存储数据的特性 数据集中的每一个变量也有属性: 类型、名字(name)、标签标签(label)、长度长度 (length)、输入输入/输出格式输出格式(informat/format)等 一、一、SAS文件和文件和SAS逻辑库数据集逻辑库数据集 Slide 18 变量属性标签(变量属性标签(labellabel)书写规则)书写规则 可以是中文、英文字母等任何符号; 最长不超过256个字符; 变量属性类型(变量属性类型(type) 只有字符型(character),数值型(numeric)两种 类型,一个变量只能属于一种类型; 数值型变量只能是合法的数值,缺失值缺失值为”.”。日日 期属于数值型变量,取整数值,日期数据将期属于数值型变量,取整数值,日期数据将19601960年年1 1 月月1 1日取值为日取值为0,0,每加每加1 1代表增加代表增加1 1天,天, 日期时间数据日期时间数据 将将19601960年年1 1月月1 1日日00:00:0000:00:00取为取为0,0,每加每加1 1代表增加代表增加1 1秒。秒。 字符型变量的值可以是任何字符串,如“中 国”“Alex” “Hello! 123”等,缺失值缺失值为“ ” ; 一、一、SAS文件和文件和SAS逻辑库数据集逻辑库数据集 Slide 19 变量属性输入格式(变量属性输入格式(informatinformat) 确定数据如何读入到SAS数据集; 变量属性变量属性输出格式(输出格式(formatformat) 确定数据如何显示,即打开数据集我们看 到的格式; 具体输入输出格式可以参见SAS编程技术教 程第二版,第8章; 一、一、SAS文件和文件和SAS逻辑库数据集逻辑库数据集 Slide 20 数据视图:除我们常用的数据集外,还有一种 数据视图 例:例: datadata a/a/viewview=a;=a; setset data.class;data.class; Run;Run; 目录册:特殊的SAS文件,用于存放多种不同种 类的信息文件,比如可以将一系列的图放在一 个目录册里,便于引用;(参看SAShelp逻辑库) 一、一、SAS文件和文件和SAS逻辑库其他文件逻辑库其他文件* Slide 21 二、建立逻辑库,读入外部文件二、建立逻辑库,读入外部文件* SAS访问外部文件可以通过两种方式: 一种是将外部文件转换成SAS数据集(这种方式在2.2节会学习到) ; 另一种通过建立不同引擎引擎的逻辑库进行访问,通过LIBNAME语句和库引擎 连接的外部文件有两类:
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号