资源预览内容
第1页 / 共60页
第2页 / 共60页
第3页 / 共60页
第4页 / 共60页
第5页 / 共60页
第6页 / 共60页
第7页 / 共60页
第8页 / 共60页
第9页 / 共60页
第10页 / 共60页
亲,该文档总共60页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
应用统计分析实验应用统计分析实验 R R软件软件笆讲奔魄怒酱链噪训虾驻栏党忙棒幻羽卧描屈真融弘焊绢邑瘟蔓癌憋醒擂应用统计分析实验R软件new应用统计分析实验R软件newSPSS:这是一个很受欢迎的统计软件这是一个很受欢迎的统计软件u容易操作,容易操作,u输出漂亮,输出漂亮,u功能齐全,功能齐全,u价格合理。价格合理。u对于非统计工作者是很好的选择。对于非统计工作者是很好的选择。邀假谅绩褥礁另桌苑吮扁仍侩牌惕肚晋谓锣孝碾助暗拇粹灾讯僧鹃皋婿抉应用统计分析实验R软件new应用统计分析实验R软件newExcelExcel:严格说来不是统计软件,但作为数据表:严格说来不是统计软件,但作为数据表格软件,必然有一定统计计算功能。格软件,必然有一定统计计算功能。u多数装多数装OfficeOffice时没有装数据分析的功能,画图时没有装数据分析的功能,画图功能都具备功能都具备( (虽然不好看虽然不好看) )。u对于简单分析,对于简单分析,ExcelExcel还算方便,但随着问题还算方便,但随着问题的深入,就不那么的深入,就不那么“傻瓜傻瓜”,需要很麻烦地使,需要很麻烦地使用函数,甚至根本没有相应的方法了。用函数,甚至根本没有相应的方法了。渗韵贬痈拎史娃虐壕弧奄谦价浙廉汾阔建唬度羞诞婆楞功啃嚷埃巾啡捅屑应用统计分析实验R软件new应用统计分析实验R软件newSAS:这是功能这是功能非常非常齐全的软件;齐全的软件;u美国政府政策倾斜美国政府政策倾斜(“权威性权威性”)u许多美国公司使用。许多美国公司使用。u价格不菲价格不菲,每年交费每年交费.即使赠送即使赠送,条件苛刻条件苛刻u尽管现在已经尽量尽管现在已经尽量“傻瓜化傻瓜化”,仍然需要一定的,仍然需要一定的训练才可以进入。训练才可以进入。盲汹剿曳厄繁率砒付屡梧哀辰臀益溯茵室庆块樊剧娥砌焊秆糖彭辩模膛壳应用统计分析实验R软件new应用统计分析实验R软件newS-plus:这是统计学家喜爱的软件。:这是统计学家喜爱的软件。u功能齐全,图形漂亮功能齐全,图形漂亮u有不断加入的各个方向统计学家编写的统计软件有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入算法包。也可以自己加入算法.u强大而又方便的编程功能,使得研究人员可以编强大而又方便的编程功能,使得研究人员可以编制自己的程序来实现自己的理论和方法。制自己的程序来实现自己的理论和方法。u它也在进行它也在进行“傻瓜化傻瓜化”以争取顾客。但主要以其以争取顾客。但主要以其方便的编程为顾客所青睐。但是对于不会编程者方便的编程为顾客所青睐。但是对于不会编程者,不那么不那么“傻瓜傻瓜”酚稼稀厩意岗脊痈惋纲虐仗拣妙宦察矽栖霹垂与省给藐液霍峨樱丘践囊敌应用统计分析实验R软件new应用统计分析实验R软件newR软件软件:免费的:免费的,志愿者管理的软件。志愿者管理的软件。u编程方便,语言灵活,图形功能强大编程方便,语言灵活,图形功能强大u有不断加入的各个方向统计学家编写的统计软件有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包包。也可以自己加入自己算法的软件包.u这是发展最快的软件,受到世界上统计师生的欢这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。迎。是用户量增加最快的统计软件。u对于一般非统计工作者来说,主要问题是它没有对于一般非统计工作者来说,主要问题是它没有“傻瓜化傻瓜化”。善夷坦屉铁替涅号俱帧舶甥惨扁刹兔拾眷搏池葡返钞呸泅庆片镣昔急耿狄应用统计分析实验R软件new应用统计分析实验R软件newMinitab:这个软件是很方便的功能强大而又齐:这个软件是很方便的功能强大而又齐全的软件,也已经全的软件,也已经“傻瓜化傻瓜化”,在我国用的不如,在我国用的不如SPSS与与SAS那么普遍。那么普遍。Eviews:这是一个主要处理回归和时间序列的:这是一个主要处理回归和时间序列的软件。软件。GAUSS:这是一个很好用的统计软件,许多搞:这是一个很好用的统计软件,许多搞经济的喜欢它。主要也是编程功能强大。目前在经济的喜欢它。主要也是编程功能强大。目前在我国使用的人不多。我国使用的人不多。MATLAB:这也是应用于各个领域的以编程为主这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。但是统计方法不多。的软件,在工程上应用广泛。但是统计方法不多。噶怖扑挤赡琳灼峪澳冲蛆性条辈硝驹睫版膊钞橇凡鼠寐酌娥匀蘸乓冗垃铃应用统计分析实验R软件new应用统计分析实验R软件new使用傻瓜软件的问题使用傻瓜软件的问题.无法任意取出计算过程中产生的任何中间结果无法任意取出计算过程中产生的任何中间结果; ;只能输出软件规定的输出只能输出软件规定的输出. .无法在中间插入任何算法无法在中间插入任何算法. . 无法实现软件所没有的计算无法实现软件所没有的计算. .无法实现任何方法无法实现任何方法或计算方面的创新或计算方面的创新. .是输入输出皆有限制的黑盒子是输入输出皆有限制的黑盒子. .用语句的任何计算用语句的任何计算( (即使即使1+1=2) 1+1=2) 都需类似八股都需类似八股文的文的 “花架子花架子”. .蚌咐蜡翼机蹈污茵泪非鸵渗替吩迫屯铀烽石震怕汽会啮书哄栅姿换冗志跪应用统计分析实验R软件new应用统计分析实验R软件new搞统计是否不需要学习编程语言,可以不学习搞统计是否不需要学习编程语言,可以不学习, ,如果你如果你搞纯粹数学推导的搞纯粹数学推导的, ,只搞只搞“理论理论”, ,不面对数据不面对数据, , 不用计算机不用计算机觉得岁数太大觉得岁数太大, ,学不会学不会“非傻瓜非傻瓜”的计算的计算不想有创新不想有创新, ,仅使用现成方法套用仅使用现成方法套用罐骄联犯屠用诌桑够屿二膨骡媚藕哟脆蛙匠抡恰字盾内勺吝潦潭次溢软烫应用统计分析实验R软件new应用统计分析实验R软件new但如果你要创新但如果你要创新你需要反复试验你的新方法你需要反复试验你的新方法需要用各种数据来检验你的新方法需要用各种数据来检验你的新方法需要把你的方法和老方法进行比较需要把你的方法和老方法进行比较需要介绍自己的新方法需要介绍自己的新方法使用编程语言不可避免使用编程语言不可避免拎辜铡摔欣腐谤填敷望讯厢中尿戒臻灰锻康塑忧雪冈贡韦奇虫纱又既妙霜应用统计分析实验R软件new应用统计分析实验R软件newR软件克彝戏咙珐采库氯焕臣冻苏御琼雍胆嚏碎绥恳蓉掐舜巡歹蛋糖粘尉丘邵橱应用统计分析实验R软件new应用统计分析实验R软件newR免费免费 资源公开资源公开(不是黑盒子不是黑盒子,也不是吝啬鬼也不是吝啬鬼)R可以在可以在UNIX, Windows和和Macintosh运行运行.R 有优秀的有优秀的内在帮助系统内在帮助系统.R有优秀的有优秀的画图功能画图功能学生能够轻松地学生能够轻松地转转到商业支持的到商业支持的 S-Plus程序程序(如如果需要使用商业软件果需要使用商业软件) R语言有一个语言有一个强大的强大的,容易学习容易学习的语法的语法,有许多内有许多内在的统计函数在的统计函数.筑誊扳鸵罩酥赦逾雌听迭窘行澳对育能贬贸非囤腐堂脓留头冤宵扇邢寺酒应用统计分析实验R软件new应用统计分析实验R软件new通过用户自编程序通过用户自编程序, R语言很容易延伸和扩大语言很容易延伸和扩大. 它就是这样成长的它就是这样成长的.R 是计算机编程语言是计算机编程语言. 类似于类似于UNIX语言语言,C语言语言,Pascal,Gauss语言等语言等.对于熟练的编程者对于熟练的编程者, 它将觉得该语言比其他语言它将觉得该语言比其他语言更熟悉更熟悉.而对计算机初学者而对计算机初学者, 学习学习R语言使得学习下一步语言使得学习下一步的其他编程不那么困难的其他编程不那么困难.那些傻瓜软件那些傻瓜软件(SAS,SPSS等等)语言的语法则完全不语言的语法则完全不同同.算病食各附醒纬鞘柱栈休踩薛抱踞晚喉谩加婪隧摆夯甘涯沛括牵奢顿诞乓应用统计分析实验R软件new应用统计分析实验R软件newR的历史的历史S语言在语言在1980年代后期在年代后期在AT&T实验室开发实验室开发.R 项目由项目由Auckland 大学统计系的大学统计系的Robert Gentleman和和Ross Ihaka于于1995年开始的年开始的.它很快得到广泛用户的欢迎它很快得到广泛用户的欢迎. 目前它是由目前它是由R核心核心发展团队维持发展团队维持;它是一个由志愿者组成的工作努它是一个由志愿者组成的工作努力的国际团队力的国际团队啤葫特等陪取忍抵掩哈叠辣顾具眷秤合焙昂头宫枫伦啦呢斡栽孔迁坦固辨应用统计分析实验R软件new应用统计分析实验R软件new下载下载R软件软件http:/www.r-project.org学习网站http:/www.biosino.org/pages/newhtm/r/schtml/颧铜莉胖誉危镶剔北蛾闭射刺戍仆伴菜城押诬背树下硝喀弗己胎立胞汾扒应用统计分析实验R软件new应用统计分析实验R软件new1R软件的使用软件的使用1.基本语法基本语法2.向量、矩阵向量、矩阵 3.list与与data.frame4.读写数据文件读写数据文件5.控制语句与自定义函数控制语句与自定义函数二二. 数据描述性分析数据描述性分析1.分布分布2.统计量统计量3.一维数据的统计图形一维数据的统计图形4.多维数据的图形表示多维数据的图形表示R软件坐掷燃虚烙惋糟砧赎菩蝴渺违诛红辽贩枕克花菏设膨靛彻蝗蚕盯陌侵近内应用统计分析实验R软件new应用统计分析实验R软件new三三. 回归分析回归分析四四. 判别分析判别分析五五. 聚类分析聚类分析六六. 主成分分析主成分分析尾磅镍柔辜钧抗哺酸虹懂症液选床欢齿痘奔豺巳诱氛钦丧磐乒沮过备迟匹应用统计分析实验R软件new应用统计分析实验R软件newn 基本语法基本语法1. 1. 变量使用即定义变量使用即定义变量使用即定义变量使用即定义, ,变量名区分大小写变量名区分大小写变量名区分大小写变量名区分大小写, , 可用中文命名可用中文命名可用中文命名可用中文命名 变量赋值可采用变量赋值可采用变量赋值可采用变量赋值可采用4 4种形式:种形式:种形式:种形式:= =,, assign(), assign() 变量类型自动由变量赋值确定。变量类型自动由变量赋值确定。变量类型自动由变量赋值确定。变量类型自动由变量赋值确定。 # # 注释符号注释符号注释符号注释符号, , 分号分号分号分号; ; 语句连接符语句连接符语句连接符语句连接符例子:例子:例子:例子:a=10 aa assign(“a”,10)a=10 aa assign(“a”,10)A=10 AA assgin(ab,200)A=10 AA assgin(ab,200)中国中国中国中国=“=“中华人民共和国中华人民共和国中华人民共和国中华人民共和国” ” # #生成字符串变量生成字符串变量生成字符串变量生成字符串变量assign(“assign(“中国中国中国中国”, “”, “中华人民共和国中华人民共和国中华人民共和国中华人民共和国” ”) a=10; A=10; a; A唇蛇潍镜猛轨笺呼臃威蘑库厨级忆位眨识肝贮缨兆孤穗逾狮寡穿赠丘挟鹃应用统计分析实验R软件new应用统计分析实验R软件new2.算术运算符算术运算符: +,-,*,/,(乘方乘方),% (模模), %/% (整整除除) 3.常用的数学函数有常用的数学函数有:abs , sign , log , log2, log10 , sqrt , exp , sin , cos , tan , acos , asin, atan , cosh , sinh, tanh4. 查看帮助,例如: help(round), ?abs帖壹菠嗜婚词踌骆寡桨侧踩照蓟垣剁贪一门万备咸肋艾灭然胁踏蕴鞠湍谋应用统计分析实验R软件new应用统计分析实验R软件newn 向量、矩阵向量、矩阵 1.1.向量向量向量向量 ( (一维数组一维数组一维数组一维数组, , 下标从下标从下标从下标从1 1开始开始开始开始) ) a=c(d1,d2,d3,)a=c(d1,d2,d3,) 间隔为间隔为间隔为间隔为1 1的等差序列的等差序列的等差序列的等差序列: : a:ba:b 指定间隔的等差序列指定间隔的等差序列指定间隔的等差序列指定间隔的等差序列: : seq(from,to,by)seq(from,to,by) seq(length=, from=, by=)seq(length=, from=, by=) 重复函数:重复函数:重复函数:重复函数: rep(vec, times)rep(vec, times) rep(vec,times,len=,each=)rep(vec,times,len=,each=) a=c(3,5,8,10) a=c(3,5,8,10) a=1:10; b=seq(1,10,2); c=rep(a, 2,each=3) a=1:10; b=seq(1,10,2); c=rep(a, 2,each=3) a=seq(-pi,pi, 0.2) a=seq(-pi,pi, 0.2)随机向量随机向量 rnorm(10) #10个服从标准正态分布的随机数个服从标准正态分布的随机数嚷亡毡吼咸淀迂肮挪夕聂找马劲胺缔哇姚摘毒晴牧蝉犊陋沼撬输莱颅蟹延应用统计分析实验R软件new应用统计分析实验R软件newz=1:5z7=8;z1 1 2 3 4 5 NA 8 # 缺失数据缺失数据 NAzc(1,3,5)=1:3; z1 1 2 2 4 3 NA 8 zis.na(z)=0 zis.na(z)=0 # 函数函数is.na()判断数据是否缺失判断数据是否缺失 ,将其为真的赋为将其为真的赋为0 zz0,n #第第n列大于列大于0的元素的元素x,-c(1,3) #没有第没有第1、3列的列的x.x-2,-c(1,3) #没有第没有第2行、第行、第1、3列的列的x.盼蔡晚长仙涧分忠捍沏禹铝姿敏仔鼓客都挣南予距藕图呢捐奴其便霉即哺应用统计分析实验R软件new应用统计分析实验R软件new5. 5. 基本矩阵运算基本矩阵运算基本矩阵运算基本矩阵运算 矩阵间四则运算:矩阵间四则运算:矩阵间四则运算:矩阵间四则运算:+,-,*,/ +,-,*,/ 分别是对应元素的四则运算分别是对应元素的四则运算分别是对应元素的四则运算分别是对应元素的四则运算 向量矩阵间:向量按列匹配与矩阵运算向量矩阵间:向量按列匹配与矩阵运算向量矩阵间:向量按列匹配与矩阵运算向量矩阵间:向量按列匹配与矩阵运算例如:例如:例如:例如: A=matrix(1:6, nrow=3) A=matrix(1:6, nrow=3) B=matrix(10:15,nrow=3) B=matrix(10:15,nrow=3) C=c(100,200) C=c(100,200)则:则:则:则: A+B A*B A+C A+B A*B A+C11 17 10 52 101 204 13 19 22 70 102 20515 21 36 90 103 206符虽类敲抬鞋玛锈统九锻鸦帐憾婪多酞秘洽羽剥蔡簧焊躁怒堰充雌消烂痔应用统计分析实验R软件new应用统计分析实验R软件new6. 6. 矩阵运算矩阵运算矩阵运算矩阵运算 转置转置转置转置 t(mat) t(mat) 行列式行列式行列式行列式 det(mat) det(mat) 逆矩阵逆矩阵逆矩阵逆矩阵 solve(mat) solve(mat) 特征特征特征特征 eigen(mat) # eigen(mat) #返回列表返回列表返回列表返回列表(values, vectors)(values, vectors) 乘法乘法乘法乘法 A %*% B A %*% B 向量内积向量内积向量内积向量内积/ /外积外积外积外积 x %*% y, x %o% y ( x %*% y, x %o% y (笛卡尔积笛卡尔积笛卡尔积笛卡尔积) ) 生成对角生成对角生成对角生成对角 diag(Vec) diag(Vec) 取对角取对角取对角取对角 diag(mat) diag(mat) 奇异值分解奇异值分解奇异值分解奇异值分解 svd(mat) mat=UDV svd(mat) mat=UDV 得到列表得到列表得到列表得到列表(d,u,v)(d,u,v) qr qr分解分解分解分解 qr(mat) qr(mat) Choleski Choleski分解分解分解分解 chol(mat) chol(mat)赢烂嫉村佳堪滥淄发架踏靴拌鲁给淋必飘棒这遂丫瑚绘兰闻笨务济驹亡拿应用统计分析实验R软件new应用统计分析实验R软件newn列表和数据框列表和数据框1. 1. 列表是一种特殊的对象集合,各元素类型任意列表是一种特殊的对象集合,各元素类型任意列表是一种特殊的对象集合,各元素类型任意列表是一种特殊的对象集合,各元素类型任意生成:生成:生成:生成: list(name1=value1, , namen=valuen) list(name1=value1, , namen=valuen)访问访问访问访问/ /修改:对象名修改:对象名修改:对象名修改:对象名 下标下标下标下标 或或或或 对象名对象名对象名对象名$namei $namei stu=list(age=10, name=“Tom”, stu=list(age=10, name=“Tom”, interests=c(“swimming”,”drawing”) interests=c(“swimming”,”drawing”)stu2stu2stu$namestu$namestu$name=“john”stu$name=“john” names(stu) #得到所有的变量名得到所有的变量名宠达旭媒驰睁敢惟洛削鼎卿唁衍排贞惶寡咸照兴既筐申枪尝簇罚镀癌梆吴应用统计分析实验R软件new应用统计分析实验R软件new2. 2. 数据框是数据框是数据框是数据框是R R的一种数据结构,以矩阵形式保存数据的一种数据结构,以矩阵形式保存数据的一种数据结构,以矩阵形式保存数据的一种数据结构,以矩阵形式保存数据各列类型可以不同,每列为一变量,每行为样品各列类型可以不同,每列为一变量,每行为样品各列类型可以不同,每列为一变量,每行为样品各列类型可以不同,每列为一变量,每行为样品 各列长度相等各列长度相等各列长度相等各列长度相等生成:生成:生成:生成: data.frame( ) data.frame( ) stu=data.frame(name=c(“john”,”wuji”), age=c(30,32) x=data.frame(matrix(1:6,nrow=2) names(stu) #得到所有的变量名得到所有的变量名 rownames(stu) #得到行名得到行名 attach(x) #把数据框中的变量链接到内存中把数据框中的变量链接到内存中 拾如还弧隙翠桶浸偿焙圾殊旱狡埋披粟痛隔美吱隔梦骸病包行挎镊莽怎霹应用统计分析实验R软件new应用统计分析实验R软件newx=matrix(1:6,2,3)x=data.frame(x);x X1 X2 X31 1 3 52 2 4 6x$X21 3 4attributes(x)$names1 “X1 “X2 “X3“$row.names1 1 2“$class1 data.frame摊碑拉尾陪即涕戈绽绞言当浮私可括呕防镰趋诡莲凡辨啼醋篇朝榜涨镣汐应用统计分析实验R软件new应用统计分析实验R软件newx=data.frame(id=101:120,score=round(rnorm(20,70,10)xseq(1,10,2),xorder(x2,decreasing = T ),xx20) a=10;b=10 else a=20; b=20; if(x0) a=10;b=10 else a=20; b=20; switch(x, 1:5, 100, 20) switch(x, 1:5, 100, 20) # 1 2 3 4 5# 1 2 3 4 5 这三个构成列表这三个构成列表这三个构成列表这三个构成列表 list, list,返回返回返回返回 listx listxn控制语句控制语句隧秘识计码眩毖尺坍想磷稳障贫旨使炊充则磺鸯划铬愚踩同遗仟钵拾栓涟应用统计分析实验R软件new应用统计分析实验R软件new2. 2. 循环结构循环结构循环结构循环结构 for (name in express) expr; for (name in express) expr; # expr_s# expr_s while(condition) expr; while(condition) expr; # expr_s# expr_s repeat exprs; repeat exprs; if(if(达到中止条件达到中止条件达到中止条件达到中止条件) break) break 中止循环语句:中止循环语句:中止循环语句:中止循环语句:break; break; 跳空循环语句:跳空循环语句:跳空循环语句:跳空循环语句:next;next;例子:完成例子:完成例子:完成例子:完成1 1到到到到100100的求和运算的求和运算的求和运算的求和运算 s1=0; j=1; k=1; s2=0; s3=0; s1=0; j=1; k=1; s2=0; s3=0; for( i in 1:100) s1=s1+i; # for( i in 1:100) s1=s1+i; #或者或者或者或者 while(j=100) s2=s2+j; j=j+1; # while(j100) break repeat s3=s3+k; k=k+1; if(k100) break 粗灶撩务衙哲慧筏弱队圃夸升署脯烷经稗拽搞鼠盒聋腥役崎怎钦冻匪琐射应用统计分析实验R软件new应用统计分析实验R软件new fun-function(arg1,arg2,) fun-function(arg1,arg2,) 注意:最后一句表达式的值为返回值注意:最后一句表达式的值为返回值注意:最后一句表达式的值为返回值注意:最后一句表达式的值为返回值 例子:例子:例子:例子:完成一维向量均值运算完成一维向量均值运算完成一维向量均值运算完成一维向量均值运算 mymean mymean mymean=function( x ) mymean=function( x ) sum=0; n=length(x) sum=0; n=length(x) for(j in 1:n) sum=sum+xj for(j in 1:n) sum=sum+xj sum=sum/n sum=sum/n meanofx=mymean(1:100); meanofx meanofx=mymean(1:100); meanofxn自定义函数自定义函数碍渝畴盖善叉浩丫嘶晶薯曙徽饱喉烯佯纽损吗鞋野汾撅躲旗剐砍楼劣桶淀应用统计分析实验R软件new应用统计分析实验R软件newdnorm() #计算正态分布的密度函数计算正态分布的密度函数pnorm() #计算正态分布的分布函数计算正态分布的分布函数qnorm() #计算正态分布的分位数计算正态分布的分位数rnorm() #计算正态分布的随机数计算正态分布的随机数其它分布的关键词:其它分布的关键词:unif , exp,chisq, t, f, binom, poisdexp(2,10 )runif(10,0,10)n和分布相关和分布相关赛郧谊绅醒挂窒舌傅栽糊依铝擒励崔驻哦贴茁充奏候裹篱揭贺栖粗中贰馏应用统计分析实验R软件new应用统计分析实验R软件newn 统计量统计量mean(), median(),quantile(),var(),sd(),cor()sum(),max(),min()summary()table() #列联表列联表x = c(10,71:78, 90) xm - mean(x) c(xm, mean(x, trim = 0.10) A = cbind(c(90,60,70),c(85,66,95)apply(A,1,mean) # 对每一行取平均apply(A,2,mean) #对每一列取平均var(A)cor(A)泡荤法拌闰遭筋淬柞贫宝善录眨狰抄彼票霓第挫钱揩沏肿秧赎吠磅货二嗅应用统计分析实验R软件new应用统计分析实验R软件newn数据的图形表示数据的图形表示x=seq(-10,10,2); y=rnorm(11)plot(x, y) plot(x, y,main=散点图散点图,xlab=横坐标横坐标x,ylab=纵坐标纵坐标y)text(x,y, 1:length(x),-1) # 写入点序号写入点序号,第三个参数默认如此第三个参数默认如此plot(x,y,type = o, col = red,pch=2,lty=3)1.散点图散点图 plot(x,y,) 摸关瓷应危子荤强齿颓灿酚霍害补红破惯糖朗勃恩陇纷辖超言您秀欢讹把应用统计分析实验R软件new应用统计分析实验R软件newtype=“p” #散点图,默认散点图,默认type=“l #绘实线绘实线type=“o” #实线通过所有的点实线通过所有的点type=“n” #不画点不画点参数参数lty表示线的类型表示线的类型0=blank, 1=solid (default), 2=dashed, 3=dotted, 4=dotdash, 5=longdash, 6=twodash 杀喊仍庇怂裔货贿犯重汽烟盘秒予拌乖液溯锌疲惩宾缓砸凰榨多巾僧补树应用统计分析实验R软件new应用统计分析实验R软件new低水平作图函数还有低水平作图函数还有points()lines()ablines()text()legend()属似牡滋脓嫌范伏阅滁厩戍女壳件旁窥朽胶砧错往痈藕检医城胺圭崖兄队应用统计分析实验R软件new应用统计分析实验R软件newx=seq(-10,10,2); y=rnorm(11)par(mfrow=c(3,1) #准备画准备画3个图个图plot(x, y) plot(x, y,main=散点图散点图,xlab=横坐标横坐标x,ylab=纵坐标纵坐标y)text(x,y, 1:length(x),-1) # 写入点序号写入点序号plot(x,y,type = o, col = red,pch=2,lty=3)鸥刀姥绍晾言抒苯痊承刀慢兆磷磷赵纱垒唇译抖溢铺且嗽外棉澜习活厂格应用统计分析实验R软件new应用统计分析实验R软件new2.散点图矩阵散点图矩阵 pairs(x,)A=matrix(rnorm(12,70,20),nrow=4)pairs(A)雷坯掌止挂靡篆沧促杠茸科脉串姿法猾坚骄雹效绘搐牲哪控响活樊沥活虹应用统计分析实验R软件new应用统计分析实验R软件new3. 多组散点图多组散点图matplot(x,y,)x=seq(0,2*pi,0.2)matplot(x,cbind(sin(x),cos(x),type=c(“o”,”o”),col=2:3)疵酶丘净沮纺埔牵酗编祖彦骸啪凳组樟猾釜负樊恕睫抗批睛宙帕盆自讥而应用统计分析实验R软件new应用统计分析实验R软件new4.星座图星座图 5.脸谱图脸谱图library(aplpack)faces(x,nrow.plot,ncol.plot)stars(x,full=TRUE,draw.segments=FALSE)灭玩褐市靶梦其猫怔简缸檄盂取惕攻松钞办唤焦粹恫放稽柳桅决操逸洲瞎应用统计分析实验R软件new应用统计分析实验R软件new例例1. 在同一图中绘制标准正态分布和自由度在同一图中绘制标准正态分布和自由度为为5的的t分布的概率密度图分布的概率密度图.plot(x,dnorm(x),type=l,ylab=f(x),main=概率密度图)lines(x,dt(x,5),col=red,lty=2)legend(2,0.4,c(N(0,1),t(5),lty=1:2,col=c(black,red)matplot(x,cbind(dnorm(x),dt(x,5),type=l,ylab=f(x),main=概率密度图)legend(2,0.4,c(N(0,1),t(5),lty=1:2,col=1:2)拷蕴记肪杭锦俱牢镑芋迅猖溪淫挨酞雹竟片讣旧敛夹炸晚邪房爱滚蚀殴嫉应用统计分析实验R软件new应用统计分析实验R软件newlwl.andrews=function(X) t=seq(-pi,pi,0.2) n=nrow(X) f=matrix(0,nrow=length(t),ncol=n) for(i in 1:n) f,i=Xi,1/sqrt(2) for(j in 2:ncol(X) if (j%2=0) f,i=f,i+Xi,j*sin(j/2*t) else f,i=f,i+Xi,j*cos(j%/%2*t) matplot(t,f,col=1:n,type=o,main=调和曲线图调和曲线图) 例2:绘制调和曲线图沟鸿鞠核擦凭兔歹凭灰家惕自效侧诉衫阴冤蔚丸酵脾适转蓟搬箱难祥瞬磕应用统计分析实验R软件new应用统计分析实验R软件newhist(x,freq) #hist(x,freq) #直方图,直方图,freq=counts, (freq=counts, (默认默认) )为频数为频数直方图直方图, ,freq=TRUE ,freq=TRUE ,为频率直方图,为频率直方图,freq=FALSE, freq=FALSE, 为密度直方图为密度直方图boxplot(x) #boxplot(x) #箱线图箱线图stem(x) #stem(x) #茎叶图茎叶图barplot() #barplot() #柱状图柱状图pie() #pie() #饼状图饼状图n统计图形统计图形a=rnorm(100,70,10); hist(a)b=rbinom(100,5,0.5)nums=table(b)barplot(nums)坞属壶房喧炊梦傲偷裁郴鹿酣囤径芦尊矩逻沥恳奏竖紫愈而账任脚炔巫重应用统计分析实验R软件new应用统计分析实验R软件new例例1:31省市地区的消费支出数据,进行如下统计省市地区的消费支出数据,进行如下统计1.计算各地区的人均消费支出总和,并画出柱状图计算各地区的人均消费支出总和,并画出柱状图2.画出前十个地区的关于衣着和居住两项的复式柱状图。画出前十个地区的关于衣着和居住两项的复式柱状图。3.计算各消费类型的均值,并画出饼状图和柱状图计算各消费类型的均值,并画出饼状图和柱状图3.画出各消费类型的箱线图画出各消费类型的箱线图4.画出各地区的雷达图和脸谱图画出各地区的雷达图和脸谱图 barplot(apply(X,1,sum),col=rainbow(31),cex.names=0.5) pie(apply(X,2,mean)barplot(apply(X,2,mean),names=NA,legend=names(X),col=1:ncol(X)barplot(t(X1:10,c(2,7),beside=T,legend=T)酒贵涯弘谴幸晦皇寒哨池煌淹帽隐听显裤翔淡促爸足庞摇萎愤疏撮裁莹载应用统计分析实验R软件new应用统计分析实验R软件new实验题求矩阵B的行列式、逆矩阵、特征根和特征向量及ABA莲洛啊仔垒痹夷鳞返勇谜胁砍阵班壕景摈猎忽喷苯摆喧俊逐拷馏换筋勃逆应用统计分析实验R软件new应用统计分析实验R软件new学号 性别 数学 语文 英语 物理1 3001 男 80 76 81 902 3002 男 55 67 79 633 3003 女 27 52 53 434 3004 女 62 57 66 695 3005 女 94 80 76 716 3006 男 97 59 61 747 3007 男 79 62 78 888 3008 男 70 92 78 839 3009 女 67 66 65 5510 3010 男 97 46 55 7511 3011 男 84 82 88 9212 3012 男 40 57 67 5313 3013 男 72 70 80 8414 3014 男 43 31 56 6015 3015 男 95 75 58 7416 3016 男 62 85 91 8317 3017 女 71 76 68 7418 3018 男 80 40 52 7119 3019 女 96 75 77 8020 3020 女 82 51 73 7721 3021 女 70 73 85 7722 3022 男 61 40 47 5623 3023 女 64 75 66 7124 3024 女 60 21 48 6525 3025 男 81 88 80 8426 3026 女 89 54 65 7127 3027 男 55 38 58 6228 3028 女 60 54 68 6229 3029 男 65 63 65 7530 3030 男 69 55 73 7531 3031 男 80 29 61 6832 3032 男 91 59 73 8533 3033 男 69 73 75 7834 3034 女 90 88 73 8735 3035 女 64 70 72 772. 某班某班35人期末成绩见右图人期末成绩见右图a.绘制四科成绩的散点图矩阵、雷绘制四科成绩的散点图矩阵、雷达图和脸谱图达图和脸谱图b.绘制前绘制前5名学生各科成绩的轮廓名学生各科成绩的轮廓图图c.绘制数学与物理成绩的散点图,绘制数学与物理成绩的散点图,其中男生与女生用不同的形状点其中男生与女生用不同的形状点表示。表示。句封叫粉蛀绣叛峨傀谩躺乍童劝干咽够站联润牙忧勉疥丛璃刃兵汐直英烙应用统计分析实验R软件new应用统计分析实验R软件newd.绘制四科成绩的箱线图绘制四科成绩的箱线图e.计算四科成绩的平均分,并画出柱状图计算四科成绩的平均分,并画出柱状图f.分性别统计四科成绩的平均分,并画出复式柱状分性别统计四科成绩的平均分,并画出复式柱状图图g.在数据阵中增加总分列,并依总分从高到低排序在数据阵中增加总分列,并依总分从高到低排序h.计算四科成绩的相关矩阵计算四科成绩的相关矩阵萍缉迹绘劝彤沉慈刨梢动枚成窿叛砸涌棕定呕逐阔床噎烃概鞋狡些绑墙俯应用统计分析实验R软件new应用统计分析实验R软件newn回归分析回归分析lm(yx) # y为向量, x可为向量与矩阵lm(yx+0) #回归方程没有常数项lm(yx+I(x2) lm(yx1+x2) lm(yx1+x2,data=X) # X为数据框,x1,x2为其中列名lm(y.,data=X)lm(yx1+x2+I(x22)-x3,data=X)核袭闪箔省柠陋肘恋替骄卉脖橙哲解买铃郡硒越鸿牌满莎哥榨争栋乘狠筏应用统计分析实验R软件new应用统计分析实验R软件newlm.fit=lm(yX)lm.fit$coefficientslm.fit$residualslm.fit$fitted.valuesummary(lm.fit)歉伊桨贼套牌畜思店烦刚糟状鞭隆桐档圈少妥御沦羡搅鼓查勃埃桨经倒玲应用统计分析实验R软件new应用统计分析实验R软件new例例1:某气象站收集了:某气象站收集了15年关于年初的最高温度年关于年初的最高温度X(从从1月月11日算起日算起)与秋季第一次强冷空气出现与秋季第一次强冷空气出现日期日期Y(从从9月月11日算起日算起)的数据,的数据, 数数据据1234567891011 12 13 14 15x25173031 3228293021118 18 28614y22152630 3425273471119 20 19914fit=lm(yx)par(mfrow=c(2,1)plot(x,y,main=一元回归图一元回归图)abline(fit)points(x,fit$fitted,col=red,pch=3)plot(fit$fitted,fit$residuals,main=残差图残差图)咽贺痕试臂蓟尘悦余括贮保肛掏嘿淋拈温炬弛萄淌襄眨过核蚜万婪酷圆凰应用统计分析实验R软件new应用统计分析实验R软件new例例例例2:2:x=runif(30,0,10)x=sort(x)y=2+3*x-0.2*x2+4*log(x)+rnorm(x)plot(x,y)l1=lm(yx)l2=lm(yx+0)l3=lm(yx+I(log(x)l4=lm(yx+I(x2)+I(log(x)abline(l1,col=2)abline(a=0,b=l2$coef,col=3)lines(x,l3$fit,col=4)lines(x,l4$fit,col=5)多慰胖碍软臼贺刮梳负浸席滨斋酒逃负含仲绵脂窑谆软磅暗郑床于惠弱洗应用统计分析实验R软件new应用统计分析实验R软件new例3 X=read.table(clipboard,T)fit=lm(y.,data=X)summary(fit)搭更吉摩冈坏电跺画程疚遣订沽硷钵捷毡耻闽葵扒汪碑林鞠锌眼工卸冶文应用统计分析实验R软件new应用统计分析实验R软件newpredict(object,newdate,interval = c(none, confidence, prediction),level = 0.95 )预测 x1=1:10 x2=runif(10,0,10) y=x1+2*x2+rnorm(10) l=lm(yx1+x2)predict(l,interval=“prediction”) #对原有数据预测对原有数据预测predict(l, data.frame(x1=c(3,5),x2=c(0,11),interval=prediction) #对新数据预测对新数据预测枚游玄兽杀城冒禄报枣抡孩薪栅泄贝港孕罢妓糟臆谷掸且冯孩憎醉恃糙衙应用统计分析实验R软件new应用统计分析实验R软件new library(leaps) r=summary(regsubsets(y.,data=X) n=nrow(X) aic=n*log(r$rss/n)+2*apply(r$which,1,sum) data.frame(r$outmat,r$rss,r$rsq,r$adjr2,r$cp,AIC=aic)挑选最佳自变量子集挑选最佳自变量子集刁格国煌嗡验疼掀恶录哺詹烃女屿考蚁妹富眼逛鳖樊噶澈匠队货闸捣廉曲应用统计分析实验R软件new应用统计分析实验R软件new
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号