资源预览内容
第1页 / 共52页
第2页 / 共52页
第3页 / 共52页
第4页 / 共52页
第5页 / 共52页
第6页 / 共52页
第7页 / 共52页
第8页 / 共52页
第9页 / 共52页
第10页 / 共52页
亲,该文档总共52页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
統計應用軟體Statistical Computations and Analysis,台大農藝系生物統計組 劉力瑜,課程大剛,授課對象: 大三以上及研究生 先修科目: 生物統計學(或統計學)與試驗設計學 課程首頁: http:/homepage.ntu.edu.tw/lyliu/compstat/index.html 評分標準: (Mostly weekly) homework (40%) Midterm (30%) Final project (30%),授課教師,劉力瑜 TEL: 02-33664792 E-mail: lyliuntu.edu.tw Office: 五號館 (生工系館) 二樓 202 室 Office Hour: Monday through Friday 12AM-1PM,相關規定,http:/homepage.ntu.edu.tw/lyliu/compstat/syllabus.html,上課前的準備,前往課程網頁下載當天上課之powerpoint檔 http:/homepage.ntu.edu.tw/lyliu/compstat/handout.html 隨時查閱課程網站以獲知最新公告訊息,學長姐的建議,“我未上過試驗設計, 這方面完全不懂, 學期後半段上起來很吃力” “很後悔沒有善加利用老師的 office hour” “統計與程式必需要多加練習才會熟練, 希望交作業的次數可以多一點”,課程內容,Installation / Introduction to R Installation / Introduction to LaTeX / cwTeX Writing Report with LaTeX Basic Statistical Concepts Probability and Distributions Descriptive Statistics and Graphics Hypotheses Testing Tests for Central Tendency Tests for Dispersion,Analysis of Variance Post Hoc Tests Variable Transformation Completely Randomized Design (CRD) Randomized Complete Block Design (RCBD) Latin Square Design (LSD) Cross-Over Design Balanced Incomplete Block Design (BIBD) Nonparametric Methods,Introduction to R,What is R?,R 並非專用統計軟體, 而是可用來執行統計分析的環境: 匯入適當的 package (套件) 應用套件內提供之 function (函式) Packages 由許多熱心人士編寫並免費提供學術使用。 You can make your own contribution in the future.,R的優缺點,優點: 免費軟體 完善的說明文件與討論區 漂亮的圖型介面 程式容易根據使用者需求做修改 缺點: 並無 user friendly 之使用者介面 需詳知函式名稱與程式編寫邏輯 說明文件與討論區使用英文,下載與安裝,Step 1: 下載R程式 http:/cran.csie.ntu.edu.tw/bin/windows/base/ 下載目前最新版本 R-2.4.1-win32.exe,執行,Step 2: 執行 R-2.4.1-win32.exe 安裝完成後, 執行桌面上的截徑:,中文版本,如何切換至英文版本?,Step 1: 在R的截徑上按滑鼠右鍵, 選取“內容” 。,如何切換至英文版本?,Step 2: “目標” 欄位最後(雙引號之後)加入: LANGUAGE=en 再按“確定” 。,離開 R,Method 1: File - Exit Method 2: q() Method 3: R 視窗上方,起始套件,當 R 啟動時, 有 7 個常用之 packages 會自動載入: base: 基本函式 (IO, 敘述統計, etc.) stats: 常用統計分析 (t.test, anova, etc.) methods: 定義 classes of objects utils: 基本程式編寫工具 graphics: 基本繪圖工具 grDevices:基本繪圖介面 datasets: 數據範例,使用介面 File 檔案,匯入已存在的檔案 (不開啟編輯視窗),編輯新程式或文件,編輯已存在的程式或文件,顯示已存在的檔案內容(無法編輯),變更工作環境 預設: C:/Program Files/R/R-2.4.1, Example: 0302_File_example.r,使用介面 Edit 編輯,清除工作視窗畫面,使用介面 Misc 其它,中斷正在執行的工作 (ESC),立即顯示結果與否,顯示工作環境下的物件; ls( ),移除工作環境下的物件; rm(list=ls(all=T) ),使用介面 - Packages,在目前工作環境中載入套件library(package),設定下載 package 的網站(Taipei, etc.),設定下載 package 的搜尋範圍 (cran, etc.),package 網路安裝,package 本機安裝(已下載),package 更新 (已安裝之package),使用介面 Windows / Help,Windows: 視窗排列方式 Help: Getting help from R ?command and help(command): 查詢特定命令 (名稱已知且package已載入) 的使用 apropos(“keyword ”): 已載入 package 中含有keyword字串的所有函數 Search help: 查詢未知名稱的命令(package未載入但已安裝) help.search(“keyword ”) search.r-project.org: 廣義搜尋,R Console,R 的提示符號: 與 +,“” 為提示符號; 當提示符號出現時表示R正在待命中, 可以隨時鍵入下一個命令。當提示符號為“+”時, 表示程式正在執行中,或在等待未完成的指令。例如: (1.36 + 0.7 + ) 按“ESC”可強制退出未完成的工作。 可利用鍵盤上下鍵重複輸入指令或做小幅度修改,利用R進行簡單計算, 2 + 3 1 5 sqrt(3/4)/(1/3-2/pi2) 1 6.626513 exp(3.72) 1 41.26439 sin(pi); log(10); log2(10); log10(10),指定變數名稱,名稱 = 物件 或 名稱 物件 可由英文字母、數字、英文句點(.)組成。 英文大小寫有所區別 (ab 與 Ab 可分別代表不同變數) 。 變數名稱須起始於英文字母。 有些英文單字具有特殊意義,不能當做變數名稱: return, break, if, TRUE, FALSE, (T, F).,R 物件 (object),單一變數:,Some Simple Examples,單一數值或字元: x1 = 3.0 x2 = “NTU” x3 = TRUE 計算結果: y1 = exp(3.72) y2 = y1*3 其它: out = lm(yx+z) y = NA,R 物件 (object),複合物件: 由數個單一變數組成 向量: c() 所有變數需為同類型或NA 若vector內的變數為數字, 亦可藉由“:”,“seq”等產生 c(5,7,3,9,NA) c(1:10) = 1, 2, 3, 4, , 10 seq(0.1,1,0.1) = 0.1, 0.2, 0.3, , 1.0 矩陣: matrix(x,r,c,) 所有變數需為同類型或NA matrix(NA,3,5) = 3x5矩陣, 每一元素為NA matrix(1:12,3,4) = 3x4矩陣, 元素為?,R 物件 (object),其它複合物件: list data.frame high dimensional array,R 函式 (function),R是由 “變數” 與 “函式” 組成。前面幾張 slide 已用的 function: c, lm, seq, matrix, exp, etc. 基本語法: funcname(參數) 查詢function的使用方法: help or ? Example: ?lm # help(lm),Help Menu,DescriptionUsage Arguments DetailsValue References See AlsoExamples,apropos,apropos(“matrix”),只查閱函式的參數時, args(“matrix”) 參數分為必要與非必要兩種 順序不對調時, 參數名稱可不給定: matrix(x, 3, 2) 順序對調時參數命稱必須指定: matrix(nrow=3, ncol=2, data=x),R 函式 (function),函數也可由使用者自行定義 my.add my.add(1:3) 1 4 5 6 本課程將會陸續介紹生物統計學與試驗設計學常用的函數。,常用統計函式,中央趨勢: mean(x)# 樣本均值 median(x)# 樣本中位數 quantile(x,p)# 樣本 100p% 百分位數 變異程度: range(x)# 最小值與最大值 var(x)# 樣本變方 sd(x)# 樣本標準差 兩變數的相關程度: cov(x,y)# 樣本共變方 cor(x,y)# 樣本相關係數,常用統計函式,常用function列表: “Statistical Computing and Graphics Course Notes” by Frank E. Harrell, p 32-39. http:/cran.us.r-project.org/doc/contrib/Harrell-statcomp-notes.pdf,資料輸入: c,輸入少量資料最簡單的方法: c function. Example: 西元 1861 1870 年間重大的科學發現或發明數: 3 0 2 0 3 2 3 6 1 2 nod = c(3, 0, 2, 0, 3, 2, 3, 6, 1, 2) nod 1 3 0 2 0 3 2 3 6 1 2,資料輸入: c,前述指令指定一組數據給名為 nod 之變數; 以 “=” 或 “-” 進行指定的工作。 指定變數 nod 後, 其數值不會自動出現在螢幕上; 在提示符號後輸入變數名稱, 才會顯示其數值。 螢幕顯示 1 3 0 2 0 3 2 3 6 1 2 表示此變數為一向量(vector)。,Data is a vector!,資料是以“向量”或“矩陣”型態組成, 元素可用其相對位置做為指標: length(x) # how many elements x2 # the 2nd element x1:5 # the first 5 elements xc(1,2,5) # specific elements xx3 # all greater than 3 xx 2 which(x=5) # which indices are equal to 5 c(x,48,49,51,50,49) # append values to x,Example, nod2 1 0 nod-4 1 3 0 2 3 2 3 6 1 2 nodc(1,2,5) 1 3 0 3 nodnod 1 1 3 2 3 2 3 6 2 which(nod 1) 1 1 3 5 6 7 8 10,Matrix
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号