R統(tǒng)計軟件是目前應(yīng)用* 廣泛的統(tǒng)計軟件之一,已廣泛應(yīng)用于醫(yī)學(xué)、財經(jīng)和社會科學(xué)等領(lǐng)域中進行數(shù)據(jù)管理和數(shù)據(jù)分析處理。本書以Windows操作系統(tǒng)下的R軟件為基礎(chǔ),以實踐中常用的統(tǒng)計分析方法為基本內(nèi)容,介紹了R語言的編寫以及結(jié)果解釋。本書重點介紹了各種多元統(tǒng)計分析方法的基本原理及其應(yīng)用,包括方差分析、多元線性回歸、Logistic回歸分析、生存分析、主成分分析、因子分析、聚類分析、判別分析以及典型相關(guān)分析等。每一章詳細討論了統(tǒng)計分析方法的基本原理和分析過程,介紹了R語言的使用方法及應(yīng)用實例說明、結(jié)果解釋及結(jié)論分析等。
由R知名專家執(zhí)筆。作者深入理解了R的內(nèi)涵和精髓,結(jié)合自己豐富的培訓(xùn)經(jīng)驗,以及大量的一線工程實踐經(jīng)驗,潛心編寫而成。
軟件版本采用當(dāng)前新的R版本,在知識點講解過程中穿插了新功能的講述與應(yīng)用。
知識全面、系統(tǒng),科學(xué)安排內(nèi)容的層次架構(gòu),由淺入深,循序漸進,適合讀者的學(xué)習(xí)規(guī)律。
理論與實踐應(yīng)用緊密結(jié)合。基礎(chǔ)理論知識穿插在知識點的講述中,言簡意賅、目標(biāo)明確,其目的是使讀者知其然,亦知其所以然,達到學(xué)以致用的目的。
知識點 針對每個知識點的小實例 綜合實例的講述方式,可以使讀者快速地學(xué)習(xí)并掌握R軟件操作及應(yīng)用該知識點解決實踐中的問題。綜合實例部分,深入細致地剖析數(shù)據(jù)統(tǒng)計分析應(yīng)用的流程、細節(jié)、難點、技巧,起到融會貫通的作用。
為了讓本書內(nèi)容盡可能接近各個領(lǐng)域的實際情況,作者從心理學(xué)、社會學(xué)、醫(yī)學(xué)、生物、商業(yè)和工程等諸多領(lǐng)域選取了一些例子。所有的這些例子都不需要讀者具備這些領(lǐng)域的專業(yè)知識。
本書附帶所有實例操作的數(shù)據(jù)和R程序。
本書由汪海波、羅莉、汪海玲編著,參與編寫的還有郝旭寧、李建鵬、趙偉茗、劉欽、于志偉、張永崗、周世賓、姚志偉、曹文平、張應(yīng)遷、張洪才、邱洪鋼、張青蓮、陸紹強、李成。
汪海波,SAS知名專家,暢銷書《SAS統(tǒng)計分析與應(yīng)用從入門到精通》作者。作者深入理解了SAS內(nèi)涵、精髓,結(jié)合自己豐富的工作經(jīng)驗,并結(jié)合大量的一線工程實踐經(jīng)驗,潛心編寫而成。
* 一篇 R基礎(chǔ)與入門篇
* 1章 R入門2
1.1 R簡介2
1.1.1 R特點2
1.1.2 R支持資料3
1.2 R的獲取、安裝和啟動4
1.2.1 R的獲取4
1.2.2 R的安裝5
1.2.3 R的啟動7
1.3 R菜單操作7
1.4 工作空間10
1.5 程序包11
1.5.1 什么是程序包11
1.5.2 安裝程序包11
1.6 R使用以及圖形界面12
1.7 本章小結(jié)13
* 2章 R編程入門14
2.1 R語言14
2.1.1 數(shù)據(jù)集的概念14
2.1.2 R運算符21
2.2 R常用函數(shù)及其應(yīng)用23
2.2.1 數(shù)學(xué)函數(shù)24
2.2.2 樣本統(tǒng)計函數(shù)26
2.2.3 概率函數(shù)27
2.2.4 字符處理函數(shù)28
2.2.5 其他實用函數(shù)30
2.3 數(shù)據(jù)的輸入31
2.3.1 使用鍵盤輸入數(shù)據(jù)31
2.3.2 數(shù)據(jù)集的導(dǎo)入32
2.4 本章小結(jié)34
第3章 基本數(shù)據(jù)管理35
3.1 創(chuàng)建新變量36
3.2 向量運算37
3.2.1 添加或刪除向量元素37
3.2.2 向量運算和邏輯運算37
3.2.3 用∶運算符創(chuàng)建向量37
3.2.4 使用seq()函數(shù)創(chuàng)建向量38
3.3 處理數(shù)據(jù)對象的實用函數(shù)38
3.4 變量的重編碼39
3.5 變量的重命名40
3.6 缺失值41
3.7 日期值42
3.8 類型轉(zhuǎn)換44
3.9 數(shù)據(jù)排序45
3.10 數(shù)據(jù)集的合并45
3.11 數(shù)據(jù)集取子集46
3.11.1 選入觀測46
3.11.2 選入變量47
3.11.3 剔除變量48
3.11.4 subset()函數(shù)49
3.12 本章小結(jié)49
第4章 樣本量和檢驗效能估計50
4.1 樣本量估算以及R程序包50
4.1.1 樣本量影響因素50
4.1.2 檢驗效能分析pwr包52
4.2 t檢驗53
4.2.1 單樣本與已知總體檢驗時樣本
量的估計及R程序53
4.2.2 兩總體均數(shù)比較樣本量的估計
及R程序54
4.2.3 配對設(shè)計兩樣本均數(shù)比較樣本
量的估計及R程序55
4.3 方差分析56
4.4 相關(guān)分析57
4.5 線性模型58
4.6 分類資料的樣本量估計59
4.6.1 單樣本與已知總體檢驗時樣
本量的估計及R程序59
4.6.2 兩樣本率比較樣本量的估計及
R程序60
4.6.3 配對設(shè)計總體率比較樣本量的
估計及R程序61
4.7 本章小結(jié)62
第5章 高 級數(shù)據(jù)管理63
5.1 控制語句63
5.1.1 重復(fù)和循環(huán)63
5.1.2 條件執(zhí)行65
5.2 數(shù)據(jù)處理綜合實例67
5.3 轉(zhuǎn)置與整合70
5.3.1 轉(zhuǎn)置70
5.3.2 整合數(shù)據(jù)71
5.4 本章小結(jié)72
* 二篇 統(tǒng)計方法與R分析實例
第6章 定量資料的統(tǒng)計描述74
6.1 統(tǒng)計描述基礎(chǔ)理論知識74
6.1.1 集中趨勢描述75
6.1.2 離散趨勢描述77
6.1.3 正態(tài)分布79
6.2 統(tǒng)計描述分析實例81
6.2.1 summary()函數(shù)分析實例81
6.2.2 sapply()函數(shù)分析實例83
6.2.3 describe()函數(shù)分析實例85
6.2.4 stat.desc()函數(shù)分析實例89
6.2.5 分組計算描述性統(tǒng)計量91
6.2.6 對數(shù)正態(tài)分布資料的統(tǒng)計
描述94
6.3 本章小結(jié)95
第7章 t檢驗96
7.1 單樣本t檢驗96
7.1.1 單樣本t檢驗的基礎(chǔ)理論96
7.1.2 單樣本t檢驗分析實例97
7.1.3 無原始數(shù)據(jù)的單樣本t檢驗R
程序98
7.2 配對設(shè)計資料的t檢驗98
7.2.1 配對設(shè)計資料t檢驗的基礎(chǔ)
理論98
7.2.2 配對t檢驗實例100
7.2.3 無原始數(shù)據(jù)的配對設(shè)計的
t檢驗分析實例102
7.3 兩獨立樣本的t檢驗103
7.3.1 兩獨立樣本t檢驗的基礎(chǔ)
理論103
7.3.2 獨立樣本t檢驗分析
實例105
7.3.3 無原始數(shù)據(jù)的兩獨立樣本
t檢驗分析實例107
7.4 本章小結(jié)107
第8章 方差分析108
8.1 方差分析及ANOVA模型擬合概述108
8.1.1 方差分析的基本思想108
8.1.2 方差分析基本術(shù)語110
8.1.3 ANOVA模型擬合111
8.2 完全隨機設(shè)計資料的方差分析112
8.2.1 單因子方差分析介紹113
8.2.2 單因子方差分析的R程序
實例113
8.3 隨機區(qū)組設(shè)計資料的方差分析118
8.3.1 隨機區(qū)組方差分析介紹119
8.3.2 隨機區(qū)組方差分析的R程序
實例121
8.4 拉丁方設(shè)計資料的方差分析126
8.4.1 拉丁方方法介紹126
8.4.2 拉丁方分析的R程序?qū)嵗?28
8.5 析因設(shè)計資料的方差分析131
8.5.1 析因設(shè)計方法介紹131
8.5.2 析因方差分析的R程序?qū)嵗?34
8.6 正交試驗設(shè)計資料的方差分析136
8.6.1 正交試驗設(shè)計方法介紹136
8.6.2 正交試驗設(shè)計資料分析的R
程序?qū)嵗?38
8.7 重復(fù)測量資料的方差分析139
8.7.1 重復(fù)測量設(shè)計方法介紹140
8.7.2 重復(fù)測量資料分析的R
程序?qū)嵗?41
8.8 協(xié)方差分析144
8.8.1 協(xié)方差分析方法介紹144
8.8.2 協(xié)方差分析的R程序?qū)嵗?45
8.9 本章小結(jié)148
第9章 直線回歸與相關(guān)149
9.1 直線相關(guān)分析149
9.1.1 直線相關(guān)分析介紹149
9.1.2 直線相關(guān)分析的R實例151
9.2 直線回歸分析154
9.2.1 直線回歸分析介紹155
9.2.2 直線回歸分析的R程序?qū)嵗?57
9.3 本章小結(jié)162
* 10章 多元線性回歸與相關(guān)163
10.1 多元線性回歸與相關(guān)的基礎(chǔ)理論163
10.1.1 多元線性回歸163
10.1.2 復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)176
10.2 分析實例178
10.2.1 多元線性回歸方程的建立178
10.2.2 復(fù)相關(guān)系數(shù)與偏相關(guān)系數(shù)的
R程序?qū)嵗?83
10.3 本章小結(jié)185
* 11章 Logistic回歸分析186
11.1 非條件Logistic回歸186
11.1.1 非條件Logistic回歸介紹187
11.1.2 非條件Logistic回歸模型的
建立和檢驗188
11.1.3 非條件Logistic回歸的R
程序190
11.2 條件Logistic回歸205
11.2.1 條件Logistic回歸介紹205
11.2.2 條件Logistic回歸的R
程序206
11.3 本章小結(jié)207
* 12章 相對數(shù)208
12.1 相對數(shù)簡介208
12.1.1 率的標(biāo)準化210
12.1.2 率的假設(shè)檢驗212
12.2 R分析實例214
12.2.1 率的標(biāo)準化R程序214
12.2.2 率的Z(U)檢驗的R
程序215
12.3 本章小結(jié)216
* 13章 行列表分析217
13.1 四格表資料217
13.1.1 四格表卡方檢驗介紹218
13.1.2 四格表卡方檢驗的R
程序220
13.2 配對計數(shù)資料的卡方檢驗224
13.2.1 四格表配對卡方檢驗介紹224
13.2.2 四格表配對卡方檢驗的R
程序225
13.3 列變量為順序變量的行均分檢驗226
13.3.1 行均分檢驗介紹227
13.3.2 行均分檢驗的R程序227
13.4 行列均為順序變量的相關(guān)檢驗230
13.4.1 行列均為順序變量的相關(guān)
檢驗介紹230
13.4.2 行列均為順序變量的相關(guān)
檢驗的R程序231
13.5 分層行列表的分析235
13.5.1 分層行列表的分析簡介235
13.5.2 分層行列表的分析的R
程序236
13.6 趨勢卡方檢驗239
13.6.1 趨勢卡方檢驗簡介239
13.6.2 趨勢卡方檢驗的R程序239
13.7 卡方分割與卡方合并241
13.7.1 卡方的分割與合并簡介241
13.7.2 卡方分割與卡方合并分析
實例241
13.8 本章小結(jié)243
* 14章 非參數(shù)統(tǒng)計244
14.1 單樣本資料與已知總體參數(shù)的非
參數(shù)檢驗245
14.1.1 單組資料的符號及符號秩和
檢驗245
14.1.2 單組資料的非參數(shù)檢驗R
程序247
14.2 配對設(shè)計資料的非參數(shù)檢驗248
14.2.1 配對設(shè)計資料的符號及符號
秩和檢驗248
14.2.2 配對設(shè)計資料的非參數(shù)檢驗
R程序249
14.3 兩組定量資料的非參數(shù)檢驗250
14.3.1 兩組定量資料的非參數(shù)檢驗
方法概述251
14.3.2 兩組定量資料非參數(shù)檢驗的
R程序252
14.4 多組定量資料的非參數(shù)檢驗253
14.4.1 多組定量資料的非參數(shù)檢驗
方法概述253
14.4.2 多組定量資料非參數(shù)檢驗的
R程序255
14.5 等級分組資料的非參數(shù)檢驗260
14.5.1 等級分組資料的非參數(shù)檢驗
方法概述260
14.5.2 等級分組資料非參數(shù)檢驗的
R程序261
14.6 隨機區(qū)組資料的非參數(shù)檢驗264
14.6.1 隨機區(qū)組資料的非參數(shù)檢驗
方法概述264
14.6.2 隨機區(qū)組資料非參數(shù)檢驗的
R程序265
14.7 等級相關(guān)(秩相關(guān))266
14.7.1 秩相關(guān)概述266
14.7.2 spearman秩相關(guān)的R程序267
14.8 本章小結(jié)268
* 15章 生存分析269
15.1 生存分析簡介269
15.1.1 生存數(shù)據(jù)269
15.1.2 生存時間函數(shù)270
15.1.3 均數(shù)、中位數(shù)和半數(shù)
生存期271
15.1.4 生存分析的基本方法271
15.2 生存曲線272
15.2.1 壽命表法及R分析實例273
15.2.2 乘積極限法(Kaplan-Meier)及
R分析實例278
15.2.3 Cox回歸及R分析實例280
15.3 本章小結(jié)285
* 16章 主成分分析286
16.1 主成分分析簡介287
16.1.1 主成分分析的數(shù)學(xué)模型287
16.1.2 主成分分析的方法步驟288
16.1.3 主成分分析的應(yīng)用290
16.2 R中的主成分分析實例291
16.3 本章小結(jié)307
* 17章 因子分析308
17.1 因子分析簡介308
17.2 主成分分析與因子分析比較317
17.3 因子分析及R實例318
17.4 本章小結(jié)337
* 18章 聚類分析338
18.1 聚類分析簡介338
18.2 聚類分析及R實例344
18.2.1 varclus ()函數(shù)344
18.2.2 kmean()函數(shù)348
18.2.3 hclust()函數(shù)實例352
18.3 本章小結(jié)355
* 19章 判別分析356
19.1 判別分析簡介357
19.2 判別分析及R實例362
19.3 本章小結(jié)386
* 20章 典型相關(guān)分析388
20.1 典型相關(guān)簡介388
20.1.1 典型相關(guān)分析的理論架構(gòu)及
基本假設(shè)390
20.1.2 冗余分析391
20.1.3 典型相關(guān)系數(shù)的假設(shè)檢驗392
20.2 cancor()函數(shù)實例392
20.3 本章小結(jié)400
* 21章 診斷試驗的ROC分析401
21.1 診斷試驗簡介401
21.1.1 診斷試驗介紹401
21.1.2 診斷試驗評價指標(biāo)402
21.1.3 ROC分析資料收集與整理404
21.1.4 ROC曲線構(gòu)建405
21.2 ROC分析及R分析實例406
21.3 本章小結(jié)423
* 22章 統(tǒng)計圖425
22.1 條形圖425
22.2 餅圖429
22.3 散點圖431
22.4 折線圖433
22.5 箱線圖434
22.6 直方圖437
22.7 核密度圖442
22.8 點圖442
22.9 本章小結(jié)444
參考文獻 445