R語言基礎(chǔ)與數(shù)據(jù)科學(xué)應(yīng)用
定 價(jià):49.8 元
- 作者:沈剛
- 出版時(shí)間:2018/6/1
- ISBN:9787115483027
- 出 版 社:人民郵電出版社
- 中圖法分類:TP312
- 頁碼:0
- 紙張:
- 版次:01
- 開本:16開
本書是為初學(xué)者學(xué)習(xí)R語言基礎(chǔ)以及在數(shù)據(jù)科學(xué)中的應(yīng)用而編寫的。全書內(nèi)容包括三個(gè)部分,分別介紹了R語言的編程基礎(chǔ)知識,數(shù)據(jù)處理、可視化和統(tǒng)計(jì)分析的實(shí)用技術(shù),以及在機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)中的具體應(yīng)用。讀者可以通過本書了解和體驗(yàn)R語言的風(fēng)格特點(diǎn)和強(qiáng)大功能。本書中所有程序均在R 3.4.3環(huán)境下調(diào)試通過。
1.本書為教育部高等學(xué)校計(jì)算機(jī)類專業(yè)教學(xué)指導(dǎo)委員會-華為ICT產(chǎn)學(xué)結(jié)合項(xiàng)目:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)系列規(guī)劃教材
2.通過本書快速掌握各類型數(shù)據(jù)處理方法,洞察數(shù)據(jù)類型背后的分析思維
3.實(shí)踐R數(shù)據(jù)科學(xué)實(shí)戰(zhàn)案例
沈剛,博士,教授。1990年及1992年畢業(yè)于清華大學(xué)自動化系生產(chǎn)過程自動化專業(yè)和系統(tǒng)工程專業(yè),分別獲學(xué)士學(xué)位和碩士學(xué)位。后留校任教,曾參與多項(xiàng)CIMS課題研究。1995年到1999年在加拿大McGill大學(xué)Electrical and Compter Engineering系學(xué)習(xí),獲博士學(xué)位。1999年9月到12月,在多倫多大學(xué)Electrical Engineering系作訪問研究。1999年起,在加拿大Kerr Vayne Systems及美國Motorola公司工作,從事自動化系統(tǒng)和移動通訊系統(tǒng)的研究及開發(fā)。2003年起,在華中科技大學(xué)軟件學(xué)院開設(shè)《計(jì)算機(jī)網(wǎng)絡(luò)》《嵌入式系統(tǒng)》《軟件能力成熟度模型》等雙語課程。在IEEE Transactions on Automatic Control等期刊和IEEE Conference on Decision and Control等會議上發(fā)表多篇論文,F(xiàn)主要研究興趣包括實(shí)時(shí)系統(tǒng),無線通訊系統(tǒng),數(shù)字通信網(wǎng)絡(luò)和軟件工程等方向。
第 1章 引言 1
1.1 R的起源與發(fā)展 2
1.1.1 R的產(chǎn)生與演化 2
1.1.2 R的特點(diǎn) 3
1.2 安裝與運(yùn)行R系統(tǒng) 6
1.2.1 R的獲取與安裝 7
1.2.2 運(yùn)行R 7
1.3 安裝與使用包 10
1.3.1 什么是包 10
1.3.2 安裝包 12
1.3.3 載入、使用、卸載包 12
1.3.4 包的命名空間 13
1.4 工作空間管理 14
1.5 R語言的集成開發(fā)環(huán)境
RStudio 16
1.5.1 什么是集成開發(fā)環(huán)境 16
1.5.2 RStudio的使用方法 16
1.6 使用幫助系統(tǒng) 18
1.7 R語言與數(shù)據(jù)科學(xué) 19
1.7.1 R與大數(shù)據(jù)平臺 19
1.7.2 R在數(shù)據(jù)科學(xué)中的應(yīng)用 22
習(xí)題 23
第 2章 數(shù)據(jù)與運(yùn)算 25
2.1 基礎(chǔ)知識 26
2.1.1 向量 26
2.1.2 對象 27
2.1.3 函數(shù) 29
2.1.4 標(biāo)識符與保留字 30
2.2 數(shù)據(jù)類型與數(shù)據(jù)表示 31
2.2.1 基本數(shù)據(jù)類型 31
2.2.2 變量 34
2.2.3 常量 34
2.2.4 特殊值 35
2.3 基本運(yùn)算 36
2.3.1 運(yùn)算符 36
2.3.2 算術(shù)運(yùn)算 37
2.3.3 關(guān)系運(yùn)算 37
2.3.4 邏輯運(yùn)算 38
2.3.5 賦值運(yùn)算 39
2.4 數(shù)據(jù)類型轉(zhuǎn)換與R中常見的數(shù)據(jù)
結(jié)構(gòu) 40
2.4.1 數(shù)據(jù)類型轉(zhuǎn)換 41
2.4.2 常見的數(shù)據(jù)結(jié)構(gòu) 43
習(xí)題 45
第3章 程序設(shè)計(jì)基礎(chǔ) 47
3.1 控制流 48
3.1.1 順序結(jié)構(gòu) 48
3.1.2 分支結(jié)構(gòu) 49
3.1.3 循環(huán)結(jié)構(gòu) 51
3.1.4 選擇結(jié)構(gòu) 53
3.2 函數(shù)設(shè)計(jì) 54
3.2.1 聲明、定義與調(diào)用 54
3.2.2 返回值 56
3.2.3 函數(shù)中的輸入/輸出 57
3.2.4 環(huán)境與范圍 59
3.2.5 遞歸函數(shù) 62
3.3 編程規(guī)范與性能優(yōu)化 65
3.3.1 使用腳本文件 65
3.3.2 編程規(guī)范 66
3.3.3 性能優(yōu)化 67
習(xí)題 68
第4章 類與對象 70
4.1 面向?qū)ο蟪绦蛟O(shè)計(jì)方法 71
4.1.1 結(jié)構(gòu)化程序設(shè)計(jì)方法回顧 71
4.1.2 對象與類的概念 71
4.1.3 面向?qū)ο蟪绦蛟O(shè)計(jì)的特點(diǎn) 72
4.1.4 R中類的體系 73
4.2 S3類 74
4.2.1 S3類的定義 74
4.2.2 創(chuàng)建S3類對象 74
4.2.3 S3類的泛型函數(shù) 76
4.2.4 定義S3類的方法 77
4.2.5 編寫S3類的泛型函數(shù) 78
4.3 S4類 79
4.3.1 S4類的定義 79
4.3.2 創(chuàng)建S4類對象 81
4.3.3 訪問插槽 82
4.3.4 S4類的泛型函數(shù) 83
4.3.5 定義S4類的方法 84
4.4 引用類 84
4.4.1 定義引用類 84
4.4.2 創(chuàng)建引用類對象 85
4.4.3 訪問與修改引用類對象的域 86
4.4.4 引用類的方法 88
4.5 繼承 90
4.5.1 S3類中的繼承 90
4.5.2 S4類中的繼承 91
4.5.3 引用類中的繼承 92
4.5.4 多重繼承 93
習(xí)題 94
第5章 數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)處理 96
5.1 向量 97
5.1.1 創(chuàng)建向量 97
5.1.2 使用索引訪問向量元素 98
5.1.3 循環(huán)補(bǔ)齊 99
5.1.4 向量的比較 100
5.1.5 按條件提取元素 101
5.2 矩陣與數(shù)組 101
5.2.1 創(chuàng)建矩陣 102
5.2.2 線性代數(shù)運(yùn)算 103
5.2.3 使用矩陣索引 105
5.2.4 apply函數(shù)族 106
5.2.5 多維數(shù)組 107
5.3 數(shù)據(jù)框 108
5.3.1 創(chuàng)建數(shù)據(jù)框 108
5.3.2 訪問數(shù)據(jù)框中的元素 109
5.3.3 使用SQL語句查詢數(shù)據(jù)框 110
5.4 因子 111
5.5 列表 112
5.6 數(shù)據(jù)導(dǎo)入與導(dǎo)出 113
5.6.1 數(shù)據(jù)文件的讀寫 113
5.6.2 rio包 116
5.6.3 數(shù)據(jù)編輯器 118
5.7 數(shù)據(jù)清洗 118
5.7.1 數(shù)據(jù)排序 119
5.7.2 數(shù)據(jù)清洗的一般方法 120
5.7.3 mice包 122
習(xí)題 127
第6章 繪圖與數(shù)據(jù)可視化 128
6.1 基本圖形與繪圖函數(shù) 129
6.1.1 基礎(chǔ)圖形的創(chuàng)建 129
6.1.2 新增繪圖窗口 131
6.1.3 導(dǎo)出圖形 131
6.2 調(diào)整繪圖參數(shù) 133
6.2.1 自定義特征 133
6.2.2 調(diào)整符號與線條 134
6.2.3 調(diào)整顏色 135
6.2.4 調(diào)整標(biāo)簽與標(biāo)題文本 137
6.3 其他自定義元素 140
6.3.1 坐標(biāo)軸 140
6.3.2 次要刻度線 140
6.3.3 網(wǎng)格線 141
6.3.4 疊加繪圖 143
6.3.5 圖例 144
6.3.6 標(biāo)注 145
6.4 描述性統(tǒng)計(jì)圖 146
6.4.1 柱狀圖 146
6.4.2 餅圖 149
6.4.3 直方圖 150
6.4.4 箱形圖 151
6.4.5 三維繪圖 152
6.5 動態(tài)圖形 155
6.5.1 保存為GIF格式 155
6.5.2 gganimate包 157
習(xí)題 160
第7章 統(tǒng)計(jì)與回歸分析 162
7.1 定性數(shù)據(jù)與定量數(shù)據(jù) 163
7.1.1 定性數(shù)據(jù) 163
7.1.2 定量數(shù)據(jù) 166
7.2 數(shù)據(jù)的數(shù)值度量 173
7.2.1 均值 173
7.2.2 中位值 173
7.2.3 四分位數(shù) 173
7.2.4 百分位數(shù) 174
7.2.5 變化范圍 174
7.2.6 四分位距 174
7.2.7 方差與標(biāo)準(zhǔn)差 175
7.2.8 協(xié)方差 175
7.2.9 相關(guān)系數(shù) 176
7.3 概率分布與假設(shè)檢驗(yàn) 176
7.3.1 二項(xiàng)式分布 177
7.3.2 泊松分布 178
7.3.3 連續(xù)均勻分布 178
7.3.4 指數(shù)分布 179
7.3.5 正態(tài)分布 180
7.3.6 ? 2分布 181
7.3.7 學(xué)生t分布 182
7.3.8 統(tǒng)計(jì)假設(shè)檢驗(yàn) 182
7.4 回歸分析 187
7.4.1 簡單線性回歸 187
7.4.2 多元線性回歸 192
7.4.3 邏輯回歸 196
習(xí)題 199
第8章 統(tǒng)計(jì)機(jī)器學(xué)習(xí) 201
8.1 特征空間與距離 203
8.1.1 距離的定義 203
8.1.2 KNN分類 207
8.2 聚類算法 209
8.2.1 k均值聚類 209
8.2.2 層次聚類 211
8.2.3 密度聚類 216
8.3 分類算法 219
8.3.1 決策樹 219
8.3.2 樸素貝葉斯方法 225
8.3.3 支持向量機(jī) 229
8.4 集成學(xué)習(xí) 233
8.4.1 基本方法 233
8.4.2 隨機(jī)森林 234
8.4.3 堆疊式集成學(xué)習(xí) 238
習(xí)題 245
第9章 神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí) 247
9.1 基本原理 249
9.1.1 神經(jīng)元 249
9.1.2 多層感知器模型 250
9.1.3 反向傳播算法 251
9.2 感知器模型 252
9.2.1 neuralnet包 252
9.2.2 非線性回歸 254
9.2.3 分類 256
9.3 深度神經(jīng)網(wǎng)絡(luò) 261
9.3.1 深度神經(jīng)網(wǎng)絡(luò)的形式 261
9.3.2 MXNetR包 264
9.3.3 keras包 272
習(xí)題 280
附錄1 常用函數(shù)速查表 281
附錄2 《R語言基礎(chǔ)與數(shù)據(jù)科學(xué)
應(yīng)用》配套實(shí)驗(yàn)課程方案簡介 285
參考文獻(xiàn) 286