R語言數(shù)據(jù)分析與數(shù)據(jù)挖掘應(yīng)用:微課視頻版
定 價(jià):45 元
- 作者:李慶華,周青編著
- 出版時(shí)間:2021/8/1
- ISBN:9787302584087
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP312R
- 頁碼:205頁
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書講述的是R語言在數(shù)據(jù)分析與數(shù)據(jù)挖掘方面的應(yīng)用,內(nèi)容編排結(jié)構(gòu)合理,由淺到深,循序漸進(jìn)地引導(dǎo)讀者快速入門,并逐步提高使用R語言編程實(shí)現(xiàn)數(shù)據(jù)分析和文本數(shù)據(jù)挖掘的能力。本書的目標(biāo)讀者是從事數(shù)據(jù)分析與挖掘領(lǐng)域的學(xué)生、老師、科研工作者,從事不同行業(yè)的數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師等。本書最大的優(yōu)點(diǎn)在于其簡(jiǎn)單明了,通俗易懂,適合新手快速入門,每一個(gè)例題都有現(xiàn)成的數(shù)據(jù)和源代碼。旨在引導(dǎo)讀者學(xué)會(huì)怎么從具體問題入手開始分析,使用R語言編寫可以編譯實(shí)現(xiàn)的代碼,感受R語言的魅力,讓數(shù)據(jù)產(chǎn)生價(jià)值。這種學(xué)習(xí)和實(shí)踐相結(jié)合的方式非常適合????
本書基于學(xué)習(xí)成果導(dǎo)向(outcome□-□ased education)的思想進(jìn)行編寫,使讀者不僅可以理解整個(gè)例題,還可以直接編譯本書提供的所有源代碼,確保讀者達(dá)到編程想要實(shí)現(xiàn)的預(yù)期效果,并且設(shè)計(jì)了適當(dāng)?shù)木毩?xí)來評(píng)估讀者是否達(dá)到了預(yù)期學(xué)習(xí)目標(biāo)。
R是為數(shù)據(jù)操作及統(tǒng)計(jì)計(jì)算提供語言及環(huán)境的軟件包,還可以用來實(shí)現(xiàn)數(shù)據(jù)的可視化分析。本書內(nèi)容從R的基礎(chǔ)知識(shí)開始介紹,涵蓋了數(shù)據(jù)分析和數(shù)據(jù)挖掘的常用模型,包括參數(shù)估計(jì)、假設(shè)檢驗(yàn)、文本挖掘、分類、聚類等,還包括數(shù)據(jù)的可視化分析、自然語言處理等相關(guān)內(nèi)容。本書內(nèi)容比較全面,做到了易讀、易用、易理解、易實(shí)現(xiàn)、易上手,是非常適合新手學(xué)□□一本R語言入門書籍。
本書內(nèi)容主要分為以下7章。
□□章:R基礎(chǔ)知識(shí)簡(jiǎn)介,內(nèi)容包括R軟件和RStudio軟件的下載和安裝,R的工作原理介紹,R啟動(dòng)項(xiàng)的文件配置,R的工作空間以及數(shù)據(jù)的導(dǎo)人與保存,R數(shù)據(jù)包的安裝與加載,R語言編程過程中的常見錯(cuò)誤及其解決辦法等內(nèi)容。
第□章:數(shù)據(jù)分析和挖掘的初步認(rèn)識(shí):R的數(shù)據(jù)結(jié)構(gòu)。首先介紹R語言的對(duì)象和屬性,創(chuàng)建和訪問R語言中數(shù)據(jù)對(duì)象的方法,查看和管理R語言數(shù)據(jù)對(duì)象結(jié)構(gòu)的方法,如何用R語言的向量組織數(shù)據(jù),向量包含的元素可以是數(shù)值型、字符串型或邏輯型,對(duì)應(yīng)的向量依次稱為數(shù)值型向量、字符串型向量或邏輯型向量;其次從存儲(chǔ)角度和結(jié)構(gòu)角度對(duì)R語言的對(duì)象進(jìn)行分類;然后分別介紹R語言的基本數(shù)據(jù)類型,包括數(shù)值型、字符型、邏輯型;□后介紹向量、矩陣、數(shù)組、數(shù)據(jù)框、因子、列表、時(shí)間序列對(duì)象的創(chuàng)建和使用技巧。
第3章:參數(shù)估計(jì)。首先介紹參數(shù)估計(jì)的原理,總體方差、總體比例的區(qū)間估計(jì),統(tǒng)計(jì)量的分布,包括X□分布、t分布和F分布;然后介紹如何運(yùn)用參數(shù)估計(jì)的區(qū)間估計(jì)進(jìn)行R語言編程計(jì)算,根據(jù)方差齊性假設(shè)的統(tǒng)計(jì)推斷內(nèi)容,以及Shapiro-Wilk檢驗(yàn)的R語言編程。
第4章:假設(shè)檢驗(yàn)。首先介紹假設(shè)檢驗(yàn)的基本知識(shí),原假設(shè)與備擇假設(shè)、兩類錯(cuò)誤、假設(shè)檢驗(yàn)的步驟;其次介紹關(guān)于區(qū)間估計(jì)與假設(shè)檢驗(yàn)的內(nèi)容,以及如何利用P值進(jìn)行決策;然后介紹一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)和兩個(gè)總體參數(shù)的假設(shè)檢驗(yàn),分別從總體均值、總體比例和總體方差3方面進(jìn)行解釋;□后介紹W檢驗(yàn)、Epps-Pulley檢驗(yàn)的R語言編程實(shí)現(xiàn)。
第1章 R基礎(chǔ)知識(shí)簡(jiǎn)介
1.1 為什么要學(xué)習(xí)R語言
1.2 如何下載、安裝R和RStudio軟件
1.3 R軟件使用入門
1.4 R的工作原理
1.5 R啟動(dòng)項(xiàng)文件的配置
1.5.1 PATH環(huán)境變量
1.5.2 R的啟動(dòng)順序
1.5.3.Rprofile文件配置
1.6 R語言的工作空間
1.6.1 數(shù)據(jù)的導(dǎo)人
1.6.2 數(shù)據(jù)的存儲(chǔ)
1.6.3 R語言的批量讀取和寫入
1.6.4 R的內(nèi)置數(shù)據(jù)集
1.6.5 批處理文件
1.6.6 R的在線幫助
1.7 R數(shù)據(jù)包的安裝和加載
1.7.1 R數(shù)據(jù)分析與數(shù)據(jù)挖掘相關(guān)包
1.7.2 R文本挖掘wordcloud2包的使用
1.7.3 R語言中的機(jī)器學(xué)22
1.8 R語言編程過程中的常見錯(cuò)誤
1.8.1 R包安裝失敗的原因分析
1.8.2 R語言調(diào)試查錯(cuò)
1.8.3 R程序的運(yùn)行時(shí)間與效率
1.9 控制流
1.9.1 分支結(jié)構(gòu)的流程控制
1.9.2 中止語句與空語句的流程控制
1.9.3 重復(fù)和循環(huán)語句的流程控制
1.10 R語言編程常用的函數(shù)
1.10.1 用戶自定義函數(shù)
1.10.2 常用的數(shù)學(xué)函數(shù)
1.10.3 常用的基礎(chǔ)統(tǒng)計(jì)函數(shù)
1.10.4 常用的數(shù)據(jù)挖掘函數(shù)
1.11 R的趣味應(yīng)用
本章小結(jié)
思考與練2<2r>
第2章 數(shù)據(jù)分析和挖掘的初步認(rèn)識(shí):R的數(shù)據(jù)結(jié)構(gòu)
2.1 R的對(duì)象與屬性
2.2 向量對(duì)象
2.2.1 向量的索引方式
2.2.2 向量的排序和排名
2.2.3 向量的運(yùn)算
2.3 數(shù)組與矩陣對(duì)象
2.3.1 矩陣的建立
2.3.2 矩陣元素值的修改
2.3.3 數(shù)組的建立
2.3.4 矩陣和數(shù)組的索引方式
2.4 數(shù)據(jù)框?qū)ο?br />
2.5 因子對(duì)象
2.6 列表對(duì)象
2.7 時(shí)間序列對(duì)象
2.8 R語言中對(duì)象間的相互轉(zhuǎn)換
本章小結(jié)
思考與練2<2r>……
第3章 參數(shù)估計(jì)
第4章 假設(shè)檢驗(yàn)
第5章 R的基本數(shù)據(jù)分析與繪圖
第6章 R的空間數(shù)據(jù)可視化
第7章 R語言的文本數(shù)據(jù)挖掘應(yīng)用
參考文獻(xiàn)