數(shù)據(jù)科學(xué)統(tǒng)計基礎(chǔ)(第2版)
定 價:59 元
叢書名:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書
- 作者:呂曉玲,黃丹陽,李偉
- 出版時間:2024/5/1
- ISBN:9787300326986
- 出 版 社:中國人民大學(xué)出版社
《數(shù)據(jù)科學(xué)統(tǒng)計基礎(chǔ)》(第2版)內(nèi)容特色鮮明,緊扣數(shù)據(jù)科學(xué)與人工智能時代的統(tǒng)計學(xué)發(fā)展需求。本書在保持第1版強調(diào)統(tǒng)計學(xué)作為方法論學(xué)科特色的基礎(chǔ)上,進行了多方面的改進與更新。第2版不僅調(diào)整了部分章節(jié)順序和內(nèi)容安排,使之更符合統(tǒng)計學(xué)的邏輯體系,而且增加了新的統(tǒng)計方法和實例,如增強了最大似然估計的理論和實例介紹,增加了拒絕域、勢函數(shù)等假設(shè)檢驗中的重要概念,以及引入了MCMC方法并提供了該方法的R語言代碼實現(xiàn)。
本書注重理論與實踐相結(jié)合,通過大量的例題和習(xí)題,幫助學(xué)生深入理解統(tǒng)計理論和方法。同時,第2版還加強了計算機實踐環(huán)節(jié),以R語言為基礎(chǔ),介紹了與知識點相關(guān)的R語言操作,有助于學(xué)生掌握現(xiàn)代統(tǒng)計學(xué)的計算工具,提高解決實際問題的能力。
此外,本書還強調(diào)批判性思考,通過書中的批判性思考題目,鼓勵學(xué)生對統(tǒng)計方法的應(yīng)用進行獨立思考和評價,引導(dǎo)學(xué)生對統(tǒng)計學(xué)的深層次問題進行探討,培養(yǎng)學(xué)生的邏輯思維能力、分析能力、創(chuàng)新能力,以及科學(xué)精神。
本書是一本受眾群體廣泛的統(tǒng)計學(xué)教材,無論是統(tǒng)計學(xué)專業(yè)和數(shù)據(jù)科學(xué)相關(guān)專業(yè)的學(xué)生、統(tǒng)計工作者和研究人員,還是對統(tǒng)計學(xué)感興趣的自學(xué)者,都可以從中獲得有價值的知識和啟示。
呂曉玲,中國人民大學(xué)統(tǒng)計學(xué)院教授,博士生導(dǎo)師;數(shù)據(jù)科學(xué)與大數(shù)據(jù)統(tǒng)計系系主任;中國人民大學(xué)數(shù)據(jù)挖掘中心主任。奧地利約翰·開普勒林茨大學(xué)應(yīng)用統(tǒng)計系以及美國加州大學(xué)伯克利分校統(tǒng)計系訪問學(xué)者。一直從事統(tǒng)計機器學(xué)習(xí)、數(shù)據(jù)科學(xué)領(lǐng)域的研究。主持教育部人文社會科學(xué)研究項目以及國家自然科學(xué)基金項目。在Journal of the American Statistical Association,Journal of Electronic Commerce Research等SSCI/SCI檢索的國際學(xué)術(shù)期刊發(fā)表多篇論文。
黃丹陽,中國人民大學(xué)統(tǒng)計學(xué)院副教授,中國人民大學(xué)杰出青年學(xué)者,北京大數(shù)據(jù)協(xié)會理事會副秘書長、常務(wù)理事,全國工業(yè)統(tǒng)計學(xué)教學(xué)研究會青年統(tǒng)計學(xué)家協(xié)會理事。主持國家自然科學(xué)基金,北京市社會科學(xué)基金等多項科研課題,曾獲北京市優(yōu)秀人才培養(yǎng)資助。長期從事復(fù)雜網(wǎng)絡(luò)建模、大型網(wǎng)絡(luò)計算、超高維數(shù)據(jù)分析等方向的理論研究工作。在國內(nèi)外權(quán)威期刊Journal of the American Statistical Association,Journal of Econometrics,Journal of Business and Economic Statistics,以及《統(tǒng)計研究》《管理世界》等發(fā)表多篇論文。
李偉,中國人民大學(xué)統(tǒng)計學(xué)院副教授,中國人民大學(xué)吳玉章青年學(xué)者,入選國家高層次青年人才計劃,中國現(xiàn)場統(tǒng)計研究會因果推斷分會副秘書長。主持國家自然科學(xué)基金青年科學(xué)基金項目、北京市自然科學(xué)基金面上項目等多項課題,參與國家重點研發(fā)計劃青年科學(xué)家項目。研究方向是因果推斷、缺失數(shù)據(jù)、高維統(tǒng)計及其在生物醫(yī)學(xué)、社會經(jīng)濟學(xué)等領(lǐng)域中的應(yīng)用。在Journal of the Royal Statistical Society Series B,Biometrika, Journal of Econometrics,Biometrics等國際統(tǒng)計學(xué)期刊發(fā)表多篇論文。
第1章 統(tǒng)計量
1.1 數(shù)據(jù)和變量
1.1.1 數(shù)據(jù)的例子
1.1.2 變量的類型
批判性思考
習(xí)題1.1
1.2 總體、樣本和統(tǒng)計量
1.2.1 總體和分布
1.2.2 樣本
1.2.3 統(tǒng)計量
批判性思考
習(xí)題 1.2
1.3 從樣本認識總體的圖表方法
13.1 頻數(shù)頻率表與直方圖
1.3.2 餅圖與條形圖
13.3 樣本的經(jīng)驗分布函數(shù)
13.4 高維數(shù)據(jù)的圖表展示方法
13.5 數(shù)據(jù)變換
批判性思考
習(xí)題 1.3
1.4 抽樣分布
1.4.1 樣本均值的抽樣分布
1.4.2 正態(tài)總體各統(tǒng)計量的分布
1.4.3 用隨機模擬法尋找統(tǒng)計量的近似分布
批判性思考
習(xí)題 1.4
1.5 次序統(tǒng)計量
1.5.1 次序統(tǒng)計量的概念
1.5.2 樣本極差
1.5.3 樣本中位數(shù)與樣本 p分位數(shù)
1.5.4 箱線圖和 Q-Q圖
1.5.5 次序統(tǒng)計量的分布
批判性思考
習(xí)題 1.5
1.6 充分統(tǒng)計量
1.6.1 充分統(tǒng)計量的概念
1.6.2 因子分解定理
批判性思考
習(xí)題1.6
1.7 常用的概率分布族
1.7.1 常用的概率分布族表
1.7.2 伽馬分布族
1.7.3 貝塔分布族
1.7.4 指數(shù)型分布族
批判性思考
習(xí)題 1.7
18 與本章相關(guān)的 R語言操作
1.8.1 基本統(tǒng)計量的計算
1.8.2 圖表
1.8.3 隨機模擬統(tǒng)計量的抽樣分布
第2章 參數(shù)估計
2.1 點估計與無偏性
批判性思考
習(xí)題 2.1
2.2 矩估計與相合性
2.2.1 矩估計
2.2.2 相合性
批判性思考
習(xí)題 2.2
2.3 最大似然估計與漸近正態(tài)性
2.3.1 最大似然估計
2.3.2 最大似然估計的不變原理
2.3.3 最大似然估計的漸近正態(tài)性
2.3.4 EM 算法
批判性思考
習(xí)題 2.3
2.4 最小方差無偏估計
2.4.1 無偏估計的有效性
2.4.2 有偏估計的均方誤差準則
2.4.3 一致最小方差無偏估計
2.4.4 完備性及其應(yīng)用
批判性思考
習(xí)題 2.4
2.5 C-R 不等式
2.5.1 C-R 不等式簡介
2.5.2 有效估計
批判性思考
習(xí)題 2.5
2.6 置信區(qū)間
2.6.1 置信區(qū)間的概念
2.6.2 樞軸量法
2.6.3 大樣本置信區(qū)間
批判性思考
習(xí)題 2.6
2.7 正態(tài)總體參數(shù)的置信區(qū)間
2.7.1 一維參數(shù)的置信區(qū)間
2.7.2 二維參數(shù)(μ,?)的置信域
2.7.3 樣本量的確定
批判性思考
習(xí)題 2.7
2.8 與本章相關(guān)的 R語言操作
2.8.1 隨機變量序列分布的演示
2.8.2 最大似然估計
2.8.3 EM算法模擬實例
2.8.4 區(qū)間估計的模擬結(jié)果
2.8.5 均值、方差的區(qū)間估計
第3章 假設(shè)檢驗
3.1 假設(shè)檢驗的概念與步驟
3.1.1 假設(shè)檢驗問題
3.1.2 假設(shè)檢驗的步驟
3.1.3 勢函數(shù)
批判性思考
習(xí)題 3.1
3.2 正態(tài)總體參數(shù)和比率的檢驗
3.2.1 正態(tài)均值p的檢驗
3.2.2 其他正態(tài)總體參數(shù)的檢驗
3.2.3 成對數(shù)據(jù)t檢驗
3.2.4 比率的檢驗
3.2.5 控制犯兩類錯誤的概率,確定樣本量
3.2.6 幾點說明
批判性思考
習(xí)題 3.2
3.3 廣義似然比檢驗
3.3.1 廣義似然比檢驗簡介
3.3.2 區(qū)分兩個分布的廣義似然比檢驗
批判性思考
習(xí)題 3.3
3.4 分布的檢驗
3.4.1 離散分布的 x?擬合優(yōu)度檢驗
3.4.2 連續(xù)分布的檢驗
批判性思考
習(xí)題 3.4
3.5 大規(guī)模假設(shè)檢驗與 FDR
3.5.1 大規(guī)模假設(shè)檢驗
3.5.2 FDR 方法介紹
批判性思考
習(xí)題 3.5
3.6 與本章相關(guān)的 R語言操作
3.6.1 正態(tài)總體的參數(shù)檢驗
3.6.2 比率檢驗
3.6.3 假設(shè)檢驗的一個人為例子
3.6.4 x?擬合優(yōu)度檢驗
3.6.5 夏皮羅-維爾克檢驗
3.6.6 柯爾莫哥洛夫-斯米爾諾夫檢驗
3.6.7 FDR的例子
第4章 統(tǒng)計決策與貝葉斯方法
4.1 統(tǒng)計決策的基本概念
4.1.1 統(tǒng)計決策問題的三要素
4.1.2 統(tǒng)計決策函數(shù)與風(fēng)險函數(shù)
批判性思考
習(xí)題 4.1
4.2 貝葉斯點估計
4.2.1 先驗分布與貝葉斯公式
4.2.2 先驗分布
4.2.3 貝葉斯風(fēng)險與貝葉斯點估計
4.2.4 兩個注釋
批判性思考
習(xí)題 4.2
4.3 貝葉斯區(qū)間估計
43.1 可信區(qū)間
43.2 最大后驗密度可信區(qū)間
批判性思考
習(xí)題 4.3
4.4 貝葉斯假設(shè)檢驗
批判性思考
習(xí)題 4.4
4.5 MCMC 算法
4.5.1 M-H 算法
4.5.2 Gibbs 抽樣
批判性思考
習(xí)題 4.5
4.6 與本章相關(guān)的 R語言操作
4.6.1 不同先驗的對比
4.6.2 貝葉斯區(qū)間估計
4.6.3 M-H算法:例4.5.1、例4.5.2 的代碼實現(xiàn)
4.6.4 例4.5.3的代碼實現(xiàn)
4.6.5 Gibbs 抽樣:例4.5.4的代碼實現(xiàn)
第5章 再抽樣方法
5.1 自助法參數(shù)估計
5.1.1 標準誤差的自助法估計
5.1.2 偏差的自助法估計
5.1.3 自助法的區(qū)間估計
5.1.4 討論
批判性思考
習(xí)題 5.1
5.2 刀切法
5.2.1 刀切法介紹
5.2.2 刀切法和自助法的聯(lián)系
批判性思考
習(xí)題 5.2
5.3 再抽樣假設(shè)檢驗
5.3.1 置換檢驗
5.3.2 自助法假設(shè)檢驗
批判性思考
習(xí)題 53
5.4 交叉驗證
5.4.1 交叉驗證簡介
5.4.2 進一步的討論
批判性思考
習(xí)題 5.4
5.5 數(shù)據(jù)科學(xué)中的 PCS準則
5.5.1 DSLC 中的 PCS 準則
5.5.2 通過擾動分析進行 PCS推斷
補充知識
批判性思考
習(xí)題 5.5
5.6 與本章相關(guān)的 R語言操作
5.6.1 自助法
5.6.2 刀切法
5.6.3 假設(shè)檢驗
5.6.4 交叉驗證
5.6.5 數(shù)據(jù)科學(xué)中的 PCS 準則
附錄 R語言基礎(chǔ)
A.1 R語言簡介
A.1.1 R語言概述
A.1.2 R語言的安裝
A.2 數(shù)據(jù)的類型結(jié)構(gòu)
A.2.1 數(shù)據(jù)的類型
A.2.2 數(shù)據(jù)的結(jié)構(gòu)
A.2.3 缺失數(shù)據(jù)的處理
A.3 R語言的基本操作
A.3.1 數(shù)據(jù)的輸入和輸出
A.3.2 控制結(jié)構(gòu)
A.3.3 自定義函數(shù)
A.3.4 畫圖
A.4 概率分布
參考文獻