Python預(yù)測(cè)分析與機(jī)器學(xué)習(xí)
定 價(jià):89 元
叢書(shū)名:清華開(kāi)發(fā)者書(shū)庫(kù)
- 作者:王沁晨編著
- 出版時(shí)間:2022/5/1
- ISBN:9787302592549
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:405頁(yè)
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
本書(shū)從理解問(wèn)題定義、了解數(shù)據(jù)內(nèi)的高層信息、數(shù)據(jù)清理、視化數(shù)據(jù),到基礎(chǔ)建模、模型優(yōu)化,分享一個(gè)數(shù)據(jù)分析師的視角與思路。在預(yù)測(cè)分析的流程中,一步步用詳細(xì)的圖文代碼講解使用到的庫(kù),如何正確使用各個(gè)庫(kù)中的方法和函數(shù),以及在遇到類似的問(wèn)題時(shí)如何套用學(xué)過(guò)的知識(shí)。本書(shū)共8章。第1章對(duì)預(yù)測(cè)分析的流程進(jìn)行一個(gè)高層次的概述。第2章介紹本書(shū)需要安裝使用的庫(kù),并講解數(shù)據(jù)清理步驟的執(zhí)行。第3章講解基礎(chǔ)建模需考慮的細(xì)節(jié),結(jié)合第4章的模型選擇,可以搭建一個(gè)基礎(chǔ)的預(yù)測(cè)管道。第5章和第6章分別從模型和數(shù)據(jù)的角度講解如何優(yōu)化預(yù)測(cè)表現(xiàn)。第7章講解時(shí)間序列這一特殊數(shù)據(jù)的預(yù)測(cè)方法。最后,第8章總結(jié)全書(shū)學(xué)習(xí)到的內(nèi)容,解決一個(gè)實(shí)戰(zhàn)問(wèn)題。本書(shū)面向3類讀者。第1類,有編程基礎(chǔ)但毫無(wú)數(shù)據(jù)科學(xué)背景,有意入門(mén)的讀者;第2類,有數(shù)據(jù)科學(xué)理論基礎(chǔ),有意進(jìn)入實(shí)操的讀者,如剛畢業(yè)沒(méi)有業(yè)界經(jīng)驗(yàn)的學(xué)生;第3類,有數(shù)據(jù)科學(xué)理論基礎(chǔ)與實(shí)操經(jīng)驗(yàn),但日常工作集中在數(shù)據(jù)分析管道中的數(shù)據(jù)分析師。
王沁晨,多倫多大學(xué)圣喬治校區(qū)計(jì)算機(jī)專業(yè),曾在加拿大零售企業(yè)Loblaw Companies擔(dān)任機(jī)器學(xué)習(xí)數(shù)據(jù)分析師,從公司傳統(tǒng)的大型數(shù)據(jù)庫(kù)中篩選有效信息、清理數(shù)據(jù)、人工數(shù)據(jù)挖掘、視化,到基礎(chǔ)建模、模型優(yōu)化、數(shù)據(jù)再篩選,再到結(jié)合商業(yè)需求創(chuàng)造擴(kuò)展性強(qiáng)的實(shí)用管線,讓項(xiàng)目從理論性的頭腦風(fēng)暴變現(xiàn)為商業(yè)價(jià)值。
第1章預(yù)測(cè)分析與機(jī)器學(xué)習(xí)的實(shí)用價(jià)值
1.1人工智能、機(jī)器學(xué)習(xí)與數(shù)據(jù)分析的關(guān)系
1.2什么是預(yù)測(cè)分析
1.3預(yù)測(cè)分析在各行業(yè)中的應(yīng)用
1.4預(yù)測(cè)分析流程概覽
1.5小結(jié)
第2章數(shù)據(jù)清理
2.1建立編程環(huán)境
2.1.1Anaconda簡(jiǎn)介及安裝
2.1.2Jupyter N0tebook 簡(jiǎn)介及安裝
2.1.3Pandas簡(jiǎn)介及安裝
2.1.4scikitlearn 簡(jiǎn)介及安裝
2.1.5XGBoost、LightGBM、CatBoost簡(jiǎn)介及安裝
2.1.6TensorFlow簡(jiǎn)介及安裝
2.2面對(duì)異構(gòu)數(shù)據(jù)如何下手
2.2.1什么是異構(gòu)數(shù)據(jù)
2.2.2如何處理異構(gòu)數(shù)據(jù)
2.3數(shù)據(jù)誤差
2.3.1各類數(shù)據(jù)誤差及其影響
2.3.2如何處理數(shù)據(jù)誤差
2.4數(shù)據(jù)重新格式化
第3章基礎(chǔ)建模
3.1判斷何為X和y
3.1.1X和y的定義
3.1.2X和y的選擇對(duì)預(yù)測(cè)的影響
3.2訓(xùn)練集、驗(yàn)證集與測(cè)試集
3.2.1三者的定義及關(guān)系
3.2.2如何使用sklearn分離3個(gè)集
3.2.3如何使用Pandas手動(dòng)分離3個(gè)集
3.3數(shù)據(jù)泄#
3.3.1不同類型的數(shù)據(jù)泄#
3.3.2發(fā)現(xiàn)并避免目標(biāo)泄#
3.3.3避免訓(xùn)練集與測(cè)試集的相互污染
3.4偏差與方差
3.4.1定義偏差與方差
3.4.2過(guò)擬合與欠擬合
3.4.3實(shí)踐中的過(guò)擬合與欠擬合
3.5小結(jié)
...