機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)
定 價(jià):49 元
- 作者:(美)里徹特,(美)科埃略,劉峰
- 出版時(shí)間:2014/7/1
- ISBN:9787115356826
- 出 版 社:人民郵電出版社
- 中圖法分類:TP181
- 頁碼:210
- 紙張:膠版紙
- 版次:1
- 開本:大16開
《機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)》是實(shí)用的Python機(jī)器學(xué)習(xí)教程,結(jié)合大量案例,介紹了機(jī)器學(xué)習(xí)的各方面知識(shí)。《機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)》不僅告訴你“怎么做”,還會(huì)分析“為什么”,力求幫助讀者掌握多種多樣的機(jī)器學(xué)習(xí)Python庫(kù),學(xué)習(xí)構(gòu)建基于Python的機(jī)器學(xué)習(xí)系統(tǒng),并親身實(shí)踐和體驗(yàn)機(jī)器學(xué)習(xí)系統(tǒng)的功能。
《機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計(jì)》適合需要機(jī)器學(xué)習(xí)技術(shù)的Python開發(fā)人員、計(jì)算機(jī)科學(xué)研究人員、數(shù)據(jù)科學(xué)家、人工智能程序員,以及統(tǒng)計(jì)程序員閱讀參考。
大量Python庫(kù)的絕佳參考
用豐富的案例,細(xì)析機(jī)器學(xué)習(xí)技巧與方法
一個(gè)基于場(chǎng)景的教程,帶你承襲正確的思維方式(數(shù)據(jù)探索)
Willi Richert
機(jī)器學(xué)習(xí)和機(jī)器人學(xué)博士,目前任職于微軟Bing搜索核心研發(fā)團(tuán)隊(duì)。他從事多種機(jī)器學(xué)習(xí)領(lǐng)域的研究,包括主動(dòng)學(xué)習(xí)和統(tǒng)計(jì)機(jī)器翻譯。
Luis Pedro Coelho
計(jì)算生物學(xué)家,主要關(guān)注生物圖像信息學(xué)和大規(guī)模圖像數(shù)據(jù)的處理,致力于生物標(biāo)本圖像分析中機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用,他還是Python計(jì)算機(jī)視覺庫(kù)mahotas的主要開發(fā)人員。他于1998年開始開發(fā)開源軟件,2004年起從事Python開發(fā),并為多個(gè)Python開源庫(kù)貢獻(xiàn)了代碼。另外,Luis擁有機(jī)器學(xué)習(xí)領(lǐng)域世界領(lǐng)先的卡內(nèi)基-梅隆大學(xué)的博士學(xué)位,并發(fā)表過多篇科學(xué)論文。
第1章 Python機(jī)器學(xué)習(xí)入門
1.1 夢(mèng)之隊(duì):機(jī)器學(xué)習(xí)與Python
1.2 這本書將教給你什么(以及不會(huì)教什么)
1.3 遇到困難的時(shí)候怎么辦
1.4 開始
1.4.1 NumPy、SciPy和Matplotlib簡(jiǎn)介
1.4.2 安裝Python
1.4.3 使用NumPy和SciPy智能高效地處理數(shù)據(jù)
1.4.4 學(xué)習(xí)NumPy
1.4.5 學(xué)習(xí)SciPy
1.5 我們第一個(gè)(極小的)機(jī)器學(xué)習(xí)應(yīng)用
1.5.1 讀取數(shù)據(jù)
1.5.2 預(yù)處理和清洗數(shù)據(jù)
1.5.3 選擇正確的模型和學(xué)習(xí)算法
1.6 小結(jié)
第2章 如何對(duì)真實(shí)樣本分類
2.1 Iris數(shù)據(jù)集
2.1.1 第一步是可視化
2.1.2 構(gòu)建第一個(gè)分類模型
2.2 構(gòu)建更復(fù)雜的分類器
2.3 更復(fù)雜的數(shù)據(jù)集和更復(fù)雜的分類器
2.3.1 從Seeds數(shù)據(jù)集中學(xué)習(xí)
2.3.2 特征和特征工程
2.3.3 最鄰近分類
2.4 二分類和多分類
2.5 小結(jié)
第3章 聚類:尋找相關(guān)的帖子
3.1 評(píng)估帖子的關(guān)聯(lián)性
3.1.1 不應(yīng)該怎樣
3.1.2 應(yīng)該怎樣
3.2 預(yù)處理:用相近的公共詞語個(gè)數(shù)來衡量相似性
3.2.1 將原始文本轉(zhuǎn)化為詞袋
3.2.2 統(tǒng)計(jì)詞語
3.2.3 詞語頻次向量的歸一化
3.2.4 刪除不重要的詞語
3.2.5 詞干處理
3.2.6 停用詞興奮劑
3.2.7 我們的成果和目標(biāo)
3.3 聚類
3.3.1 K均值
3.3.2 讓測(cè)試數(shù)據(jù)評(píng)估我們的想法
3.3.3 對(duì)帖子聚類
3.4 解決我們最初的難題
3.5 調(diào)整參數(shù)
3.6 小結(jié)
第4章 主題模型
4.1 潛在狄利克雷分配(LDA)
4.2 在主題空間比較相似度
4.3 選擇主題個(gè)數(shù)
4.4 小結(jié)
第5章 分類:檢測(cè)劣質(zhì)答案
5.1 路線圖概述
5.2 學(xué)習(xí)如何區(qū)分出優(yōu)秀的答案
5.2.1 調(diào)整樣本
5.2.2 調(diào)整分類器
5.3 獲取數(shù)據(jù)
5.3.1 將數(shù)據(jù)消減到可處理的程度
5.3.2 對(duì)屬性進(jìn)行預(yù)選擇和處理
5.3.3 定義什么是優(yōu)質(zhì)答案
5.4 創(chuàng)建第一個(gè)分類器
5.4.1 從k鄰近(kNN)算法開始
5.4.2 特征工程
5.4.3 訓(xùn)練分類器
5.4.4 評(píng)估分類器的性能
5.4.5 設(shè)計(jì)更多的特征
5.5 決定怎樣提升效果
5.5.1 偏差?方差及其折中
5.5.2 解決高偏差
5.5.3 解決高方差
5.5.4 高偏差或低偏差
5.6 采用邏輯回歸
5.6.1 一點(diǎn)數(shù)學(xué)和一個(gè)小例子
5.6.2 在帖子分類問題上應(yīng)用邏輯回歸
5.7 觀察正確率的背后:準(zhǔn)確率和召回率
5.8 為分類器瘦身
5.9 出貨
5.10 小結(jié)
第6章 分類II:情感分析
6.1 路線圖概述
6.2 獲取推特(Twitter)數(shù)據(jù)
6.3 樸素貝葉斯分類器介紹
6.3.1 了解貝葉斯定理
6.3.2 樸素
6.3.3 使用樸素貝葉斯進(jìn)行分類
6.3.4 考慮未出現(xiàn)的詞語和其他古怪情況
6.3.5 考慮算術(shù)下溢
6.4 創(chuàng)建第一個(gè)分類器并調(diào)優(yōu)
6.4.1 先解決一個(gè)簡(jiǎn)單問題
6.4.2 使用所有的類
6.4.3 對(duì)分類器的參數(shù)進(jìn)行調(diào)優(yōu)
6.5 清洗推文
6.6 將詞語類型考慮進(jìn)去
6.6.1 確定詞語的類型
6.6.2 用SentiWordNet成功地作弊
6.6.3 我們第一個(gè)估算器
6.6.4 把所有東西融合在一起
6.7 小結(jié)
第7章 回歸:推薦
7.1 用回歸預(yù)測(cè)房?jī)r(jià)
7.1.1 多維回歸
7.1.2 回歸里的交叉驗(yàn)證
7.2 懲罰式回歸
7.2.1 L1和L2懲罰
7.2.2 在Scikit-learn中使用Lasso或彈性網(wǎng)
7.3 P大于N的情形
7.3.1 基于文本的例子
7.3.2 巧妙地設(shè)置超參數(shù)(hyperparameter)
7.3.3 評(píng)分預(yù)測(cè)和推薦
7.4 小結(jié)
第8章 回歸:改進(jìn)的推薦
8.1 改進(jìn)的推薦
8.1.1 使用二值推薦矩陣
8.1.2 審視電影的近鄰
8.1.3 組合多種方法
8.2 購(gòu)物籃分析
8.2.1 獲取有用的預(yù)測(cè)
8.2.2 分析超市購(gòu)物籃
8.2.3 關(guān)聯(lián)規(guī)則挖掘
8.2.4 更多購(gòu)物籃分析的高級(jí)話題
8.3 小結(jié)
第9章 分類III:音樂體裁分類
9.1 路線圖概述
9.2 獲取音樂數(shù)據(jù)
9.3 觀察音樂
9.4 用FFT構(gòu)建第一個(gè)分類器
9.4.1 增加實(shí)驗(yàn)敏捷性
9.4.2 訓(xùn)練分類器
9.4.3 在多分類問題中用混淆矩陣評(píng)估正確率
9.4.4 另一種方式評(píng)估分類器效果:受試者工作特征曲線(ROC)
9.5 用梅爾倒頻譜系數(shù)(MFCC)提升分類效果
9.6 小結(jié)
第10章 計(jì)算機(jī)視覺:模式識(shí)別
10.1 圖像處理簡(jiǎn)介
10.2 讀取和顯示圖像
10.2.1 圖像處理基礎(chǔ)
10.2.2 加入椒鹽噪聲
10.2.3 模式識(shí)別
10.2.4 計(jì)算圖像特征
10.2.5 設(shè)計(jì)你自己的特征
10.3 在更難的數(shù)據(jù)集上分類
10.4 局部特征表示
10.5 小結(jié)
第11章 降維
11.1 路線圖
11.2 選擇特征
11.2.1 用篩選器檢測(cè)冗余特征
11.2.2 用封裝器讓模型選擇特征
11.3 其他特征選擇方法
11.4 特征抽取
11.4.1 主成分分析(PCA)
11.4.2 PCA的局限性以及LDA會(huì)有什么幫助
11.5 多維標(biāo)度法(MDS)
11.6 小結(jié)
第12章 大數(shù)據(jù)
12.1 了解大數(shù)據(jù)
12.2 用Jug程序包把你的處理流程分解成幾個(gè)任務(wù)
12.2.1 關(guān)于任務(wù)
12.2.2 復(fù)用部分結(jié)果
12.2.3 幕后的工作原理
12.2.4 用Jug分析數(shù)據(jù)
12.3 使用Web服務(wù)(AWS)
12.3.1 構(gòu)建你的第一臺(tái)機(jī)器
12.3.2 用starcluster自動(dòng)創(chuàng)建集群
12.4 小結(jié)
附錄A 更多機(jī)器學(xué)習(xí)知識(shí)
A.1 在線資源
A.2 參考書
A.2.1 問答網(wǎng)站
A.2.2 博客
A.2.3 數(shù)據(jù)資源
A.2.4 競(jìng)爭(zhēng)日益加劇
A.3 還剩下什么
A.4 小結(jié)
索引