Python數(shù)據(jù)分析與機(jī)器學(xué)習(xí)
定 價(jià):75 元
叢書(shū)名:面向新工科普通高等教育系列教材
- 作者:周元哲 編著
- 出版時(shí)間:2022/6/1
- ISBN:9787111704928
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP311.561;TP181
- 頁(yè)碼:282
- 紙張:
- 版次:
- 開(kāi)本:16
本書(shū)包括兩部分內(nèi)容,第壹部分重點(diǎn)介紹了與Python語(yǔ)言相關(guān)的數(shù)據(jù)分析
工具,包括NumPy、Matplotlib、Pandas、Scipy、Seaborn和Sklearn。第二部分介紹數(shù)據(jù)處理、特征工程、評(píng)價(jià)指標(biāo)、線(xiàn)性模型、支持向量機(jī)、K近鄰算法、樸素貝葉斯、決策樹(shù)、K-Means算法和文本分析實(shí)例。附錄提供了課程教學(xué)大綱和
部分課后習(xí)題答案。
本書(shū)內(nèi)容精練、文字簡(jiǎn)潔、結(jié)構(gòu)合理、實(shí)訓(xùn)題目經(jīng)典實(shí)用、綜合性強(qiáng)、定位明確,面向初、中級(jí)讀者,由“入門(mén)”起步,側(cè)重“提高”。特別適合作為高等院校相關(guān)專(zhuān)業(yè)數(shù)據(jù)分析與機(jī)器學(xué)習(xí)課程的入門(mén)教材或教學(xué)參考書(shū),也可以供從事計(jì)算機(jī)應(yīng)用開(kāi)發(fā)的各類(lèi)技術(shù)人員參考。
前言
第1章Python與數(shù)據(jù)分析
11概述
111引例
112數(shù)據(jù)分析與數(shù)據(jù)挖掘
12Python簡(jiǎn)介
121Python特點(diǎn)
122Python應(yīng)用場(chǎng)合
13數(shù)據(jù)分析流程
131明確目標(biāo)
132獲取數(shù)據(jù)
133清洗數(shù)據(jù)
134特征工程
135構(gòu)建模型
136模型評(píng)估
14數(shù)據(jù)分析庫(kù)
141NumPy
142Matplotlib
143Pandas
144Seaborn
145Scipy
146Sklearn
15Python解釋器
151Ubuntu下安裝Python
152Windows下安裝Python
16Python編輯器
161IDLE
162VScode
163PyCharm
164Anaconda
165Jupyter
17習(xí)題
第2章NumPy——數(shù)據(jù)分析基礎(chǔ)
工具
21安裝NumPy
22ndarray對(duì)象
221認(rèn)識(shí)ndarray對(duì)象
222ndarray對(duì)象屬性
23創(chuàng)建ndarray對(duì)象
231zeros
232ones
233diag
234arange
235linspace
236logspace
24數(shù)組變換
241維度變換
242數(shù)組拼接
243數(shù)組分割
244數(shù)組復(fù)制
25索引和切片
26線(xiàn)性代數(shù)
261矩陣運(yùn)算
262矩陣轉(zhuǎn)置
263特征根和特征向量
27統(tǒng)計(jì)量
271平均值
272最值
273中位數(shù)
274極差
275方差
276協(xié)方差
277皮爾森相關(guān)系數(shù)
28習(xí)題
第3章Matplotlib——數(shù)據(jù)可視化
工具
31安裝Matplotlib
32繪圖步驟
321創(chuàng)建畫(huà)布
322繪圖函數(shù)
323繪圖屬性
33子圖基本操作
331pltsubplot
332figureadd_subplot
333pltsubplots
34繪圖
341折線(xiàn)圖
342氣泡圖
343餅圖
344直方圖
345條形圖
35概率分布
351泊松分布
352正態(tài)分布
353均勻分布
354二項(xiàng)分布
36習(xí)題
第4章Pandas——數(shù)據(jù)處理工具
41認(rèn)識(shí)Pandas
42Series
421創(chuàng)建Series
422 Series屬性
423訪(fǎng)問(wèn)Series數(shù)據(jù)
43操作Series
431更新Series
432插入Series
433刪除Series
44DataFrame
441創(chuàng)建DataFrame
442DataFrame屬性
443選取行列數(shù)據(jù)
45操作DataFrame
451更新DataFrame
452插入DataFrame
453刪除DataFrame
46Index
461創(chuàng)建Index
462常用屬性
463常用方法
464重建Index
47可視化
471線(xiàn)形圖
472條形圖
473餅狀圖
474直方圖與密度圖
48數(shù)據(jù)轉(zhuǎn)換
481數(shù)據(jù)值替換
482數(shù)據(jù)映射
483數(shù)據(jù)值合并
484數(shù)據(jù)值補(bǔ)充
485數(shù)據(jù)離散化
49數(shù)據(jù)分組與聚合
491數(shù)據(jù)分組
492數(shù)據(jù)聚合
410讀取外部數(shù)據(jù)
4101操作Excel
4102操作文本文件
4103操作數(shù)據(jù)庫(kù)
411習(xí)題
第5章Scipy——數(shù)據(jù)統(tǒng)計(jì)工具
51認(rèn)識(shí)Scipy
52稀疏矩陣
53線(xiàn)性代數(shù)
531矩陣運(yùn)算
532線(xiàn)性方程組求解
54數(shù)據(jù)優(yōu)化
541非線(xiàn)性方程組求解
542函數(shù)最值
543最小二乘法
55數(shù)據(jù)分布
551泊松分布
552正態(tài)分布
553均勻分布
554二項(xiàng)分布
555指數(shù)分布
56統(tǒng)計(jì)量
561眾數(shù)
562皮爾森相關(guān)系數(shù)
57圖像處理
571旋轉(zhuǎn)圖像
572圖像濾波
573邊緣檢測(cè)
58習(xí)題
第6章Seaborn——數(shù)據(jù)可視化
工具
61認(rèn)識(shí)Seaborn
611繪圖特色
612圖表分類(lèi)
613數(shù)據(jù)集
62繪圖設(shè)置
621繪圖元素
622主題
623調(diào)色板
63繪圖
631直方圖
632核密度圖
633小提琴圖
634分類(lèi)散點(diǎn)圖
635條形圖
636熱力圖
637點(diǎn)圖
64習(xí)題
第7章Sklearn——機(jī)器學(xué)習(xí)工具
71Sklearn簡(jiǎn)介
72安裝Sklearn
73數(shù)據(jù)集
731小數(shù)據(jù)集
732大數(shù)據(jù)集
733生成數(shù)據(jù)集
74機(jī)器學(xué)習(xí)流程
741數(shù)據(jù)清洗
742劃分?jǐn)?shù)據(jù)集
743特征工程
744機(jī)器算法
745模型評(píng)估
75習(xí)題
第8章數(shù)據(jù)處理
81認(rèn)識(shí)數(shù)據(jù)處理
82數(shù)據(jù)清洗
821處理缺失值
822處理異常值
823處理重復(fù)值
83特征處理
831規(guī)范化
832標(biāo)準(zhǔn)化
833魯棒化
84數(shù)據(jù)分析可視庫(kù)
841missingno庫(kù)
842詞云
85案例——學(xué)生信息清洗
86習(xí)題
第9章特征工程
91認(rèn)識(shí)特征工程
92獨(dú)熱編碼
93特征提取
931DictVectorizer
932CountVectorizer
933TfidfVectorizer
94中文分詞
941Jieba分詞庫(kù)
942停用詞表
95案例——中文特征提取
96習(xí)題
第10章評(píng)價(jià)指標(biāo)
101欠擬合和過(guò)擬合
1011欠擬合
1012過(guò)擬合
102曲線(xiàn)擬合
1021polyfit方法
1022Curve_fit方法
103分類(lèi)評(píng)價(jià)指標(biāo)
1031混淆矩陣
1032準(zhǔn)確率
1033精確率
1034召回率
1035F1 Score
1036ROC曲線(xiàn)
1037AUC面積
1038分類(lèi)評(píng)估報(bào)告
104回歸評(píng)價(jià)指標(biāo)
1041均方誤差
1042相關(guān)系數(shù)或者R2
105案例——手寫(xiě)數(shù)字?jǐn)?shù)據(jù)集評(píng)價(jià)
指標(biāo)
106習(xí)題
第11章線(xiàn)性模型
111回歸模型
1111線(xiàn)性回歸
1112邏輯回歸
112兩種求解方法
1121最小二乘法
1122梯度下降法
113嶺回歸
1131認(rèn)識(shí)嶺回歸
1132參數(shù)alpha
114案例
1141線(xiàn)性回歸預(yù)測(cè)披薩價(jià)格
1142線(xiàn)性回歸與嶺回歸識(shí)別糖
尿病
115習(xí)題
第12章支持向量機(jī)
121初識(shí)向量機(jī)
1211超平面線(xiàn)性方程
1212SVM算法庫(kù)
122核函數(shù)
1221線(xiàn)性核函數(shù)
1222多項(xiàng)式核函數(shù)
1223高斯核函數(shù)
123參數(shù)調(diào)優(yōu)
1231gamma參數(shù)
1232懲罰系數(shù)C
124回歸問(wèn)題
125案例
1251支持向量機(jī)識(shí)別鳶尾花
1252支持向量機(jī)預(yù)測(cè)波士頓
房?jī)r(jià)
126習(xí)題
第13章K近鄰算法
131初識(shí)K近鄰算法
1311算法思想
1312算法描述
132選擇K值
133距離度量
134分類(lèi)問(wèn)題
135回歸問(wèn)題
136案例
1361KNN區(qū)分電影類(lèi)型
1362KNN識(shí)別鳶尾花
137習(xí)題
第14章樸素貝葉斯
141初識(shí)樸素貝葉斯
142貝葉斯定理
143流程
144分類(lèi)
1441高斯分布
1442多項(xiàng)式分布
1443伯努利分布
145案例
1451樸素貝葉斯識(shí)別鳶尾花
1452樸素貝葉斯分類(lèi)新聞
146習(xí)題
第15章決策樹(shù)
151初識(shí)決策樹(shù)
152信息論
1521信息熵
1522條件熵
1523信息增益
1524互信息
1525基尼系數(shù)
153決策樹(shù)算法
1531ID3算法
1532C45算法
1533CART算法
154分類(lèi)與回歸
1541分類(lèi)問(wèn)題
1542回歸問(wèn)題
1543調(diào)優(yōu)max_depth參數(shù)
155集成分類(lèi)模型
1551隨機(jī)森林
1552梯度提升決策樹(shù)
156graphviz與DOT
1561graphviz
1562DOT語(yǔ)言
157案例
1571決策樹(shù)決定是否賴(lài)床
1572決策樹(shù)預(yù)測(cè)波士頓房?jī)r(jià)
158習(xí)題
第16章K-Means算法
161初識(shí)K-Means
162實(shí)現(xiàn)K-Means聚類(lèi)
1621理論實(shí)現(xiàn)K-Means聚類(lèi)
1622Python實(shí)現(xiàn)K-Means聚類(lèi)
1623Sklearn實(shí)現(xiàn)K-Means聚類(lèi)
163K-Means評(píng)估指標(biāo)
1631調(diào)整蘭德系數(shù)
1632輪廓系數(shù)
164案例
1641K-Means聚類(lèi)鳶尾花
1642K-Means標(biāo)記質(zhì)心
165習(xí)題
第17章文本分析示例
171正則表達(dá)式
1711基本語(yǔ)法
1712re模塊
1713提取電影信息
172LDA
1721LDA原理
1722Gensim庫(kù)
173距離算法
1731余弦相似度
1732編輯距離
174SimHash算法
1741算法思想
1742實(shí)現(xiàn)步驟
175文本情感分析
1751情感分析
1752SnowNLP
176案例——電影影評(píng)情感
分析
177習(xí)題
附錄
附錄A課程教學(xué)大綱
附錄B部分課后習(xí)題答案
參考文獻(xiàn)