對照Excel,零基礎(chǔ)學(xué)Python數(shù)據(jù)分析
定 價:69.8 元
- 作者:楊開振
- 出版時間:2023/6/1
- ISBN:9787115607881
- 出 版 社:人民郵電出版社
- 中圖法分類:TP311.561
- 頁碼:230
- 紙張:
- 版次:01
- 開本:16開
本書主要介紹如何使用Python處理Excel數(shù)據(jù)。本書內(nèi)容分為三大部分:第一部分主要介紹數(shù)據(jù)分析的概念和Python基礎(chǔ);第二部分通過蜂蜜電商數(shù)據(jù)分析案例詳細(xì)介紹數(shù)據(jù)分析的技術(shù)要點(diǎn),包括讀寫Excel文件所需的xlwings庫和openpyxl庫、數(shù)據(jù)分析的pandas核心庫,以及數(shù)據(jù)可視化常用的Matplotlib庫和Seaborn庫;第三部分包括個人消費(fèi)貸款數(shù)據(jù)分析和螺螄粉連鎖店銷售數(shù)據(jù)分析兩個實(shí)踐案例,通過實(shí)踐案例幫助讀者回顧理論知識并提高實(shí)踐能力。
本書適合Python零基礎(chǔ)且需要處理大量Excel數(shù)據(jù)的辦公人員閱讀,也可以作為學(xué)習(xí)Python數(shù)據(jù)分析的入門教程。
·圍繞數(shù)據(jù)分析的全流程,系統(tǒng)、全面地介紹數(shù)據(jù)分析的主要知識點(diǎn)。
·對照Excel學(xué)習(xí)Python數(shù)據(jù)分析,降低學(xué)習(xí)門檻,方便快速上手。
·知識點(diǎn)全面,覆蓋xlwings、openpyxl、pandas、Matplotlib和Seaborn等常用庫。
·突出案例實(shí)戰(zhàn),幫助讀者形成數(shù)據(jù)分析的思維模式。
·提供書中用到的Excel文件和對應(yīng)的Python源代碼,供讀者免費(fèi)下載使用。
計(jì)算機(jī)軟件開發(fā)者和原創(chuàng)圖書作者,Java和Python雙修程序員,著有《深入淺出Spring Boot 2.x》《Python+Excel辦公自動化一本通》《Java EE互聯(lián)網(wǎng)輕量級框架整合開發(fā):SSM+Redis+Spring微服務(wù)》等圖書。
第 一部分 數(shù)據(jù)分析的概念和Python基礎(chǔ)
第 1章 數(shù)據(jù)分析基礎(chǔ)知識 2
1.1 為什么要做數(shù)據(jù)分析 2
1.1.1 分析現(xiàn)狀 3
1.1.2 分析具體問題 3
1.1.3 預(yù)測未來 3
1.2 為什么要使用Python做數(shù)據(jù)分析 4
1.2.1 數(shù)據(jù)分析的歷史 4
1.2.2 為什么Python+Excel會成為數(shù)據(jù)分析的主流工具 5
1.2.3 使用Python做數(shù)據(jù)分析的優(yōu)勢 6
1.3 數(shù)據(jù)分析的對象 7
1.3.1 總體指標(biāo)分析 7
1.3.2 對比分析 7
1.3.3 按時間維度分析 7
1.3.4 概率學(xué)分析 7
1.3.5 按指定維度分析 7
1.4 數(shù)據(jù)分析的流程 8
1.4.1 數(shù)據(jù)獲取 8
1.4.2 數(shù)據(jù)處理 8
1.4.3 數(shù)據(jù)篩選 9
1.4.4 數(shù)據(jù)分析 9
1.4.5 結(jié)果保存 9
1.4.6 數(shù)據(jù)可視化 9
1.4.7 數(shù)據(jù)追蹤和驗(yàn)證 9
第 2章 Python基礎(chǔ)知識 10
2.1 安裝Python和PyCharm 10
2.1.1 安裝Python 10
2.1.2 安裝和使用PyCharm 12
2.2 變量 13
2.2.1 變量的使用 13
2.2.2 變量的命名 14
2.3 簡單的數(shù)據(jù)類型 17
2.3.1 數(shù)字 17
2.3.2 字符串 22
2.4 控制語句 28
2.4.1 條件語句 28
2.4.2 循環(huán)語句 35
第3章 Python中的高級概念 41
3.1 復(fù)雜的數(shù)據(jù)類型 41
3.1.1 列表 41
3.1.2 字典 44
3.1.3 元組和集合 46
3.2 函數(shù) 47
3.2.1 函數(shù)的定義 48
3.2.2 指定函數(shù)參數(shù)的關(guān)鍵字和默認(rèn)值 49
3.2.3 函數(shù)內(nèi)外變量的可見性 50
3.2.4 傳遞可更改對象與不可更改對象 51
3.2.5 把函數(shù)放在不同的模塊中 52
3.3 類 53
3.4 異常 54
3.5 文件操作 57
3.5.1 讀取CSV文件 57
3.5.2 寫入文件 59
第二部分 蜂蜜電商數(shù)據(jù)分析
第4章 讀取和清洗數(shù)據(jù) 62
4.1 業(yè)務(wù)分析 62
4.1.1 銷售明細(xì)表分析 62
4.1.2 產(chǎn)品信息表分析 63
4.1.3 用戶信息表分析 63
4.1.4 銷售員信息表分析 64
4.1.5 數(shù)據(jù)關(guān)聯(lián) 64
4.2 讀取Excel數(shù)據(jù) 64
4.2.1 安裝對應(yīng)的庫 65
4.2.2 讀取簡單的Excel數(shù)據(jù) 67
4.2.3 pandas DataFrame 68
4.2.4 pandas Series 70
4.2.5 讀取特殊格式的Excel數(shù)據(jù) 70
4.2.6 使用xlwings讀取Excel數(shù)據(jù) 73
4.3 清洗數(shù)據(jù) 76
4.3.1 去除空記錄 76
4.3.2 去除非法數(shù)據(jù) 78
4.3.3 去除重復(fù)數(shù)據(jù) 80
4.3.4 設(shè)置默認(rèn)值 82
4.4 編寫讀寫文件的代碼 83
第5章 篩選數(shù)據(jù) 85
5.1 通過條件篩選數(shù)據(jù) 86
5.1.1 篩選多個用戶的銷售明細(xì)數(shù)據(jù) 87
5.1.2 通過商品數(shù)量和實(shí)際交易金額篩選數(shù)據(jù) 88
5.1.3 對用戶名稱進(jìn)行模糊查詢 89
5.1.4 多條件查詢銷售明細(xì)數(shù)據(jù) 89
5.2 通過交易日期篩選數(shù)據(jù) 91
5.2.1 根據(jù)年、月、季篩選數(shù)據(jù) 93
5.2.2 篩選當(dāng)前日期的數(shù)據(jù) 94
5.2.3 篩選某個時間區(qū)間內(nèi)的數(shù)據(jù) 95
第6章 數(shù)據(jù)的基礎(chǔ)運(yùn)算 96
6.1 算術(shù)運(yùn)算 96
6.1.1 通過加減運(yùn)算驗(yàn)證數(shù)據(jù)的合法性 96
6.1.2 通過乘除運(yùn)算驗(yàn)證數(shù)據(jù)的合法性 97
6.2 比較運(yùn)算 98
6.3 通過函數(shù)運(yùn)算數(shù)據(jù) 99
6.3.1 常用函數(shù) 100
6.3.2 不常用函數(shù) 101
6.3.3 按行統(tǒng)計(jì) 102
第7章 把數(shù)據(jù)連接起來 105
7.1 3種關(guān)聯(lián)關(guān)系 107
7.1.1 銷售員信息表和工卡信息表的關(guān)聯(lián)(一對一關(guān)聯(lián)) 107
7.1.2 指定關(guān)聯(lián)字段 108
7.1.3 處理重復(fù)列 109
7.1.4 連接方式 110
7.2 合并多個Excel文件的數(shù)據(jù) 113
7.2.1 合并數(shù)據(jù) 113
7.2.2 重置索引和去重 114
第8章 分組統(tǒng)計(jì)、數(shù)據(jù)透視表和排序 115
8.1 分組統(tǒng)計(jì)數(shù)據(jù) 115
8.1.1 按訂單狀態(tài)匯總數(shù)據(jù) 116
8.1.2 使用agg()方法 116
8.1.3 實(shí)踐 118
8.1.4 按蜂蜜類型進(jìn)行統(tǒng)計(jì)——統(tǒng)計(jì)關(guān)聯(lián)數(shù)據(jù) 118
8.1.5 按多列進(jìn)行分組統(tǒng)計(jì) 119
8.2 數(shù)據(jù)透視表 119
8.2.1 轉(zhuǎn)換視角 120
8.2.2 數(shù)據(jù)分組統(tǒng)計(jì)和分析 121
8.2.3 合計(jì)行列 123
8.3 排序 125
8.3.1 按實(shí)際交易金額排序(單列排序) 126
8.3.2 按實(shí)際交易金額和交易日期排序(多列排序) 126
8.3.3 按優(yōu)惠金額排序(含空值行的排序) 127
8.3.4 對交易日期降序排名 128
第9章 數(shù)據(jù)可視化 132
9.1 柱形圖和圖表基礎(chǔ) 133
9.1.1 柱形圖的繪制和坐標(biāo)軸的概念 133
9.1.2 設(shè)置坐標(biāo)軸 136
9.1.3 給圖表添加文本標(biāo)簽和注釋 138
9.1.4 設(shè)置網(wǎng)格 140
9.1.5 同比柱形圖和圖例的使用 141
9.1.6 溫度計(jì)圖 146
9.1.7 數(shù)據(jù)表 147
9.2 繪制常見的圖表 149
9.2.1 折線圖 149
9.2.2 條形圖 151
9.2.3 餅圖 153
9.2.4 雷達(dá)圖 156
9.3 其他常用的圖表技術(shù) 159
9.3.1 多種圖表組合——雙軸圖 160
9.3.2 在同一畫布中繪制多個圖表 163
9.3.3 設(shè)置圖表樣式 165
9.3.4 初探Seaborn 167
9.3.5 圖表的保存 169
第 10章 保存數(shù)據(jù)和圖表到Excel文件中 171
10.1 簡單保存數(shù)據(jù)到Excel文件中 171
10.1.1 不保存行索引并保存數(shù)據(jù)到指定工作表中 172
10.1.2 選擇要保存的列 172
10.2 使用xlwings保存數(shù)據(jù)到Excel文件中 173
10.2.1 將不同的數(shù)據(jù)保存到同一個Excel文件的不同工作表中 173
10.2.2 將結(jié)果寫入多個Excel文件 174
10.2.3 格式化 175
10.2.4 保存圖表 178
第三部分 實(shí)踐案例
第 11章 個人消費(fèi)貸款數(shù)據(jù)分析 182
11.1 業(yè)務(wù)和數(shù)據(jù)特點(diǎn)分析 182
11.1.1 貸款臺賬表業(yè)務(wù)分析 182
11.1.2 客戶經(jīng)理信息表業(yè)務(wù)分析 184
11.1.3 數(shù)據(jù)關(guān)聯(lián) 184
11.2 數(shù)據(jù)處理 185
11.2.1 驗(yàn)證和修復(fù)數(shù)據(jù) 185
11.2.2 讀取數(shù)據(jù) 186
11.3 數(shù)據(jù)篩選 187
11.3.1 簡單地篩選數(shù)據(jù) 187
11.3.2 模糊查詢 188
11.3.3 按多個條件篩選數(shù)據(jù) 189
11.3.4 查找十大存量貸款記錄 191
11.4 統(tǒng)計(jì)分析 192
11.4.1 使用分組方法groupby()按風(fēng)險狀態(tài)分組進(jìn)行統(tǒng)計(jì) 192
11.4.2 使用數(shù)據(jù)透視表按季度統(tǒng)計(jì)分析數(shù)據(jù) 195
11.4.3 使用數(shù)據(jù)透視表按月份統(tǒng)計(jì)貸款筆數(shù)和發(fā)生額 198
11.5 通過數(shù)據(jù)關(guān)聯(lián)查詢和統(tǒng)計(jì)分析數(shù)據(jù) 200
11.5.1 通過關(guān)聯(lián)查詢數(shù)據(jù) 200
11.5.2 關(guān)聯(lián)客戶經(jīng)理信息表并統(tǒng)計(jì)分析數(shù)據(jù) 201
11.6 數(shù)據(jù)可視化 202
11.6.1 繪制折線圖展示兩年各月份的貸款數(shù)據(jù) 202
11.6.2 繪制柱形圖對比兩年各季度的貸款發(fā)生額 205
11.6.3 繪制餅圖展示各業(yè)務(wù)品種貸款余額 207
11.7 保存結(jié)果 209
第 12章 螺螄粉連鎖店銷售數(shù)據(jù)分析 211
12.1 業(yè)務(wù)分析 211
12.1.1 店鋪銷售月報數(shù)據(jù) 211
12.1.2 商品信息表 212
12.2 讀取數(shù)據(jù) 214
12.2.1 遍歷文件 214
12.2.2 讀取商品信息表數(shù)據(jù) 215
12.2.3 讀取銷售月報數(shù)據(jù) 216
12.2.4 讀取工作表的數(shù)據(jù) 217
12.2.5 合并數(shù)據(jù) 220
12.2.6 測試讀取文件與合并數(shù)據(jù) 220
12.3 整理和分析數(shù)據(jù) 221
12.3.1 整理數(shù)據(jù) 221
12.3.2 分析數(shù)據(jù) 223
12.4 數(shù)據(jù)可視化 224
12.4.1 繪制店鋪月交易金額條形圖 224
12.4.2 繪制按店鋪統(tǒng)計(jì)銷量和金額雙軸圖 225
12.5 保存結(jié)果 227