趣玩Python:自動化辦公真簡單(雙色+視頻版)
定 價:89 元
- 作者:關(guān)東升
- 出版時間:2021/11/1
- ISBN:9787121422973
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:280
- 紙張:
- 版次:01
- 開本:16開
本書以數(shù)據(jù)收集→數(shù)據(jù)清洗→數(shù)據(jù)分析→數(shù)據(jù)可視化→根據(jù)數(shù)據(jù)可視化結(jié)果(即圖表)做決策為脈絡(luò),介紹Python在實際工作場景中的應(yīng)用,側(cè)重于用Python解決工作中的數(shù)據(jù)處理問題,并通過實戰(zhàn)形式講解如何用Python實現(xiàn)數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)分析及可視化等工作。本書還詳細(xì)講解了Python自動化辦公方面的內(nèi)容,包括:Excel自動化、Word自動化、PPT自動化、PDF文件處理、圖形圖像處理和RPA(機器人流程自動化),并介紹了GUI技術(shù)和應(yīng)用程序打包相關(guān)知識。本書秉承有趣、有料、好玩、好用的理念,特意設(shè)計了兩個人物角色,通過這兩個人物角色的輕松對話、搞笑形象及夸張動作,把復(fù)雜的技術(shù)問題講解得深入淺出,非常適合廣大讀者閱讀。
關(guān)東升一個在IT領(lǐng)域摸爬滾打20多年的老程序員、軟件架構(gòu)師、高級培訓(xùn)講師、IT作家。熟悉Java、Kotlin、Python、iOS、Android、游戲開發(fā)、數(shù)據(jù)庫開發(fā)與設(shè)計、軟件架構(gòu)設(shè)計等多種IT技術(shù)。參與設(shè)計和開發(fā)北京市公交一卡通百億級大型項目,開發(fā)國家農(nóng)產(chǎn)品追溯系統(tǒng)、金融系統(tǒng)微博等移動客戶端項目。曾為中國移動、中國聯(lián)通、南方航空、中國石油、工商銀行、平安銀行和天津港務(wù)局等企事業(yè)單位授課。著有《Java從小白到大!贰禟otlin從小白到大牛》《Python從小白到大!贰犊绰媽W(xué)Python》等40多部計算機書籍。
第1章 千里之行,始于足下——Python基礎(chǔ) 1
1.1 Python解釋器 2
1.2 PyCharm開發(fā)工具 3
1.2.1 下載和安裝 4
1.2.2 設(shè)置PyCharm工具 5
1.3 第一個Python程序 7
1.3.1 創(chuàng)建項目 7
1.3.2 創(chuàng)建Python代碼文件 9
1.3.3 編寫代碼 10
1.3.4 運行程序 11
1.4 文本編輯工具+Python解釋器實現(xiàn) 11
1.4.1 編寫代碼 11
1.4.2 運行程序 12
1.4.3 代碼解釋 13
1.5 Python中的基礎(chǔ)語法 14
1.5.1 標(biāo)識符 14
1.5.2 關(guān)鍵字 15
1.5.3 變量聲明 15
1.5.4 語句 15
1.5.5 代碼塊 16
1.5.6 模塊 16
1.6 數(shù)據(jù)類型與運算符 17
1.6.1 數(shù)據(jù)類型 17
1.6.2 運算符 19
1.7 控制語句 22
1.7.1 分支語句 22
1.7.2 循環(huán)語句 24
1.7.3 跳轉(zhuǎn)語句 27
1.8 序列 28
1.8.1 索引操作 28
1.8.2 序列切片 29
1.8.3 可變序列——列表 30
1.8.4 不可變序列——元組 31
1.8.5 列表推導(dǎo)式 32
1.9 集合 33
1.9.1 創(chuàng)建集合 33
1.9.2 集合推導(dǎo)式 34
1.10 字典 34
1.10.1 創(chuàng)建字典 35
1.10.2 字典推導(dǎo)式 36
1.11 字符串 36
1.11.1 字符串的表示方式 36
1.11.2 將字符串格式化 38
1.11.3 正則表達式 39
1.12 函數(shù) 40
1.12.1 匿名函數(shù)與lambda表達式 41
1.12.2 數(shù)據(jù)處理中的兩個常用函數(shù) 42
1.13 文件操作與目錄管理 44
1.13.1 文件操作 44
1.13.2 文本文件讀寫 46
1.13.3 二進制文件讀寫 47
1.13.4 os模塊 48
1.13.5 os.path模塊 49
1.14 異常處理機制 51
1.14.1 捕獲異常 51
1.14.2 釋放資源 52
第2章 讓“蟲子”幫你收集數(shù)據(jù)——網(wǎng)絡(luò)爬蟲技術(shù) 56
2.1 數(shù)據(jù)從哪里來——收集數(shù)據(jù) 56
2.2 收集股票的歷史交易數(shù)據(jù) 58
2.3 自動爬取數(shù)據(jù) 60
2.4 從繁雜的HTML代碼中解析數(shù)據(jù)——使用BeautifulSoup庫 62
2.5 爬不到數(shù)據(jù)怎么辦——使用Selenium工具 68
2.5.1 Ajax動態(tài)數(shù)據(jù) 70
2.5.2 使用Selenium爬取數(shù)據(jù) 70
2.6 有驗證碼怎么辦 74
2.6.1 驗證碼概述 74
2.6.2 驗證碼識別 74
2.6.3 安裝OCR引擎Tesseract 75
2.6.4 安裝pytesseract 76
2.6.5 安裝Pillow庫 77
2.6.6 安裝OpenCV 78
2.6.7 驗證碼識別前的圖像預(yù)處理 78
2.6.8 驗證碼識別過程 79
2.7 實戰(zhàn)訓(xùn)練:電網(wǎng)考試平臺的驗證碼識別 81
2.7.1 配置自己的Web服務(wù)器 81
2.7.2 啟動Web服務(wù)器 82
2.7.3 使用Selenium模擬登錄過程 82
2.8 提高“蟲子”的工作效率 86
第3章 洗一洗“臟數(shù)據(jù)”——數(shù)據(jù)清洗 89
3.1 數(shù)據(jù)清洗那些事兒 89
3.2 訪問Excel文件庫——xlwings庫 90
3.2.1 xlwings庫中對象的層次關(guān)系 91
3.2.2 打開Excel文件并讀取其單元格數(shù)據(jù) 91
3.2.3 如何獲取表格區(qū)域 93
3.2.4 獲取表格行數(shù)和列數(shù) 96
3.2.5 轉(zhuǎn)置表格 97
3.2.6 單元格默認(rèn)的數(shù)據(jù)類型 98
3.2.7 寫入單元格數(shù)據(jù) 99
3.2.8 設(shè)置單元格樣式 102
3.2.9 這樣遍歷單元格太麻煩了 104
3.2.10 刪除列 105
3.2.11 刪除行 106
3.2.12 調(diào)用VBA宏批量刪除重復(fù)的數(shù)據(jù) 107
3.2.13 找出格式不統(tǒng)一的數(shù)據(jù) 110
3.3 填充缺失的值 111
3.3.1 固定值填充 112
3.3.2 平均值填充 113
第4章 把“寶貝”收好了——數(shù)據(jù)存儲 115
4.1 讀取CSV文件 116
4.2 將爬取的數(shù)據(jù)保存為CSV文件 117
4.3 SQLite數(shù)據(jù)庫 118
4.4 使用GUI管理工具管理SQLite數(shù)據(jù)庫 119
4.5 sqlite3模塊API 121
4.6 將爬取的數(shù)據(jù)保存到SQLite數(shù)據(jù)庫 122
4.7 在數(shù)據(jù)庫中查詢數(shù)據(jù) 124
第5章 找出隱藏在數(shù)據(jù)中的“黃金屋”——數(shù)據(jù)分析 126
5.1 數(shù)據(jù)分析那些事兒 126
5.2 使用Excel進行數(shù)據(jù)分析 127
5.2.1 老板讓我找出北京周邊的房價信息 127
5.2.2 找出北京周邊房屋面積大于120m2的小區(qū) 129
5.2.3 找出東城區(qū)和西城區(qū)房屋面積大于120m2的小區(qū) 130
5.2.4 找出有北京最高房價的小區(qū) 131
5.3 讓“熊貓”幫我們分析數(shù)據(jù)——使用pandas庫 132
5.3.1 Series數(shù)據(jù)結(jié)構(gòu) 132
5.3.2 DataFrame數(shù)據(jù)結(jié)構(gòu) 134
5.4 使用pandas庫讀取Excel文件 136
5.4.1 舉個“栗子”:從Excel文件中讀取全國總?cè)丝跀?shù)據(jù) 137
5.4.2 跳過頭部行和尾部行 138
5.4.3 當(dāng)“熊貓”遇到CSV文件 139
5.4.4 當(dāng)“熊貓”遇到SQLite 141
5.4.5 使用pandas庫寫入數(shù)據(jù)到CSV文件 143
5.4.6 使用pandas庫寫入數(shù)據(jù)到Excel文件 144
5.4.7 使用pandas庫找出各城區(qū)有最高房價的小區(qū) 145
5.4.8 按照各城區(qū)的平均房價排序 146
5.5 數(shù)據(jù)分析與數(shù)據(jù)透視表的故事 148
第6章 一圖抵萬言——數(shù)據(jù)可視化 151
6.1 數(shù)據(jù)可視化那些事兒 151
6.2 使用Matplotlib庫繪制圖表 152
6.2.1 安裝Matplotlib庫 152
6.2.2 圖表的基本構(gòu)成要素 152
6.2.3 繪制城區(qū)最高房價柱狀圖 153
6.2.4 北京房價區(qū)間占比餅狀圖 155
6.2.5 北京各城區(qū)房價分布散點圖 157
6.2.6 貴州茅臺股票的歷史成交量折線圖 158
6.2.7 繪制股票的歷史OHLC圖 159
6.3 調(diào)用Excel繪制圖表 161
6.3.1 繪制三維折線圖 161
6.3.2 繪制三維簇狀條形圖 163
第7章 辦公離不開的“字”處理——操作Word文件 165
7.1 訪問Word文件庫——python-docx庫 165
7.1.1 python-docx庫中的那些對象 166
7.1.2 打開Word文件并讀取內(nèi)容 167
7.1.3 寫入數(shù)據(jù)到Word文件 169
7.1.4 在Word文件中添加表格 171
7.1.5 設(shè)置文件樣式 173
7.1.6 修改文件樣式 175
7.2 解決在工作中使用Word時遇到的問題 176
7.2.1 批量轉(zhuǎn)換.doc文件為.docx文件 176
7.2.2 采用模板批量生成證書文件 178
7.2.3 批量統(tǒng)計文件頁數(shù)和字?jǐn)?shù) 181
7.2.4 批量轉(zhuǎn)換Word文件為PDF文件 183
第8章 演示利器PPT——操作PPT文檔 186
8.1 訪問PowerPoint文檔庫——python-pptx庫 186
8.1.1 PPT中的基本概念 187
8.1.2 python-pptx庫中的那些對象 188
8.1.3 創(chuàng)建PPT文檔 189
8.1.4 添加更多的幻燈片 190
8.1.5 在PPT幻燈片中添加表格 192
8.1.6 在PPT幻燈片中添加圖表 195
8.2 解決在工作中使用PPT時遇到的實際問題 197
8.2.1 批量轉(zhuǎn)換.ppt文檔為.pptx文檔 197
8.2.2 批量轉(zhuǎn)換PPT文檔為PDF文件 199
第9章 操作跨平臺的文件格式——PDF文件 201
9.1 PDF文件的優(yōu)勢 201
9.2 操作PDF文件庫——PyPDF2庫 202
9.2.1 PyPDF2庫中的對象 202
9.2.2 讀取PDF文件的內(nèi)容 202
9.2.3 拆分PDF文件 204
9.2.4 用更多的方法拆分PDF文件 205
9.2.5 合并PDF文件 207
9.2.6 對PDF文件批量添加水印 208
9.2.7 批量加密PDF文件 211
9.2.8 批量解密PDF文件 213
9.2.9 暴力破解PDF文件的密碼 214
9.3 解析PDF文件庫——pdfplumber庫 216
9.3.1 提取PDF文件中的文本信息 216
9.3.2 提取PDF文件中的表格信息 217
第10章 有圖有真相——批量處理圖像文件 218
10.1 圖像處理庫——Pillow庫 218
10.1.1 讀取圖像文件的信息 219
10.1.2 我想要png文件——批量轉(zhuǎn)換圖像格式 221
10.1.3 批量設(shè)置圖像的大小 222
10.2 旋轉(zhuǎn)圖像 225
10.3 添加水印 226
10.4 生成各種各樣的“碼” 228
10.4.1 批量生成二維碼 228
10.4.2 批量生成條碼 231
第11章 坐在旁邊喝點茶——RPA(機器人流程自動化) 234
11.1 自動化Windows GUI庫——pywinauto庫 234
11.1.1 如何使用pywinauto庫 235
11.1.2 在記事本中自動輸入信息 240
11.2 微信客服機器人 242
第12章 給你的程序穿上“馬甲”——使用GUI庫 247
12.1 為什么選擇Tkinter 247
12.1.1 編寫第一個Tkinter程序 248
12.1.2 為按鈕添加事件處理功能 249
12.2 布局管理 250
12.2.1 pack布局的更多屬性 251
12.2.2 grid布局 252
12.3 工作中常用的控件 253
12.3.1 使用messagebox 253
12.3.2 進度條 256
12.3.3 文件選擇器 259
第13章 將Python程序打包成.exe文件 263
13.1 安裝auto-py-to-exe工具 264
13.2 使用auto-py-to-exe工具 265
13.3 打包成單個文件還是目錄 268
13.4 包含資源文件怎么辦 268