Python數(shù)據(jù)分析與實(shí)踐
定 價(jià):59 元
叢書(shū)名:大數(shù)據(jù)與人工智能技術(shù)叢書(shū)
- 作者:柳毅、毛峰、李藝
- 出版時(shí)間:2019/7/1
- ISBN:9787302515791
- 出 版 社:清華大學(xué)出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
Python是信息管理與信息系統(tǒng)、電子商務(wù)等信息管理類(lèi)本科學(xué)生進(jìn)行數(shù)據(jù)分析所需要掌握的基礎(chǔ)性語(yǔ)言和分析工具,是未來(lái)學(xué)生掌握大數(shù)據(jù)分析技術(shù)的學(xué)習(xí)基礎(chǔ)。本書(shū)共分12章,著重講述Python語(yǔ)言和數(shù)據(jù)分析工具包的應(yīng)用。
第1章主要介紹Python的發(fā)展歷史、特點(diǎn)、集成開(kāi)發(fā)環(huán)境、內(nèi)置模塊、幫助的使用等內(nèi)容; 第2章主要介紹Python語(yǔ)言的基礎(chǔ)知識(shí); 第3章主要介紹Python中的常用數(shù)據(jù)結(jié)構(gòu),包括序列、字典、集合等,以及函數(shù)的定義和調(diào)用等; 第4章主要介紹Python中類(lèi)、對(duì)象和方法的相關(guān)內(nèi)容; 第5章主要介紹Python進(jìn)行數(shù)據(jù)分析常用的NumPy、Pandas、Matplotlib、SciPy和Scikitlearn等基礎(chǔ)庫(kù)內(nèi)容; 第6章主要介紹網(wǎng)絡(luò)數(shù)據(jù)獲取的HTML和XML兩種網(wǎng)頁(yè)組織形式,以及urllib和BeautifulSoup4兩個(gè)模塊內(nèi)容; 第7章主要介紹文件的操作; 第8章主要介紹數(shù)據(jù)可視化,以及使用Python繪制圖表的知識(shí); 第9章主要介紹利用Python進(jìn)行數(shù)據(jù)庫(kù)應(yīng)用開(kāi)發(fā); 第10、11章主要介紹Python機(jī)器學(xué)習(xí)的基本概念以及有監(jiān)督、無(wú)監(jiān)督學(xué)習(xí)算法的原理; 第12章主要介紹Python在地理空間分析上的應(yīng)用。本書(shū)中的代碼均在Python 3.5中測(cè)試通過(guò)。
本書(shū)一方面?zhèn)戎貙?duì)Python數(shù)據(jù)分析基礎(chǔ)知識(shí)的講解,另一方面注重Python數(shù)據(jù)處理方法的應(yīng)用。本書(shū)適合作為計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)學(xué)生學(xué)習(xí)數(shù)據(jù)分析的入門(mén)教材,也適合作為Python愛(ài)好者的參考書(shū)。
本書(shū)一方面?zhèn)戎豍ython數(shù)據(jù)分析基礎(chǔ)知識(shí)的講解,另一方面?zhèn)戎乩肞ython數(shù)據(jù)處理方法的應(yīng)用。本書(shū)適合可作為計(jì)算機(jī)程序設(shè)計(jì)的入門(mén)教材或Python愛(ài)好者的參考書(shū)。
前言
Python是大數(shù)據(jù)時(shí)代非常受歡迎的數(shù)據(jù)分析編程語(yǔ)言,近年來(lái)隨著機(jī)器學(xué)習(xí)、云計(jì)算、人工智能等技術(shù)的發(fā)展,Python的流行趨勢(shì)扶搖直上,已經(jīng)成為數(shù)據(jù)分析和數(shù)據(jù)科學(xué)事實(shí)上的標(biāo)準(zhǔn)語(yǔ)言和標(biāo)準(zhǔn)平臺(tái)之一。
本書(shū)針對(duì)數(shù)據(jù)分析人員和Python編程學(xué)習(xí)者進(jìn)行內(nèi)容編排和章節(jié)講述,Python數(shù)據(jù)分析整個(gè)學(xué)習(xí)路線(xiàn)圖計(jì)劃分成16周,120天左右。本書(shū)主要內(nèi)容包括以下五大部分。
(1) Python工作環(huán)境及基礎(chǔ)語(yǔ)法知識(shí): 認(rèn)識(shí)Python程序運(yùn)行方式,使用Python 3.5開(kāi)發(fā)集成環(huán)境與工具; 學(xué)習(xí)Python程序基本結(jié)構(gòu),理解Python的面向?qū)ο蠖x和類(lèi)、對(duì)象的操作方法,以及Python異常處理機(jī)制。本部分為基礎(chǔ)內(nèi)容,建議學(xué)習(xí)時(shí)間為4周。
(2) Python數(shù)據(jù)分析相關(guān)知識(shí): Python生態(tài)系統(tǒng)為數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家提供了各種程序庫(kù),例如NumPy、SciPy、Pandas和Matplotlib,使其在數(shù)據(jù)分析領(lǐng)域也有廣泛的應(yīng)用。Python數(shù)據(jù)分析的學(xué)習(xí)主要是對(duì)相關(guān)庫(kù)的使用,例如數(shù)據(jù)整理需要用到NumPy庫(kù),數(shù)據(jù)描述與分析則主要用到Pandas庫(kù)。由于有前面的學(xué)習(xí)基礎(chǔ),本部分學(xué)習(xí)時(shí)間建議為3周。
(3) Python數(shù)據(jù)可視化: Python數(shù)據(jù)可視化的過(guò)程就是學(xué)習(xí)Matplotlib庫(kù)的過(guò)程,Matplotlib庫(kù)包含豐富的數(shù)據(jù)可視化資源,地圖、3D等都有涉及,基于前面兩部分的學(xué)習(xí)經(jīng)驗(yàn),這部分內(nèi)容在兩周內(nèi)基本可以完成。
(4) Python機(jī)器學(xué)習(xí): Scikitlearn是本書(shū)所使用的核心程序庫(kù),依托于上述幾種工具包,封裝了大量的經(jīng)典以及最新的機(jī)器學(xué)習(xí)模型。通過(guò)介紹有監(jiān)督和無(wú)監(jiān)督機(jī)器學(xué)習(xí)原理,學(xué)習(xí)有監(jiān)督學(xué)習(xí)的線(xiàn)性回歸、Logistic回歸、樸素貝葉斯、SVM、KNN和決策樹(shù)等幾個(gè)常用算法,以及無(wú)監(jiān)督學(xué)習(xí)的KMeans聚類(lèi)算法。在前面三部分學(xué)習(xí)的基礎(chǔ)上,本部分內(nèi)容建議學(xué)習(xí)時(shí)間在4周左右。
(5) Python地理空間數(shù)據(jù)分析應(yīng)用: 向讀者介紹地理空間分析的基本概念和常用的地理空間數(shù)據(jù),然后介紹Python中與地理數(shù)據(jù)處理和地理分析相關(guān)的工具,最后以Python處理和分析矢量數(shù)據(jù)與柵格數(shù)據(jù)的方法,對(duì)浙江省實(shí)施的五水共治行動(dòng)中劣五類(lèi)水體在地理空間模型上分布的衛(wèi)星圖像數(shù)據(jù)進(jìn)行可視化數(shù)據(jù)分析的綜合應(yīng)用,本部分內(nèi)容建議學(xué)習(xí)時(shí)間為3周。
本書(shū)編寫(xiě)人員具有豐富的Python數(shù)據(jù)分析實(shí)踐經(jīng)驗(yàn)和多年的信息管理教學(xué)能力,第1~3章由沈陽(yáng)工業(yè)大學(xué)李藝?yán)蠋熅帉?xiě); 第4~7、10章由杭州電子科技大學(xué)柳毅老師編寫(xiě); 第8、9、11、12章由杭州電子科技大學(xué)毛峰老師編寫(xiě); 王健、陸佳渙等碩士研究生參與了本書(shū)相關(guān)章節(jié)內(nèi)容和程序代碼的完善工作; 浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長(zhǎng)、國(guó)家教學(xué)名師王萬(wàn)良教授對(duì)本書(shū)進(jìn)行了認(rèn)真的審閱,并提出許多寶貴的建設(shè)性意見(jiàn),使本書(shū)內(nèi)容日臻完善,在此對(duì)他們所付出的辛勤勞動(dòng)表示誠(chéng)摯的感謝。
本書(shū)結(jié)合大數(shù)據(jù)管理與應(yīng)用的最新發(fā)展,針對(duì)計(jì)算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、電子商務(wù)等經(jīng)管類(lèi)本科教學(xué)特點(diǎn)進(jìn)行撰寫(xiě)。本書(shū)提供教學(xué)課件、教學(xué)大綱、電子教案、習(xí)題答案和程序源碼,讀者可以?huà)呙璺獾椎恼n件二維碼下載。本書(shū)還提供400分鐘的視頻講解,掃描書(shū)中的二維碼,可以在線(xiàn)觀看。
由于編者水平所限,書(shū)中難免有疏漏之處,敬請(qǐng)讀者批評(píng)指正。
編者2019年3月
目錄
第1章Python簡(jiǎn)介
1.1Python語(yǔ)言的發(fā)展史
1.1.1Python語(yǔ)言的特點(diǎn)
1.1.2Python 2與Python 3的區(qū)別
1.2Python的環(huán)境搭建
1.3開(kāi)始使用Python IDLE
1.3.1交互方式
1.3.2Python的集成開(kāi)發(fā)環(huán)境
1.4Eclipse PyDev的安裝
1.5代碼風(fēng)格
1.6使用幫助
本章小結(jié)
習(xí)題
第2章Python語(yǔ)言基礎(chǔ)知識(shí)
2.1標(biāo)識(shí)符與變量
2.1.1標(biāo)識(shí)符
2.1.2變量
2.2數(shù)據(jù)類(lèi)型及運(yùn)算
2.2.1數(shù)據(jù)類(lèi)型
2.2.2運(yùn)算符和表達(dá)式
2.3分支結(jié)構(gòu)控制語(yǔ)句
2.3.1if語(yǔ)句
2.3.2ifelse語(yǔ)句
2.3.3ifelifelse語(yǔ)句
2.4循環(huán)語(yǔ)句
2.4.1循環(huán)結(jié)構(gòu)控制語(yǔ)句
2.4.2循環(huán)嵌套控制語(yǔ)句
2.4.3break語(yǔ)句和continue語(yǔ)句
2.4.4range()函數(shù)
2.5常見(jiàn)的Python函數(shù)
本章小結(jié)
習(xí)題
第3章數(shù)據(jù)結(jié)構(gòu)與函數(shù)設(shè)計(jì)
3.1序列
3.1.1列表
3.1.2元組
3.1.3字符串
3.1.4列表與元組之間的轉(zhuǎn)換
3.2字典
3.2.1創(chuàng)建字典
3.2.2字典的方法
3.2.3列表、元組與字典之間的轉(zhuǎn)換
3.3集合
3.3.1集合的創(chuàng)建
3.3.2集合的運(yùn)算
3.3.3集合的方法
3.4函數(shù)的定義
3.4.1函數(shù)的調(diào)用
3.4.2形參與實(shí)參
3.4.3函數(shù)的返回
3.4.4位置參數(shù)
3.4.5默認(rèn)參數(shù)與關(guān)鍵字參數(shù)
3.4.6可變長(zhǎng)度參數(shù)
本章小結(jié)
習(xí)題
第4章類(lèi)與對(duì)象
4.1面向?qū)ο?br />
4.1.1面向?qū)ο缶幊?br />
4.1.2類(lèi)的抽象與封裝
4.2認(rèn)識(shí)Python中的類(lèi)、對(duì)象和方法
4.2.1類(lèi)的定義與創(chuàng)建
4.2.2構(gòu)造函數(shù)
4.3類(lèi)的屬性
4.3.1類(lèi)屬性和實(shí)例屬性
4.3.2公有屬性和私有屬性
4.4類(lèi)的方法
4.4.1類(lèi)方法的調(diào)用
4.4.2類(lèi)方法的分類(lèi)
4.4.3析構(gòu)函數(shù)
4.5類(lèi)的繼承
4.5.1父類(lèi)與子類(lèi)
4.5.2繼承的語(yǔ)法
4.5.3多重繼承
4.5.4運(yùn)算符的重載
4.6類(lèi)的組合
4.7類(lèi)的異常處理
4.7.1異常
4.7.2Python中的異常類(lèi)
4.7.3捕獲與處理異常
4.7.4自定義異常類(lèi)
4.7.5with語(yǔ)句
4.7.6斷言
本章小結(jié)
習(xí)題
案例
第5章Python數(shù)據(jù)分析基礎(chǔ)庫(kù)
5.1NumPy
5.1.1ndarray的數(shù)據(jù)類(lèi)型
5.1.2數(shù)組和標(biāo)量之間的運(yùn)算
5.1.3索引和切片
5.1.4數(shù)組轉(zhuǎn)置和軸對(duì)換
5.1.5利用數(shù)組進(jìn)行數(shù)據(jù)處理
5.1.6數(shù)學(xué)和統(tǒng)計(jì)方法
5.2Pandas
5.2.1Pandas數(shù)據(jù)結(jié)構(gòu)
5.2.2Pandas文件操作
5.2.3數(shù)據(jù)處理
5.2.4層次化索引
5.2.5分級(jí)順序
5.2.6使用DataFrame的列
5.3Matplotlib
5.3.1figure和subplot
5.3.2調(diào)整subplot周?chē)拈g距
5.3.3顏色、標(biāo)記和線(xiàn)型
5.3.4刻度標(biāo)簽和圖例
5.3.5添加圖例
5.3.6將圖表保存到文件
5.4SciPy
5.5Scikitlearn
本章小結(jié)
習(xí)題
第6章網(wǎng)絡(luò)數(shù)據(jù)的獲取
6.1網(wǎng)頁(yè)數(shù)據(jù)的組織形式
6.1.1HTML
6.1.2HTML元素
6.1.3HTML屬性
6.2XML
6.2.1XML的結(jié)構(gòu)和語(yǔ)法
6.2.2XML元素和屬性
6.3利用urllib處理HTTP
6.4利用BeautifulSoup4解析HTML文檔
6.4.1BeautifulSoup4中的對(duì)象
6.4.2遍歷文檔樹(shù)
6.4.3搜索文檔樹(shù)
本章小結(jié)
習(xí)題
第7章文件操作
7.1文件的打開(kāi)和關(guān)閉
7.1.1打開(kāi)文件
7.1.2關(guān)閉文件
7.2讀寫(xiě)文件
7.2.1從文件讀取數(shù)據(jù)
7.2.2向文件寫(xiě)入數(shù)據(jù)
7.3文件對(duì)話(huà)框
7.3.1基于win32ui構(gòu)建文件對(duì)話(huà)框
7.3.2基于tkFileDialog構(gòu)建文件對(duì)話(huà)框
7.4應(yīng)用實(shí)例: 文本文件的操作
本章小結(jié)
習(xí)題
第8章Python數(shù)據(jù)可視化
8.1數(shù)據(jù)可視化概念框架
8.1.1數(shù)據(jù)可視化簡(jiǎn)介
8.1.2數(shù)據(jù)可視化常用圖表
8.1.3Python數(shù)據(jù)可視化環(huán)境準(zhǔn)備
8.2繪制圖表
8.2.1Matplotlib API入門(mén)
8.2.2創(chuàng)建圖表
8.2.3圖表定制
8.2.4保存圖表
8.3更多高級(jí)圖表及定制
8.3.1樣式
8.3.2subplot子區(qū)
8.3.3圖表顏色和填充
8.3.4動(dòng)畫(huà)
本章小結(jié)
習(xí)題
第9章數(shù)據(jù)庫(kù)應(yīng)用開(kāi)發(fā)
9.1Python與數(shù)據(jù)庫(kù)
9.1.1數(shù)據(jù)庫(kù)簡(jiǎn)介
9.1.2Python數(shù)據(jù)庫(kù)工作環(huán)境
9.2本地?cái)?shù)據(jù)庫(kù)SQLite
9.2.1SQLite簡(jiǎn)介
9.2.2Python內(nèi)置的sqlite3模塊
9.3關(guān)系型數(shù)據(jù)庫(kù)
9.3.1關(guān)系型數(shù)據(jù)庫(kù)基本操作與SQL
9.3.2操作MySQL
9.4非關(guān)系型數(shù)據(jù)庫(kù)
9.4.1NoSQL介紹
9.4.2MongoDB
9.4.3PyMongo: MongoDB和Python
習(xí)題
第10章機(jī)器學(xué)習(xí)有監(jiān)督學(xué)習(xí)
10.1機(jī)器學(xué)習(xí)簡(jiǎn)介
10.2Python機(jī)器學(xué)習(xí)庫(kù)Scikitlearn
10.3有監(jiān)督學(xué)習(xí)
10.3.1線(xiàn)性回歸
10.3.2Logistic回歸分類(lèi)器
10.3.3樸素貝葉斯分類(lèi)器
10.3.4支持向量機(jī)
10.3.5KNN算法
10.3.6決策樹(shù)
本章小結(jié)
習(xí)題
第11章機(jī)器學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)
11.1無(wú)監(jiān)督學(xué)習(xí)
11.2聚類(lèi)
11.2.1相異度
11.2.2KMeans算法
11.2.3DBSCAN算法
11.3關(guān)聯(lián)規(guī)則
11.3.1關(guān)聯(lián)分析
11.3.2Apriori算法
11.3.3FPgrowth算法
本章小結(jié)
習(xí)題
第12章Python地理空間分析
12.1地理空間分析簡(jiǎn)介
12.1.1地理空間分析的基本概念
12.1.2地理空間分析與Python
12.2地理空間數(shù)據(jù)
12.2.1數(shù)據(jù)格式概覽
12.2.2數(shù)據(jù)特征
12.2.3矢量數(shù)據(jù)
12.2.4柵格數(shù)據(jù)
12.3Python地理空間分析工具
12.3.1GeoJSON
12.3.2GDAL和OGR
12.3.3PyShp
12.3.4PIL
12.3.5GeoPandas
12.4Python分析矢量數(shù)據(jù)
12.4.1訪問(wèn)矢量數(shù)據(jù)
12.4.2Shapefile文件操作
12.4.3空間查詢(xún)
12.4.4疊加分析
12.5Python與遙感
12.5.1訪問(wèn)影像文件
12.5.2影像裁剪
12.5.3重采樣
12.5.4影像分類(lèi)
12.6五水共治資源地理空間分析綜合應(yīng)用
本章小結(jié)
習(xí)題