大數(shù)據(jù)處理技術(shù)與應(yīng)用
定 價(jià):49 元
- 作者:彭進(jìn)香、張莉
- 出版時(shí)間:2020/8/1
- ISBN:9787302553731
- 出 版 社:清華大學(xué)出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:248
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16K
《大數(shù)據(jù)處理技術(shù)與應(yīng)用》對(duì)大數(shù)據(jù)的概念、挖掘、應(yīng)用進(jìn)行了系統(tǒng)的介紹,并且配備了相關(guān)的案例以及實(shí)際操作過(guò)程。這種理論與實(shí)踐相結(jié)合的方式能夠極大地幫助讀者掌握大數(shù)據(jù)領(lǐng)域的相關(guān)理論知識(shí)。
《大數(shù)據(jù)處理技術(shù)與應(yīng)用》共分為10章,主要內(nèi)容包含互聯(lián)網(wǎng)大數(shù)據(jù)概述、互聯(lián)網(wǎng)大數(shù)據(jù)采集與獲取實(shí)戰(zhàn)要領(lǐng)、做好數(shù)據(jù)預(yù)處理的實(shí)戰(zhàn)方法、數(shù)據(jù)相關(guān)性分析與回歸分析的黃金法則、如何利用關(guān)聯(lián)規(guī)則進(jìn)行大數(shù)據(jù)挖掘、大數(shù)據(jù)分析中的四種常見(jiàn)分類(lèi)算法、大數(shù)據(jù)分析中的四種常見(jiàn)聚類(lèi)算法,以及自組織神經(jīng)網(wǎng)絡(luò)算法與人工神經(jīng)網(wǎng)絡(luò)算法、互聯(lián)網(wǎng)大數(shù)據(jù)分析應(yīng)用——產(chǎn)品個(gè)性化推薦系統(tǒng)、大數(shù)據(jù)分析在具體行業(yè)中的應(yīng)用等。
《大數(shù)據(jù)處理技術(shù)與應(yīng)用》知識(shí)體系完善且適用,可作為高等院校大數(shù)據(jù)、人工智能等相關(guān)專(zhuān)業(yè)課程的教材,也可作為從事數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)工作以及其他相關(guān)工程技術(shù)工作人員的參考書(shū)。
這是一個(gè)互聯(lián)網(wǎng)技術(shù)及應(yīng)用高速發(fā)展的時(shí)代,那些隨手可得的互聯(lián)網(wǎng)應(yīng)用深刻影響著社會(huì)經(jīng)濟(jì)的發(fā)展,切實(shí)改變了人們生活的方方面面,互聯(lián)網(wǎng)已然成為人們不可或缺的信息工具。與此同時(shí),基于互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)數(shù)字化生活形態(tài)的形成,使得互聯(lián)網(wǎng)數(shù)據(jù)逐漸累積,因此大數(shù)據(jù)就成為互聯(lián)網(wǎng)時(shí)代的產(chǎn)物!酢酢酢跫瘓F(tuán)創(chuàng)始人馬云在演講中就提到,未來(lái)的時(shí)代將不是IT時(shí)代,而是DT的時(shí)代。DT就是Data Technology(數(shù)據(jù)技術(shù)),說(shuō)明大數(shù)據(jù)對(duì)于□□□□集團(tuán)來(lái)說(shuō)舉足輕重。
有媒體稱(chēng):數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟(jì)資產(chǎn)類(lèi)別,就像黃金和貨幣一樣!鑒于大數(shù)據(jù)巨大的商業(yè)價(jià)值,大數(shù)據(jù)專(zhuān)家在企業(yè)非常受重視。大數(shù)據(jù)處理的相關(guān)知識(shí)、技術(shù)及其應(yīng)用與社會(huì)經(jīng)濟(jì)各個(gè)領(lǐng)域的融合越來(lái)越深入,相關(guān)領(lǐng)域的專(zhuān)業(yè)技術(shù)人員迫切需要建立完整的互聯(lián)網(wǎng)大數(shù)據(jù)處理與應(yīng)用的知識(shí)體系,以適應(yīng)大數(shù)據(jù)發(fā)展趨勢(shì)的要求。
本書(shū)內(nèi)容以大數(shù)據(jù)理論基礎(chǔ)、大數(shù)據(jù)處理的實(shí)踐技術(shù)方法和大數(shù)據(jù)技術(shù)的具體應(yīng)用為主線(xiàn)。本書(shū)內(nèi)容結(jié)構(gòu)清晰,案例多樣且時(shí)效性強(qiáng),致力于通過(guò)理論及案例的講解幫助讀者掌握大數(shù)據(jù)處理及應(yīng)用等方面的實(shí)戰(zhàn)方法,以達(dá)到“真正掌握互聯(lián)網(wǎng)大數(shù)據(jù)處理及應(yīng)用實(shí)戰(zhàn)方法”的效果。
本書(shū)由湖南應(yīng)用技術(shù)學(xué)院信息工程學(xué)院彭進(jìn)香、張莉撰寫(xiě),作者團(tuán)隊(duì)對(duì)互聯(lián)網(wǎng)企業(yè)從事數(shù)據(jù)挖掘有較深的研究,在大數(shù)據(jù)挖掘、分析及實(shí)戰(zhàn)場(chǎng)景應(yīng)用方面具有深厚經(jīng)驗(yàn)。本書(shū)支持項(xiàng)目為湖南應(yīng)用技術(shù)學(xué)院“十三五”校級(jí)首批重點(diǎn)建設(shè)學(xué)科:計(jì)算機(jī)應(yīng)用技術(shù),學(xué)科代碼為081203,項(xiàng)目編號(hào)為XKJSHY2017-3。在本書(shū)寫(xiě)作過(guò)程中,作者還借鑒了目前大數(shù)據(jù)相關(guān)領(lǐng)域的參考資料、文獻(xiàn)及重要研究成果與案例,在此向相關(guān)文獻(xiàn)資料的作者一并表示感謝!
由于作者水平有限,書(shū)中難免有疏漏或錯(cuò)誤之處,敬請(qǐng)廣大讀者批評(píng)指正。
章 互聯(lián)網(wǎng)大數(shù)據(jù)概述
1.1 認(rèn)識(shí)大數(shù)據(jù)
1.1.1 大數(shù)據(jù)的定義
1.1.2 大數(shù)據(jù)的特征
1.1.3 未來(lái)十年大數(shù)據(jù)分析的發(fā)展趨勢(shì)
1.2 常用大數(shù)據(jù)處理、分析工具介紹
1.2.1 大數(shù)據(jù)的存儲(chǔ)工具
1.2.2 大數(shù)據(jù)的軟件開(kāi)發(fā)工具
1.2.3 大數(shù)據(jù)的挖掘工具
1.2.4 大數(shù)據(jù)的可視化工具
小結(jié)
第2章 互聯(lián)網(wǎng)大數(shù)據(jù)采集與獲取實(shí)戰(zhàn)要領(lǐng)
2.1 互聯(lián)網(wǎng)大數(shù)據(jù)采集與處理技術(shù)概述
2.1.1 數(shù)據(jù)采集的基本流程與關(guān)鍵技術(shù)
2.1.2 數(shù)據(jù)處理的基本流程與關(guān)鍵技術(shù)
2.2 Web頁(yè)面數(shù)據(jù)獲取實(shí)戰(zhàn)方法
2.2.1 Jsoup技術(shù)與頁(yè)面數(shù)據(jù)獲取
2.2.2 應(yīng)對(duì)特定領(lǐng)域的Deep Web數(shù)據(jù)獲取技術(shù)
2.3 利用爬蟲(chóng)抓取互聯(lián)網(wǎng)大數(shù)據(jù)實(shí)戰(zhàn)技巧
2.3.1 Python爬蟲(chóng)工作原理
2.3.2 利用HtmlParser實(shí)現(xiàn)網(wǎng)頁(yè)鏈接的提取實(shí)戰(zhàn)
小結(jié)
第3章 做好數(shù)據(jù)預(yù)處理的實(shí)戰(zhàn)方法
3.1 數(shù)據(jù)預(yù)處理概述
3.1.1 數(shù)據(jù)預(yù)處理的目的
3.1.2 數(shù)據(jù)預(yù)處理的方法
3.2 從問(wèn)題分析到數(shù)據(jù)清洗實(shí)戰(zhàn)策略
3.2.1 數(shù)據(jù)清洗的步驟
3.2.2 缺失值的識(shí)別與處理技巧
3.2.3 異常值的判斷、檢驗(yàn)與處理
3.3 數(shù)據(jù)集成與數(shù)據(jù)轉(zhuǎn)換實(shí)戰(zhàn)方法
3.3.1 數(shù)據(jù)集成常見(jiàn)方法
3.3.2 數(shù)據(jù)轉(zhuǎn)換過(guò)程中的離散化
3.4 數(shù)據(jù)的特征選擇
3.4.1 常用數(shù)據(jù)特征選擇方法
3.4.2 Relief算法與費(fèi)希爾判別法的應(yīng)用
3.5 數(shù)據(jù)預(yù)處理實(shí)戰(zhàn)案例分析
小結(jié)
第4章 數(shù)據(jù)相關(guān)性分析與回歸分析的黃金法則
4.1 什么是數(shù)據(jù)集
4.1.1 數(shù)據(jù)集的概念與常見(jiàn)類(lèi)型
4.1.2 高效進(jìn)行數(shù)據(jù)度量的實(shí)戰(zhàn)技巧
4.2 做好數(shù)據(jù)相關(guān)性分析
4.2.1 進(jìn)行數(shù)據(jù)相關(guān)性分析的作用
4.2.2 常用的數(shù)據(jù)相關(guān)分析方法
4.3 做好數(shù)據(jù)回歸分析實(shí)戰(zhàn)要領(lǐng)
4.3.1 數(shù)據(jù)回歸分析方法概述
4.3.2 數(shù)據(jù)回歸分析所能解決的實(shí)際問(wèn)題
小結(jié)
第5章 如何利用關(guān)聯(lián)規(guī)則進(jìn)行大數(shù)據(jù)挖掘
5.1 關(guān)聯(lián)規(guī)則
5.1.1 什么是關(guān)聯(lián)規(guī)則
5.1.2 關(guān)聯(lián)規(guī)則挖掘的應(yīng)用場(chǎng)景
5.2 關(guān)聯(lián)規(guī)則挖掘?qū)崙?zhàn)流程分析
5.2.1 關(guān)聯(lián)規(guī)則常見(jiàn)分類(lèi)與四個(gè)基本屬性
5.2.2 快速找出□大高頻項(xiàng)目組的實(shí)戰(zhàn)技巧
5.3 關(guān)聯(lián)規(guī)則發(fā)掘中重要的Apriori算法
5.3.1 Apriori算法的基本原理
5.3.2 Apriori算法運(yùn)行的基本流程
5.4 針對(duì)Apriori算法缺點(diǎn)的其他關(guān)聯(lián)規(guī)則挖掘算法
5.4.1 Apriori算法的兩大缺點(diǎn)
5.4.2 基于劃分規(guī)則的算法
5.4.3 FP-Growth算法
小結(jié)
第6章 大數(shù)據(jù)分析中的四種常見(jiàn)分類(lèi)算法
6.1 分類(lèi)算法概述
6.1.1 有關(guān)分類(lèi)算法的基本概念
6.1.2 分類(lèi)算法的常見(jiàn)應(yīng)用場(chǎng)景
6.2 KNN算法
6.2.1 KNN算法的工作原理與特點(diǎn)
6.2.2 快速找到□優(yōu)k值的實(shí)用策略
6.3 決策樹(shù)與隨機(jī)森林算法
6.3.1 決策樹(shù)算法
6.3.2 Bagging與Boosting的區(qū)別
6.3.3 隨機(jī)森林分類(lèi)算法的優(yōu)勢(shì)與應(yīng)用場(chǎng)景
6.4 樸素貝葉斯分類(lèi)算法
6.4.1 樸素貝葉斯分類(lèi)算法運(yùn)行原理分析
6.4.2 貝葉斯網(wǎng)絡(luò)
6.4.3 貝葉斯決策理論
6.5 支持向量機(jī)
6.5.1 支持向量機(jī)的基本思想與特點(diǎn)
6.5.2 □優(yōu)分類(lèi)面和廣義□優(yōu)分類(lèi)面
6.5.3 非線(xiàn)性支持向量機(jī)與核函數(shù)
小結(jié)
第7章 大數(shù)據(jù)分析中的四種常見(jiàn)聚類(lèi)算法
7.1 大數(shù)據(jù)分析聚類(lèi)算法概述
7.1.1 聚類(lèi)分析的相關(guān)概念及應(yīng)用場(chǎng)景
7.1.2 聚類(lèi)算法運(yùn)行基礎(chǔ):簇與距離度量
……
第8章 自組織神經(jīng)網(wǎng)絡(luò)算法與人工神經(jīng)網(wǎng)絡(luò)算法
第9章 互聯(lián)網(wǎng)大數(shù)據(jù)分析應(yīng)用產(chǎn)品個(gè)性化推薦系統(tǒng)
□□0章 大數(shù)據(jù)分析在具體行業(yè)中的應(yīng)用
參考文獻(xiàn)