精品国产18久久久久久,精品999久久久久久中文字幕,久99久精品免费视频热

本書采用理論實戰(zhàn)的形式編寫，全面介紹了Hadoop大數(shù)據(jù)挖掘的相關(guān)知識。本書共分為13章，涵蓋的主要內(nèi)容有：集群及開發(fā)環(huán)境搭建；快速構(gòu)建一個Hadoop項目并線上運行；Hadoop套件實戰(zhàn)；Hive編程使用SQL提交MapReduce任務(wù)到Hadoop集群；游戲玩家的用戶行為分析特征提��；Hadoop平臺管理與維護；Hadoop異常處理解決方案；初識Hadoop核心源碼；Hadoop通信機制和內(nèi)部協(xié)議；Hadoop分布式文件系統(tǒng)剖析；ELK實戰(zhàn)案例游戲應(yīng)用實時日志分析平臺；Kafka實戰(zhàn)案例實時處理游戲用戶數(shù)據(jù)；Hadoop拓展Kafka剖析。本書不但適合剛?cè)腴T的初學者系統(tǒng)學習Hadoop的各種基礎(chǔ)語法和開發(fā)技巧，而且也適合有多年開發(fā)經(jīng)驗的開發(fā)者進階提高。另外，本書也適合社會培訓機構(gòu)和相關(guān)院校作為教材或者教學參考書。

前言　　大數(shù)據(jù)時代，數(shù)據(jù)的存儲與挖掘至關(guān)重要。企業(yè)在追求高可靠性、高擴展性及高容錯性的大數(shù)據(jù)處理平臺的同時還希望能夠降低成本，而Hadoop為實現(xiàn)這些需求提供了解決方案。
　　Hadoop在分布式計算與存儲上具有先天優(yōu)勢。它作為Apache軟件基金會的頂級開源項目，其版本迭代持續(xù)至今，而且已經(jīng)擁有一個非�；钴S的社區(qū)和全球眾多開發(fā)者，并且成為了當前非常流行的大數(shù)據(jù)處理平臺。很多公司，特別是互聯(lián)網(wǎng)公司，都紛紛開始使用或者已經(jīng)使用Hadoop來做海量數(shù)據(jù)存儲與數(shù)據(jù)挖掘。
　　Hadoop簡單易學，其學習曲線平緩且學習周期短。它的操作命令和Linux命令非常相似。一個熟悉Linux的開發(fā)者只需要短短的一周時間，就可以學會Hadoop開發(fā)，完成一個高可用集群的部署和高可用應(yīng)用程序的編寫。
　　面對Hadoop的普及和學習熱潮，筆者愿意分享自己多年的開發(fā)經(jīng)驗，帶領(lǐng)讀者比較輕松地掌握Hadoop數(shù)據(jù)挖掘的相關(guān)知識。這便是筆者編寫本書的原因。本書使用通俗易懂的語言進行講解，從基礎(chǔ)部署到集群的管理，再到底層設(shè)計等內(nèi)容均有涉及。通過閱讀本書，讀者可以較為輕松地掌握Hadoop大數(shù)據(jù)挖掘與分析的相關(guān)技術(shù)。
本書特色　　1．提供專業(yè)的配套教學視頻，高效、直觀　　筆者曾接受過極客學院的專業(yè)視頻制作指導，并在極客學院錄制過多期Hadoop和Kafka實戰(zhàn)教學視頻課程，得到了眾多學習者的青睞及好評。為了便于讀者更加高效、直觀地學習本書內(nèi)容，筆者特意為本書實戰(zhàn)部分的內(nèi)容錄制了配套教學視頻，讀者可以在教學視頻的輔助下學習，從而更加輕松地掌握Hadoop。
　　2．分享大量來自一線的開發(fā)經(jīng)驗，貼近實際開發(fā)　　本書給出的代碼講解和實例大多數(shù)來自于筆者多年的教學積累和技術(shù)分享，幾乎都是得到了學習者一致好評的干貨。另外，筆者還是一名開源愛好者，編寫了業(yè)內(nèi)著名的Kafka Eagle監(jiān)控系統(tǒng)。本書第13章介紹了該系統(tǒng)的使用，以幫助讀者掌握如何監(jiān)控大數(shù)據(jù)集群的相關(guān)知識。
　　3．分享多個來自一線的實例，有很強的實用性　　本書精心挑選了多個實用性很強的例子，如Hadoop套件實戰(zhàn)、Hive編程、Hadoop平臺管理與維護、ELK實戰(zhàn)和Kafka實戰(zhàn)等。讀者不但可以從這些例子中學習和理解Hadoop及其套件的相關(guān)知識點，而且還可以將這些例子應(yīng)用于實際開發(fā)中。
　　4．講解通俗易懂，力爭觸類旁通，舉一反三　　本書用通俗易懂的語言講解，避免云山霧罩，讓讀者不知所云。書中在講解一些常用知識點時將Hadoop命令與Linux命令進行了對比，便于熟悉Linux命令的讀者能夠迅速掌握Hadoop的操作命令。
本書內(nèi)容　　第1章集群及開發(fā)環(huán)境搭建　　本章介紹的主要內(nèi)容包括：環(huán)境準備；安裝Hadoop；演示Hadoop版Hello World示例程序，以及搭建Hadoop開發(fā)環(huán)境。
　　第2章實戰(zhàn)：快速構(gòu)建一個Hadoop項目并線上運行　　本章首先介紹了快速構(gòu)建項目工程的方法，如Maven和Java Project；然后介紹了分布式文件系統(tǒng)的操作命令，以及利用IDE提交MapReduce作業(yè)的相關(guān)知識；最后介紹了編譯應(yīng)用程序并打包，以及部署與調(diào)度等內(nèi)容。
　　第3章 Hadoop套件實戰(zhàn)　　本章介紹了Hadoop生態(tài)圈中常見的大數(shù)據(jù)套件的背景知識和使用方法，涵蓋Sqoop、Flume、HBase、Zeppelin、Drill及Spark等套件。
　　第4章 Hive編程使用SQL提交MapReduce任務(wù)到Hadoop集群　　本章主要介紹了Hive數(shù)據(jù)倉庫的相關(guān)內(nèi)容：Hive底層設(shè)計組成；安裝和配置Hive；基于Hive應(yīng)用接口進行編程；開源監(jiān)控工具Hive Cube。
　　第5章游戲玩家的用戶行為分析特征提取　　本章首先對Hadoop的基礎(chǔ)知識進行了梳理；然后介紹了項目的背景和平臺架構(gòu)；接著對項目進行了整體分析與指標設(shè)計，并進行了技術(shù)選型；最后對分析的指標進行了編碼實踐。
　　第6章 Hadoop平臺管理與維護　　本章介紹了Hadoop平臺管理與維護的重要方法。本章首先介紹了Hadoop分布式文件系統(tǒng)的特性，然后介紹了HDFS的基礎(chǔ)命令，并對NameNode進行了解讀。另外，本章對Hadoop平臺維護時的常規(guī)操作，如節(jié)點管理、HDFS快照和安全模式等內(nèi)容也進行了講解。
　　第7章 Hadoop異常處理解決方案　　本章介紹了Hadoop異常處理解決方案的幾個知識點。主要內(nèi)容包括：跟蹤日志；分析異常信息；利用搜索引擎檢索關(guān)鍵字；查看Hadoop JIRA；閱讀Hadoop源代碼。
　　本章最后以實戰(zhàn)案例的形式分析了幾種異常情況：啟動HBase集群失��；HBase表查詢失敗；Spark的臨時數(shù)據(jù)不自動清理等。
　　第8章初識Hadoop核心源碼　　本章首先介紹了Hadoop源碼基礎(chǔ)環(huán)境準備及源代碼編譯；接著介紹了Hadoop的起源和兩代MapReduce框架間的差異；最后介紹了Hadoop的序列化機制。
　　第9章 Hadoop通信機制和內(nèi)部協(xié)議　　本章首先介紹了Hadoop通信模型和Hadoop RPC的特點；然后通過編碼實踐介紹了Hadoop RPC的使用，同時還介紹了與之類似的開源RPC框架；最后介紹了MapReduce的通信協(xié)議和RPC協(xié)議的實現(xiàn)過程。
　　第10章 Hadoop分布式文件系統(tǒng)剖析　　本章主要介紹了Hadoop分布式文件系統(tǒng)的設(shè)計特點、命令空間和節(jié)點、數(shù)據(jù)備份策略

你還可能感興趣

我要評論