關于我們
書單推薦
新書推薦
|
Hadoop+Spark大數(shù)據(jù)分析實戰(zhàn) 本書是Hadoop Spark大數(shù)據(jù)分析技術入門書,基于Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop Spark原生態(tài)組件的原理、集群搭建、實戰(zhàn)操作,以及整個Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)分析技術。 本書共分14章。第1章講解Hadoop框架及新版本特性,并詳細講解大數(shù)據(jù)分析環(huán)境的搭建工作,包括Linux操作系統(tǒng)的安裝、SSH工具使用和配置等;第2章講解Hadoop偽分布式的安裝和開發(fā)體驗,使讀者熟悉Hadoop大數(shù)據(jù)開發(fā)兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態(tài)系統(tǒng)各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數(shù)據(jù)實時處理系統(tǒng)Flume,以及Spark框架數(shù)據(jù)處理、機器學習等實戰(zhàn)技術,并通過實際案例加深對各個框架的理解與應用;第13~14章分別通過影評分析、旅游酒店評價分析實戰(zhàn)項目來貫穿大數(shù)據(jù)分析的完整流程。 本書可以作為大數(shù)據(jù)分析初學者的入門指導書,也可以作為大數(shù)據(jù)開發(fā)人員的參考手冊,同時也適合作為高等院校大數(shù)據(jù)相關專業(yè)的教材或教學參考書。
你還可能感興趣
我要評論
|