關于我們
書單推薦
新書推薦
|
Spark 3.0大數據分析與挖掘:基于機器學習
Spark作為新興的、應用范圍廣泛的大數據處理開源框架,吸引了大量的大數據分析與挖掘從業(yè)人員進行相關內容的學習與開發(fā),其中ML是Spark 3.0機器學習框架使用的核心。本書用于Spark 3.0 ML大數據分析與挖掘入門,配套示例源碼、PPT課件、數據集、思維導圖、開發(fā)環(huán)境和作者答疑服務。
本書共分13章,從Spark 3.0大數據分析概述、基礎安裝和配置開始,依次介紹ML的DataFrame、ML的基本概念,以及協(xié)同過濾、線性回歸、分類、決策樹與隨機森林、聚類、關聯(lián)規(guī)則、數據降維、特征提取和轉換等數據處理方法;最后通過經典的鳶尾花分析實例,回顧前面的學習內容,實現了一個完整的數據分析與挖掘過程。 本書采取實例和理論相結合的方式,講解細致直觀,示例豐富,適合Spark 3.0機器學習初學者、大數據分析和挖掘人員,也適合高等院校和培訓機構人工智能與大數據相關專業(yè)的師生教學參考。
你還可能感興趣
我要評論
|