百面機器學(xué)習(xí) 算法工程師帶你去面試
定 價:89 元
叢書名:職場
- 作者:諸葛越 葫蘆娃
- 出版時間:2018/8/1
- ISBN:9787115487360
- 出 版 社:人民郵電出版社
- 中圖法分類:TP181
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
人工智能領(lǐng)域正在以超乎人們想象的速度發(fā)展,本書趕在人工智能徹底占領(lǐng)世界之前完成編寫,實屬萬幸。
書中收錄了超過100道機器學(xué)習(xí)算法工程師的面試題目和解答,其中大部分源于Hulu算法研究崗位的真實場景。本書從日常工作、生活中各種有趣的現(xiàn)象出發(fā),不僅囊括了機器學(xué)習(xí)的基本知識,而且還包含了成為出眾算法工程師的相關(guān)技能,更重要的是凝聚了筆者對人工智能領(lǐng)域的一顆熱忱之心,旨在培養(yǎng)讀者發(fā)現(xiàn)問題、解決問題、擴展問題的能力,建立對機器學(xué)習(xí)的熱愛,共繪人工智能世界的宏偉藍圖。
不積跬步,無以至千里,本書將從特征工程、模型評估、降維等經(jīng)典機器學(xué)習(xí)領(lǐng)域出發(fā),構(gòu)建一個算法工程師必-備的知識體系;見神經(jīng)網(wǎng)絡(luò)、強化學(xué)習(xí)、生成對抗網(wǎng)絡(luò)等新科研進展之微,知深度學(xué)習(xí)領(lǐng)域勝敗興衰之著;博觀而約取,厚積而薄發(fā),在末一章為讀者展示生活中各種引領(lǐng)時代的人工智能應(yīng)用。
不可不讀的機器學(xué)習(xí)面試寶典!微軟全球執(zhí)行副總裁、美國工程院院士沈向洋,《浪潮之巔》《數(shù)學(xué)之美》作者吳軍,《計算廣告》作者、科大訊飛副總裁劉鵬,聯(lián)袂推薦!
人工智能幾起幾落,*近這次人工智能浪潮起始于近10年,技術(shù)的飛躍發(fā)展,帶來了應(yīng)用前所未有的可能性。未來的幾年,是人工智能技術(shù)全面普及化的時期,也是算法工程師稀缺的時期。
本書旨在幫助對人工智能和機器學(xué)習(xí)有興趣的朋友們更加深入地了解這個領(lǐng)域的基本技能,幫助每個軟件工程師成為自信的AI實踐者,幫助每個數(shù)據(jù)科學(xué)家成為出眾的AI研究者。對每個有志進入此領(lǐng)域的工程師來說,本書會為你鋪設(shè)一條快速通往目標(biāo)的道路。
諸葛越:現(xiàn)任Hulu公司全球研發(fā)副總裁,中國研發(fā)中心總經(jīng)理。曾任Landscape Mobile 公司聯(lián)合創(chuàng)始人兼CEO,前雅虎北京全球研發(fā)中心產(chǎn)品總監(jiān), 微軟北京研發(fā)中心項目總經(jīng)理,雅虎美國高級軟件架構(gòu)師。諸葛越獲美國斯坦福大學(xué)的計算機碩士與博士,紐約州立大學(xué)石溪分校的應(yīng)用數(shù)學(xué)碩士,曾就讀于清華大學(xué)計算機科學(xué)與技術(shù)系。諸葛越的研究結(jié)果獲多項專利,2005年獲美國計算機學(xué)會數(shù)據(jù)庫專業(yè)委員會十年最佳論文獎。
葫蘆娃:15位Hulu北京創(chuàng)新實驗室的人才。他們利用擅長的機器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域知識和算法模型,建立了一套定制化的機AI平臺,改變著推薦引擎、視頻編解碼、內(nèi)容理解、廣告投放等多項與用戶息息相關(guān)的在線業(yè)務(wù)技術(shù)。
推薦序
前言
機器學(xué)習(xí)算法工程師的自我修養(yǎng)
第 1章 特征工程
第 1節(jié) 特征歸一化
第 2節(jié) 類別型特征
第3節(jié) 高維組合特征的處理
第4節(jié) 組合特征
第5節(jié) 文本表示模型
第6節(jié) Word2Vec
第7節(jié) 圖像數(shù)據(jù)不足時的處理方法
第 2章 模型評估
第 1節(jié) 評估指標(biāo)的局限性
第 2節(jié) ROC 曲線
第3節(jié) 余弦距離的應(yīng)用
第4節(jié) A/B 測試的陷阱
第5節(jié) 模型評估的方法
第6節(jié) 超參數(shù)調(diào)優(yōu)
第7節(jié) 過擬合與欠擬合
第3章 經(jīng)典算法
第 1節(jié) 支持向量機
第 2節(jié) 邏輯回歸
第3節(jié) 決策樹
第4章 降維
第 1節(jié) PCA 最大方差理論
第 2節(jié) PCA 最小平方誤差理論
第3節(jié) 線性判別分析
第4節(jié) 線性判別分析與主成分分析
第5章 非監(jiān)督學(xué)習(xí)
第 1節(jié) K 均值聚類
第 2節(jié) 高斯混合模型
第3節(jié) 自組織映射神經(jīng)網(wǎng)絡(luò)
第4節(jié) 非監(jiān)督學(xué)習(xí)算法的評估
第6章 概率圖模型
第 1節(jié) 概率圖模型的聯(lián)合概率分布
第 2節(jié) 概率圖表示
第3節(jié) 生成式模型與判別式模型
第4節(jié) 馬爾可夫模型
第5節(jié) 主題模型
第7章 優(yōu)化算法
第 1節(jié) 有監(jiān)督學(xué)習(xí)的損失函數(shù)
第 2節(jié) 機器學(xué)習(xí)中的優(yōu)化問題
第3節(jié) 經(jīng)典優(yōu)化算法
第4節(jié) 梯度驗證
第5節(jié) 隨機梯度下降法
第6節(jié) 隨機梯度下降法的加速
第7節(jié) L1 正則化與稀疏性
第8章 采樣
第 1節(jié) 采樣的作用
第 2節(jié) 均勻分布隨機數(shù)
第3節(jié) 常見的采樣方法
第4節(jié) 高斯分布的采樣
第5節(jié) 馬爾科夫蒙特卡洛采樣法
第6節(jié) 貝葉斯網(wǎng)絡(luò)的采樣
第7節(jié) 不均衡樣本集的重采樣
第9章 前向神經(jīng)網(wǎng)絡(luò)
第 1節(jié) 多層感知機與布爾函數(shù)
第 2節(jié) 深度神經(jīng)網(wǎng)絡(luò)中的激活函數(shù)
第3節(jié) 多層感知機的反向傳播算法
第4節(jié) 神經(jīng)網(wǎng)絡(luò)訓(xùn)練技巧
第5節(jié) 深度卷積神經(jīng)網(wǎng)絡(luò)
第6節(jié) 深度殘差網(wǎng)絡(luò)
第 10章 循環(huán)神經(jīng)網(wǎng)絡(luò)
第 1節(jié) 循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)
第 2節(jié) 循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失問題
第3節(jié) 循環(huán)神經(jīng)網(wǎng)絡(luò)中的激活函數(shù)
第4節(jié) 長短期記憶網(wǎng)絡(luò)
第5節(jié) Seq2Seq 模型
第6節(jié) 注意力機制
第 11章 強化學(xué)習(xí)
第 1節(jié) 強化學(xué)習(xí)基礎(chǔ)
第 2節(jié) 視頻游戲里的強化學(xué)習(xí)
第3節(jié) 策略梯度
第4節(jié) 探索與利用
第 12章 集成學(xué)習(xí)
第 1節(jié) 集成學(xué)習(xí)的種類
第 2節(jié) 集成學(xué)習(xí)的步驟和例子
第3節(jié) 基分類器
第4節(jié) 偏差與方差
第5節(jié) 梯度提升決策樹的基本原理
第6節(jié) XGBoost 與GBDT 的聯(lián)系和區(qū)別
第 13章 生成式對抗網(wǎng)絡(luò)
第 1節(jié) 初識GANs 的秘密
第 2節(jié) WGAN:抓住低維的幽靈
第3節(jié) DCGAN:當(dāng)GANs 遇上卷積
第4節(jié) ALI:包攬推斷業(yè)務(wù)
第5節(jié) IRGAN:生成離散樣本
第6節(jié) SeqGAN:生成文本序列
第 14章 人工智能的熱門應(yīng)用
第 1節(jié) 計算廣告
第 2節(jié) 游戲中的人工智能
第3節(jié) AI 在自動駕駛中的應(yīng)用
第4節(jié) 機器翻譯
第5節(jié) 人機交互中的智能計算
后記
作者隨筆
參考文獻