本書以各種各樣的實例剖析游戲AI手法,并以此為目標,幫助讀者學習構筑游戲AI的技術。另外,也闡述了游戲AI中的深層學習、機械學習、強化學習技術。
深度學習這門技術在機器視覺領域大規(guī)模應用,采用深度學習的圖像識別AI 算法在識別精度上已經超過人眼精度,如今我們日常生活中的掃臉支付也基于深度學習強大的圖像特征提取能力。人們覺得AlphaGo 才是AI 時代到來的標志,之所以這樣覺得或許是因為人們普遍承認下圍棋是一種高級別的智能過程,也是一個絞盡腦汁的過程可以切身感受到動腦。
伊庭教授在本書中強調了研究游戲AI 的意義或許是解密人類大腦思考方式的方法之一。我個人十分贊同伊庭教授的這一看法,我們的生活、工作 和學習過程中的糾結一直都建立在著眼于眼前還是未來的權衡當中。但正是因為我們具有智慧,所以我們才會具有這種權衡能力(或者說是生活中充滿了糾結)。
相信當讀者從章堅持讀到后一章時,不僅會覺得游戲AI 有趣,還會覺得人腦思維本身就有很多有趣的地方。或許研究游戲AI 的意義不是為了創(chuàng)作出更加聰明、強大的AI,而是把它當作一面鏡子,來進行對人腦思維研究的自我啟發(fā)和探索。
深度學習開始被關注的標志性事件,就是一個采用深度卷積神經網絡的模型AlexNet在2012年ImageNet圖像識別大賽上獲得冠軍。自此,深度學習這門技術在機器視覺領域開始大規(guī)模應用。如今,采用深度學習的圖像識別AI算法在識別精度上已經超過人眼的精度,我們日常生活中的掃臉支付也基于深度學習強大的圖像特征提取能力。盡管深度學習的應用為圖像領域帶來了飛躍性的發(fā)展,但2012年的那場突破并沒有引起全社會的廣泛關注,當時人們并沒有普遍意識到人工智能領域的崛起即將到來。我覺得之所以這樣,是因為深度學習給機器視覺帶來的飛躍只能算是開發(fā)出了某種高級圖像傳感器。當這個傳感器收到汽車圖像時會輸出汽車這樣的識別結果,當收到花朵圖像時則會輸出花朵這樣的識別結果。雖然看起來很強大,但人們普遍沒有感受到智能的存在。因為我們或許覺得,在對映入眼簾中的事物進行識別的整個過程中,我們感受不到自己在動腦。
之所以覺得AlphaGo才是AI時代到來的標志,或許是因為人們普遍承認下圍棋是一種高級別的智能過程,也是一個絞盡腦汁的過程我們可以切身感受到動腦。下圍棋比拼的就是誰預見的步數(shù)更遠更深,在這里我們或許會想到傳統(tǒng)計算機算法可以用暴力枚舉方法預估所有的走棋可能性,但這個方法在圍棋中行不通,因為圍棋的棋局存在10171種可能性,人類目前或許找不出能夠枚舉出所有可能性的計算機。人腦也同樣無法實現(xiàn)對所有走棋可能性的掃描。這個時候,人類的直覺發(fā)揮著強大的作用。當看到眼前的棋局時,人類能夠依靠直覺快速給出多種落子方案。經驗越是豐富,直覺越是準確。當考慮如何用計算機復現(xiàn)這種直覺時,我們的視野聚焦到了深度學習上。深度學習擅長解決圖像問題,它的本質是處理矩陣數(shù)據,而圍棋棋盤本身就是一種完美的矩陣。通過深度學習,我們對棋盤這個矩陣不斷地進行特征提取并對其進行壓縮,通過多層深度卷積處理后,擁有某種落子的直覺。用深度學習來學習的棋譜數(shù)據越多,這種落子的直覺就會越可靠。AlphaGo通過蒙特卡羅算法使用不同的落子方案進行預演,不斷刷新不同的落子方案,從而提高終結果的勝率,完全像是一個圍棋高手一樣在落子之前已在腦海中完成了多種落子方案后續(xù)結果的預演。當然,蒙特卡羅算法并非新鮮方法,但正是深度學習的出現(xiàn),AlphaGo才能實現(xiàn)針對眼前棋局的落子直覺和終導向勝利的完美權衡。一個強大的圍棋AI不僅需要有專家的直覺,也需要像專家那樣深謀遠慮。
伊庭教授在本書中強調了研究游戲AI的意義或許是解密人類大腦思考方式的方法之一。我個人十分贊同伊庭教授的這一看法,我們的生活、工作和學習過程中的糾結一直都建立在著眼于眼前還是未來的權衡當中。但正是因為我們具有智慧,所以我們才會具有這種權衡能力(或者說是生活中充滿了糾結)。游戲領域里的經典算法A*算法在構造上相對近期的算法簡單很多,但它一邊著眼于眼前的資源消耗量,一邊還要注意是否靠近終點,這種簡單的路線規(guī)劃原理已經具有了初步的著眼于眼前與未來的權衡能力。
本書的后一章描述如何讓游戲AI表現(xiàn)得像個人類玩家,并量化了一些因素,從而對類人程度進行函數(shù)化。我相信當讀者堅持讀到后一章時,不僅會覺得游戲AI有趣,還會覺得人腦思維本身就有很多有趣的地方;蛟S研究游戲AI的意義不是為了創(chuàng)作出更加聰明、強大的AI,而是把它當作一面鏡子,來進行對人腦思維研究的自我啟發(fā)和探索。
曹旸
2021年2月于上海
伊庭齊志 (Hitoshi Iba)
工學博士,東京大學大學院情報理工學系研究科電子信息學專業(yè)教授,也是Genetic Programming and Evolvable Machines(GPEM)的副主編。他從事人工智能和人工生命的研究,主要研究領域包括進化系統(tǒng)、基因組信息處理、金融工程和復雜系統(tǒng)。
◆ 譯者簡介 ◆
曹 旸
2017年獲得日本早稻田大學綜合機械工學博士學位。博士求學期間,研究將模式識別應用于手術機器人操作的技術。目前就職于歐姆龍(中國)有限公司,主要在工業(yè)自動化和農業(yè)自動化領域中從事基于深度學習和計算機視覺的產品研發(fā)管理工作。
譯者序
前言
第1章 謎題與游戲AI的過去和現(xiàn)在 1
1.1 關于AI的預言成真了嗎 1
1.2 游戲AI的歷史和背景 2
1.3 游戲AI是否會剝奪人類的樂趣 7
1.4 游戲AI的意義 9
1.5 游戲的深奧程度與先下手為強定理 10
第2章 解謎的AI 14
2.1 搜索樹 14
2.1.1 樹的構造和圖形表達 14
2.1.2 深度優(yōu)先搜索 21
2.1.3 寬度優(yōu)先搜索 28
2.1.4 A*搜索 32
2.2 推箱子 40
2.3 數(shù)字連線 43
2.4 日式華容道 46
2.5 孔明棋 48
2.6 嘗試用數(shù)學知識解決數(shù)獨問題 51
第3章 依賴約束的謎題和非單調推理 58
3.1 縱向搜索與回溯 58
3.2 數(shù)學家弄錯的國際象棋謎題 58
3.3 線條圖的解釋與錯覺畫 63
3.4 ATMS與四色問題 71
3.5 解開國際象棋謎題 83
3.5.1 盡可能放置多個棋子 84
3.5.2 盡可能攻擊多個區(qū)域 86
3.6 Knuth的謎題與位棋盤 88
第4章 會玩游戲的AI 90
4.1 井字棋與樹 90
4.2 游戲的樹搜索 91
4.3 黑白棋與Fools mate 104
4.4 A*馬里奧 110
4.5 蒙特卡羅樹搜索 114
4.6 立體四子棋 118
4.7 黑白棋的蒙特卡羅算法和NegaScout算法 123
4.8 如何贏得博弈 124
4.9 消滅幽靈:AI吃豆人 132
第5章 學習、進化和游戲AI 140
5.1 來自AlphaGo的震撼 140
5.2 DQN和街機游戲 151
5.3 進化的馬里奧 155
5.4 神經進化 158
5.5 吃豆人的神經進化 161
5.6 充滿好奇心的馬里奧 166
第6章 游戲AI與類人化 174
6.1 為什么需要類人化的AI 174
6.2 通用游戲是什么 175
6.3 圖靈測試和類人化的AI 178
6.4 不使用類人化函數(shù)的類人化游戲AI 182
6.5 使用類人化函數(shù)的類人化游戲AI 190
參考文獻 199