本書是人工智能領(lǐng)域的經(jīng)典書籍,新版做了全面修訂,增加了關(guān)于機(jī)器學(xué)習(xí)的內(nèi)容,并更新了代碼示例和練習(xí)。本書主要討論智能體(agent)的基本概念和體系結(jié)構(gòu),從計(jì)算的角度介紹相關(guān)的規(guī)劃、學(xué)習(xí)、推理、協(xié)商、交互機(jī)制等理論,基于自主送貨機(jī)器人、診斷助手、智能輔導(dǎo)系統(tǒng)和交易智能體四個(gè)原型應(yīng)用,在一個(gè)連貫的框架下研究智能體的設(shè)計(jì)、構(gòu)建和實(shí)現(xiàn),并從十個(gè)維度考慮設(shè)計(jì)空間的復(fù)雜性。
[加]大衛(wèi)·L.普爾(David L.Poole),不列顛哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)系教授,計(jì)算智能實(shí)驗(yàn)室主管。他是加拿大人工智能協(xié)會(huì)(CAIAC)和人工智能協(xié)會(huì)(AAAI)會(huì)士。曾獲CAIAC 2013年終身成就獎(jiǎng),曾任人工智能不確定性協(xié)會(huì)(AUAI。
[加]阿蘭·K.麥克沃斯(Alan K.Mackworth),不列顛哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)系榮休教授。他是CAIAC和AAAI會(huì)士,以及加拿大高等研究院(CIFAR)和加拿大學(xué)會(huì)(RSC)院士。曾任國(guó)際人工智能聯(lián)合會(huì)議(IJGAI)、AAAI和CAIA。
黃智瀕,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)博士,北京郵電大學(xué)計(jì)算機(jī)學(xué)院講師。長(zhǎng)期從事機(jī)器學(xué)大規(guī)模并行計(jì)算、GPU加速計(jì)算以及三維計(jì)算機(jī)視覺和深度學(xué)方面的研究。
白鵬,博士,中國(guó)航天空氣動(dòng)力技術(shù)研究院研究員、博士生導(dǎo)師,航天科技集團(tuán)公司學(xué)術(shù)技術(shù)帶頭人,《空氣動(dòng)力學(xué)學(xué)報(bào)》編委。長(zhǎng)期從事飛行器空氣動(dòng)力學(xué)特性評(píng)估與氣體設(shè)計(jì)領(lǐng)域的科研工作。曾榮獲部級(jí)科步獎(jiǎng)(5次)、航天貢獻(xiàn)獎(jiǎng)及航天基金獎(jiǎng)。獲國(guó)家發(fā)明專利20余項(xiàng),出版學(xué)術(shù)專著2部,在國(guó)內(nèi)外學(xué)術(shù)期刊和AIAA等重要國(guó)際學(xué)術(shù)會(huì)議上文100余篇。
譯者序
前言
致謝
部分 世界中的智能體:什么是智能體?如何創(chuàng)建智能體?
第1章 人工智能與智能體2
1.1 什么是人工智能2
1.1.1 人工智能和自然智能3
1.2 人工智能簡(jiǎn)史5
1.2.1 與其他學(xué)科的關(guān)系7
1.3 環(huán)境中的智能體7
1.4 設(shè)計(jì)智能體8
1.4.1 設(shè)計(jì)時(shí)間計(jì)算、離線計(jì)算和在線計(jì)算8
1.4.2 任務(wù)10
1.4.3 定義解決方案11
1.4.4 表示12
1.5 智能體設(shè)計(jì)空間14
1.5.1 模塊性14
1.5.2 規(guī)劃視野14
1.5.3 表示15
1.5.4 計(jì)算限制16
1.5.5 學(xué)
1.5.6 不確定性18
1.5.7 偏好19
1.5.8 智能體數(shù)量19
1.5.9 交互性20
1.5.10 各維度的相互作用20
1.6 原型應(yīng)用21
1.6.1 自主送貨機(jī)器人22
1.6.2 診斷助手24
1.6.3 智能輔導(dǎo)系統(tǒng)25
1.6.4 交易智能體27
1.6.5 智能家居28
1.7 本書概覽29
1.8 回顧29
1.9 參考文獻(xiàn)一步閱讀30
1.10 練
第2章 智能體的體系結(jié)構(gòu)與層次控制32
2.1 智能體32
2.2 智能體系統(tǒng)33
2.2.1 智能能33
2.3 層級(jí)控制36
2.4 用推理行動(dòng)42
2.4.1 智能體建模世界42
2.4.2 知識(shí)和行動(dòng)43
2.4.3 設(shè)計(jì)時(shí)間計(jì)算和離線計(jì)算44
2.4.4 在線計(jì)算45
2.5 回顧46
2.6 參考文獻(xiàn)一步閱讀46
2.7 練
第二部分 確定性推理、規(guī)劃與學(xué)r/>第3章 搜索解決方案50
3.1 以搜索的方式解決問題50
3.2 狀態(tài)空間51
3.3 圖搜索53
3.3.1 形式化圖搜索53
3.4 通用搜索算法55
3.5 無(wú)信息搜索策略57
3.5.1 廣度優(yōu)先搜索57
3.5.2 深度優(yōu)先搜索59
3.5.3 迭代深化62
3.5.4 代價(jià)優(yōu)先搜索64
3.6 啟發(fā)式搜索65
3.6.1 A搜索66
3.6.2 設(shè)計(jì)啟發(fā)式函數(shù)69
3.7 搜索空間的修剪70
3.7.1 環(huán)修剪70
3.7.2 多路徑修剪70
3.7.3 搜索策略小結(jié)72
3.8 更復(fù)雜的搜索73
3.8.1 分支定界73
3.8.2 搜索的方向75
3.8.3 動(dòng)態(tài)規(guī)劃77
3.9 回顧79
3.10 參考文獻(xiàn)一步閱讀80
3.11 練
第4章 約束推理83
4.1 可能世界、變量和約束83
4.1.1 變量和世界83
4.1.2 約束86
4.1.3 約束滿足問題87
4.2 生成和測(cè)試算法88
4.3 使用搜索求解CSP88
4.4 一致性算法89
4.5 域分割93
4.6 變量消除94
4.7 局部搜索96
4.7.1 迭代98
4.7.2 隨機(jī)算法98
4.7.3 局部搜索的變體99
4.7.4 評(píng)估隨機(jī)算法102
4.7.5 隨機(jī)重啟104
4.8 基于種群的方法104
4.9 優(yōu)化器106
4.9.1 系統(tǒng)化的優(yōu)化方法108
4.9.2 用于優(yōu)化的局部搜索110
4.10 回顧111
4.11 參考文獻(xiàn)一步閱讀112
4.12 練2
第5章 命題與推理115
5.1 命題115
5.1.1 命題演算的語(yǔ)法115
5.1.2 命題演算的語(yǔ)義116
5.2 命題約束119
5.2.1 用于一致性算法的子句形式120
5.2.2 在局部搜索中利用命題結(jié)構(gòu)121
5.3 命題確定子句121
5.3.1 問題和答案123
5.3.2 證明124
5.4 知識(shí)表示問題129
5.4.1 背景知識(shí)和觀察129
5.4.2 查詢用戶130
5.4.3 知識(shí)層面的解釋131
5.4.4 知識(shí)層面的調(diào)試133
5.5 反證法137
5.5.1 霍恩子句137
5.5.2 假設(shè)與沖突138
5.5.3 基于一致性的診斷139
5.5.4 用假設(shè)和霍恩子行推理140
5.6 完備知識(shí)假設(shè)143
5.6.1 非單調(diào)推理145
5.6.2 否定作為失敗的證明過程146
5.7 溯因法148
5.8 因果模型152
5.9 回顧153
5.10 參考文獻(xiàn)一步閱讀153
5.11 練4
第6章 確定性規(guī)劃161
6.1 狀態(tài)、動(dòng)作、目標(biāo)的表示161
6.1.1 顯式狀態(tài)空間表示162
6.1.2 STRIPS表示163
6.1.3 基于特征的動(dòng)作表示164
6.1.4 初始化狀態(tài)和目標(biāo)166
6.2 前向規(guī)劃166
6.3 回歸規(guī)劃168
6.4 CSP規(guī)劃169
6.4.1 動(dòng)作特征171
6.5 偏序規(guī)劃173
6.6 回顧175
6.7 參考文獻(xiàn)一步閱讀176
6.8 練6
第7章 有監(jiān)督機(jī)器學(xué)9
7.1 學(xué)179
7.2 有監(jiān)督學(xué)1
7.2.1 評(píng)估預(yù)測(cè)值183
7.2.2 誤差類型187
7.2.3 無(wú)輸入特征的點(diǎn)估算189
7.3 有監(jiān)督學(xué)本模型190
7.3.1 學(xué)樹191