本書從產(chǎn)業(yè)角度深刻分析了異構計算及智能計算中心建設的諸多關鍵技術和應用前景,介紹了異構融合智能計算的核心技術—智能計算中心異構算力芯片、異構算力適配、異構操作平臺,以及產(chǎn)業(yè)界中智能計算中心異構算力的解決方案、智能計算中心的高質量發(fā)展與未來展望。本書內(nèi)容豐富、分析全面,是實現(xiàn)智能計算中心發(fā)展相關布局的重要技術參考,對推動我國智能計算中心建設和智能計算領域的發(fā)展有很高的參考價值和實際意義,適合從事城市數(shù)字化建設、智能化建設、智能計算中心建設的相關技術人員,以及科研機構技術人員、高校師生閱讀。
1.本書作者專業(yè)性極強,長期從事云計算、網(wǎng)絡、服務器、存儲、算力基礎設施、移動通信、數(shù)據(jù)中心、服務器與存儲等相關技術研究,實踐經(jīng)驗豐富。
2.本書是國內(nèi)少有的重點聚焦異構融合智能計算的書籍,填補市場空缺,市場潛力大。
3.本書內(nèi)容詳實,案例豐富,便于理解。
4.本書是實現(xiàn)相關國家戰(zhàn)略布局的重要技術參考。
郭亮
工程師,中國信息通信研究院云計算與大數(shù)據(jù)研究所副總工程師,開放數(shù)據(jù)中心委員會新技術與測試工作組組長。長期從事云計算、網(wǎng)絡、服務器、存儲和基礎設施相關技術的研究工作。
李潔
博士,工程師,中國信息通信研究院云計算與大數(shù)據(jù)研究所副所長,開放數(shù)據(jù)中心委員會副主席,中國通信標準化協(xié)會TC1 WG4數(shù)據(jù)中心工作組組長。長期從事數(shù)據(jù)中心、算力基礎設施等方面的政策、技術、標準和產(chǎn)業(yè)研究工作。
彭競
碩士,中國電信股份有限公司北京分公司政企客戶事業(yè)群副總經(jīng)理,畢業(yè)于北京郵電大學計算機通信專業(yè)。從事移動通信、IT互聯(lián)網(wǎng)、云計算等方面的工作15年余年,在產(chǎn)業(yè)數(shù)字化科技創(chuàng)新領域和“5G+云+AI”方向有豐富的實踐經(jīng)驗。
趙繼壯
中國電信研究院AI賦能平臺團隊總監(jiān),工程師,開放數(shù)據(jù)中心委員會新技術與測試工作組副組長。長期致力于數(shù)據(jù)中心、服務器與存儲、HPC存儲、云網(wǎng)融合計算研究。發(fā)表論文5篇,獲得授權專利4項,主導通信行業(yè)標準3項。
吳美希,工程師,中國信通院云計算與大數(shù)據(jù)研究所業(yè)務主管,開放數(shù)據(jù)中心委員會項目經(jīng)理。主要從事綠色數(shù)據(jù)中心、一體化大數(shù)據(jù)中心、邊緣數(shù)據(jù)中心和算力算效等相關的規(guī)劃咨詢、標準編制、測評認證和政策支撐工作。
第 一章 智能計算發(fā)展概述 1
1.1 全球智能計算發(fā)展概述 2
1.1.1 智能計算成為國家戰(zhàn)略 2
1.1.2 發(fā)達國家增加人工智能投資 3
1.1.3 龍頭企業(yè)構建智算服務 4
1.1.4 智能計算中心建設態(tài)勢分析 6
1.2 我國智能計算發(fā)展概述 13
1.2.1 頂層設計逐步完善 13
1.2.2 產(chǎn)業(yè)形態(tài)復雜多元 15
第二章 智能計算中心發(fā)展概述 19
2.1 概念與背景 20
2.1.1 概念 20
2.1.2 建設背景 20
2.1.3 建設意義 21
2.2 發(fā)展現(xiàn)狀 22
2.2.1 概述 22
2.2.2 建設主體 26
2.2.3 主要特征 37
2.3 技術現(xiàn)狀 39
2.3.1 核心技術 39
2.3.2 技術趨勢 43
2.4 建設局限 47
2.4.1 算法待統(tǒng)一 47
2.4.2 能源消耗巨大 48
2.4.3 核心技術受限 50
第三章 智能計算中心異構計算 51
3.1 異構計算的作用 52
3.1.1 增強計算效力 52
3.1.2 適配算法模型 52
3.1.3 提升資源效率 53
3.2 異構計算維度劃分 53
3.2.1 AI加速芯片 54
3.2.2 算力適配層 54
3.2.3 算力調(diào)度網(wǎng)絡 55
3.2.4 算力管理 55
3.3 異構計算解決方案 55
3.3.1 解決方案概述 55
3.3.2 AI模型訓練方案 56
3.4 異構計算行業(yè)應用 58
3.4.1 智慧城市 58
3.4.2 智慧園區(qū) 65
3.4.3 智慧政務 66
3.4.4 智慧交通 69
3.4.5 智慧工業(yè) 70
3.4.6 智慧科研 74
3.4.7 智慧金融 77
第四章 智能計算中心異構算力芯片 85
4.1 AI芯片的概念 86
4.1.1 AI芯片的概念界定與分類方式 86
4.1.2 傳統(tǒng)芯片與AI芯片的對比分析 87
4.1.3 AI芯片異構架構 87
4.1.4 AI芯片的發(fā)展趨勢 88
4.2 AI芯片的分類 90
4.2.1 CPU 90
4.2.2 GPU 90
4.2.3 NPU 96
4.2.4 FPGA 97
4.2.5 ASIC 97
4.3 主流芯片產(chǎn)品 99
4.3.1 昇騰AI推理和訓練芯片 99
4.3.2 寒武紀智能加速卡 99
4.3.3 百度昆侖芯 101
4.3.4 “云燧”系列加速卡 103
第五章 智能計算中心異構算力適配 105
5.1 異構算力適配架構 106
5.1.1 異構算力工作流程 106
5.1.2 異構算力適配的挑戰(zhàn) 108
5.1.3 智能計算中心異構算力適配架構 110
5.1.4 智能計算中心異構算力接入統(tǒng)一要求 113
5.2 硬件開發(fā)套件架構 115
5.2.1 華為 115
5.2.2 寒武紀 118
5.2.3 燧原科技 118
5.2.4 百度 120
5.2.5 算能科技 120
5.3 模型開發(fā)框架適配層 122
5.3.1 模型開發(fā)框架 123
5.3.2 計算圖編譯器 125
5.3.3 分布式計算 127
5.3.4 算子庫 128
5.4 操作系統(tǒng)異構適配層 130
5.4.1 集成開發(fā)環(huán)境統(tǒng)一的操作界面 130
5.4.2 異構模型移植操作界面 131
5.4.3 異構模型調(diào)優(yōu)操作界面 132
5.4.4 異構算子適配操作界面 133
5.4.5 異構性能分析與調(diào)優(yōu)操作界面 134
第六章 智能計算中心異構算力調(diào)度網(wǎng)絡 137
6.1 異構算力遠程調(diào)用需求 138
6.2 算力調(diào)度網(wǎng)絡技術 140
6.2.1 并行通信庫 140
6.2.2 互聯(lián)技術 141
6.2.3 網(wǎng)絡優(yōu)化技術 146
6.3 長距離無損網(wǎng)絡 147
第七章 智能計算中心操作系統(tǒng) 151
7.1 簡介 152
7.2 異構算力統(tǒng)一納管平臺 152
7.2.1 技術架構 152
7.2.2 平臺功能 154
7.3 異構算力智能運營平臺 163
7.3.1 平臺架構 163
7.3.2 服務應用 164
7.4 安全防護可信平臺 165
7.4.1 安全防護可信計算技術 166
7.4.2 智能計算中心安全防護功能 167
7.4.3 可信異構算力服務器 168
第八章 智能計算中心異構算力典型解決方案 169
8.1 華為Atlas人工智能解決方案 170
8.1.1 能力介紹 170
8.1.2 技術架構 170
8.1.3 應用成效 171
8.2 百度城市AI計算中心 172
8.2.1 能力介紹 172
8.2.2 總體框架 173
8.2.3 方案優(yōu)勢 176
8.3 騰訊云智天樞平臺 176
8.3.1 能力介紹 176
8.3.2 方案介紹 177
8.3.3 平臺優(yōu)勢 178
8.4 趨動科技Orion X計算平臺 181
8.4.1 方案介紹 181
8.4.2 平臺優(yōu)勢 182
8.5 燧原科技液冷訓練集群 183
8.5.1 能力介紹 183
8.5.2 方案介紹 184
8.6 算能AI智能計算中心平臺 184
8.7 寒武紀人工智能算力平臺 185
8.7.1 能力介紹 185
8.7.2 架構設計 186
8.7.3 核心優(yōu)勢 186
8.8 一流科技“一站式”AI開發(fā)服務平臺 187
8.8.1 能力介紹 187
8.8.2 技術方案 188
8.8.3 平臺優(yōu)勢 190
第九章 智能計算中心的高質量發(fā)展 193
9.1 高能效 194
9.1.1 建設要求 194
9.1.2 發(fā)展現(xiàn)狀 197
9.2 高算力 198
9.2.1 建設要求 198
9.2.2 發(fā)展現(xiàn)狀 199
9.3 強算效 200
9.3.1 建設要求 200
9.3.2 發(fā)展現(xiàn)狀 201
9.4 安全可靠 202
9.4.1 建設要求 202
9.4.2 發(fā)展現(xiàn)狀 203
9.5 評估認證 204
9.5.1 綠色低碳 204
9.5.2 算力算效 207
9.5.3 服務能力 208
9.5.4 安全可靠 209
9.5.5 智能化運營 210
第十章 展望 213
10.1 規(guī)范建設模式 214
10.1.1 規(guī)范算力調(diào)度納管 214
10.1.2 規(guī)范算力適配技術 214
10.1.3 規(guī)范算力安全防護 215
10.2 重視算力算效 216
10.2.1 提升算力應用管理體系效能 216
10.2.2 部署智能計算中心異構操作系統(tǒng) 216
10.2.3 形成全場景矩陣化合作模式 216
10.3 融合異構算力 217
10.3.1 建立智能算力虛擬資源 218
10.3.2 部署異構算力調(diào)度無損網(wǎng)絡 219
10.3.3 實現(xiàn)異構算力適配 220
10.4 綠色低碳發(fā)展 221
10.4.1 擴大綠色低碳產(chǎn)品應用場景 221
10.4.2 優(yōu)化清潔能源使用機制結構 221
10.4.3 增強綠色低碳智能管理能力 222
參考文獻 223