ChatGPT一經(jīng)問世,在全球范圍內(nèi)引起巨大轟動,GPT-4接入未來辦公軟件更是讓人震驚,而且技術(shù)正在以前所未有的速度快速迭代。那么,以這些技術(shù)為代表的生成式人工智能(AIGC)是否為新一輪的技術(shù)革命?它到底能做什么,具有哪些優(yōu)勢和場景應(yīng)用趨勢?面對新技術(shù),未來商業(yè)的機會在哪里,對我們個人又有著什么樣的影響?這些問題對于我們理解當下,面向未來都十分重要。本書基于作者的專業(yè)背景和長期實踐,系統(tǒng)介紹生成式人工智能的內(nèi)在邏輯與應(yīng)用,并將其與產(chǎn)業(yè)發(fā)展,理論和實際相結(jié)合,幫助讀者從本源了解生成式人工智能,結(jié)合未來趨勢和發(fā)展為讀者指明方向。
1.一本書帶你讀懂生成式人工智能,從技術(shù)、功能、邏輯到前景商業(yè)應(yīng)用。幫 助我們了解未來趨勢、尋找個人發(fā)展機會。
2、作者丁磊,擁有雄厚專業(yè)背景(美國俄亥俄州立大學(xué)人工智能專業(yè)博士,人工智能商業(yè)化落地先行者,曾為硅谷明星公司PayPal創(chuàng)立了人工智能平臺并擔任負責(zé)人,后在百度、騰訊均任高級職務(wù)),分析視角專業(yè),兼顧通俗易懂。
3、香港科技大學(xué)講席教授,加拿大皇家科學(xué)院、加拿大工程院院士楊強,加拿大圭爾夫大學(xué)教授、先進機器人及智能系統(tǒng)實驗室主任楊先一,微軟中國CTO韋青,戴爾原全球副總裁、大中華區(qū)總裁楊超,富士康科技集團首席數(shù)字官、智能制造平臺負責(zé)人史喆,從知名教授到科技企業(yè)高管、人工智能技術(shù)踐行者,聯(lián)袂推薦。
人類從出生開始,就在不斷通過視覺、聽覺、嗅覺、味覺、觸覺等各種方式認識這個世界。我們通過不停地與外界接觸、學(xué)習(xí),逐漸長大成人,再通過專業(yè)課程的學(xué)習(xí)在某些方面獲得一技之長從而立足于社會,并試圖改造世界。
硅基的AI(人工智能)也按照類似的模式成長,但是在速度方面極具優(yōu)勢。人工智能經(jīng)歷了從最初的機器學(xué)習(xí)到神經(jīng)網(wǎng)絡(luò),再到Transformer模型的發(fā)展,2022年底ChatGPT以及2023年初GPT4橫空出世,引燃了公眾對生成式AI的關(guān)注,其中最讓人激動的就是AI大模型已經(jīng)初步具備了人類的通識和邏輯能力這恰恰是之前的AI所缺失的。此前,無論是AlphaGo還是AlphaFold,最多只能稱作其各自領(lǐng)域的專家,而ChatGPT是通用的。
正如OpenAI首席科學(xué)家、ChatGPT背后的技術(shù)大佬伊利亞·蘇茨克維(IlyaSutskeve)所說,GPT學(xué)習(xí)的是世界模型。他將互聯(lián)網(wǎng)文本稱作世界的映射,因此,將海量互聯(lián)網(wǎng)文本作為學(xué)習(xí)語料的GPT學(xué)習(xí)到的就是整個世界。在我們認識世界的同時,GPT模型也同樣以驚人的算力,快速地獲取我們數(shù)年,甚至數(shù)十年才能擁有的認知,即將成為一位成年人所具有的認知的世界模型。
不僅如此,已具備了世界模型能力的GPT還能夠生成萬物。當然,蘇茨克維所說,這里的萬物指的是世界萬物在數(shù)字空間的映射,包括文本、圖片、音頻、視頻、劇本、代碼、方案、設(shè)計圖等一切和我們生產(chǎn)、生活息息相關(guān)的事物。因為GPT模型在一定程度上可能已經(jīng)具備了成年人的通識和邏輯,所以我們只需要拿特定專業(yè)領(lǐng)域的數(shù)據(jù)對其再做訓(xùn)練(稱為微調(diào)),GPT模型就可以成為獨當一面的專業(yè)人才,它可能成為藝術(shù)家、設(shè)計師、程序員、工程師或廣告優(yōu)化師、供應(yīng)鏈專家、客服人員等。這也許就是生成式AI或者說AIGC,帶給我們的核心價值。
在AI技術(shù)大爆炸的今天,生成式AI處在高速發(fā)展階段,技術(shù)和應(yīng)用領(lǐng)域日新月異,因此我們非常有必要系統(tǒng)地了解生成式AI。在這樣的背景下,本書將系統(tǒng)介紹生成式AI的原理與模型,同時也將對其在行業(yè)場景中的應(yīng)用展開論述,理論和實際相結(jié)合,讓大家從本源上了解ChatGPT里程碑式存在的意義。結(jié)合作者二十余年AI領(lǐng)域研究與工作的經(jīng)驗,本書會為讀者指明方向。尤其值得一提的是,本書既在理論上解釋了數(shù)字媒體即虛擬世界的生成式AI,又探討了生成式AI如何服務(wù)和賦能實體經(jīng)濟。在當前的存量經(jīng)濟時代,通過生成式AI重新定義生產(chǎn)力,助力行業(yè)更新發(fā)展,在存量里促增長,具有尤為重要的意義。
如圖01所示,我們用圖表明本書所覆蓋的知識領(lǐng)域:X軸是生成式大模型的維度,對應(yīng)的是第二章AIGC的底層邏輯,我們將了解用什么去生成;Y軸是數(shù)字媒體形態(tài)的維度,對應(yīng)的是第三章AIGC能生成什么內(nèi)容?,我們將了解生成什么;Z軸是行業(yè)職能的維度,對應(yīng)的是第四章AIGC的產(chǎn)業(yè)應(yīng)用與前景,我們將了解用生成式AI可以做什么事。三個軸所形成的空間里的每個點都有其特定含義,例如:通過GPT4模型生成代碼用在生產(chǎn)上,通過StableDiffusion模型生成圖片用在營銷上。除了這三章,第一章會帶領(lǐng)讀者初識生成式AI,第五章則探討生成式AI是否會取代大量的工作崗位,以及我們應(yīng)該如何主動應(yīng)對。
希望任何一個不想在生成式AI時代落伍的人,在閱讀本書之后,都能理解生成式AI的底層邏輯和實際應(yīng)用,也希望本書對他們的工作和生活有所助益。萬物皆可生成的時代已經(jīng)來臨,理解AI、訓(xùn)練AI、使用AI,甚至和AI一起工作,對每個人來說或?qū)o法避免。未來已來,讓我們一起出發(fā)!
丁磊
美國俄亥俄州立大學(xué)人工智能專業(yè)博士,美國哥倫比亞大學(xué)博士后。
人工智能商業(yè)化落地先行者,曾為PayPal創(chuàng)立人工智能平臺,歷任百度金融首席數(shù)據(jù)科學(xué)家、PayPal全球消費者數(shù)據(jù)科學(xué)部創(chuàng)始負責(zé)人等職務(wù),曾在IBM Watson研究院和美國伊利諾伊大學(xué)貝克曼研究所從事研究。在IEEE會刊等發(fā)表高質(zhì)量論文20余篇,獲授權(quán)專利30余項。
幫助企業(yè)運用人工智能提升效益,與中國農(nóng)業(yè)銀行、中國電信、萬科集團、聯(lián)合利華、億客行等行業(yè)巨頭深度合作,推動人工智能落地。領(lǐng)導(dǎo)研發(fā)的營銷和風(fēng)控決策系統(tǒng)、精準服務(wù)智能機器人平臺在多個行業(yè)成功應(yīng)用。2018年被第一財經(jīng)評為中國數(shù)據(jù)科學(xué)50人。
前言
第一章 初識生成式人工智能
縱觀 AI 產(chǎn)業(yè)版圖 003
聚焦 AIGC:內(nèi)容皆可生成 017
生成式 AI 的核心價值 031
里程碑式的存在ChatGPT 041
第二章 AIGC 的底層邏輯
生成式模型基礎(chǔ) 059
Transformer 和 ChatGPT 模型 073
Diffusion 模型 087
第三章 功能分析:AIGC 能生成什么內(nèi)容?
生成文字: 新聞、報告、代碼都可一鍵生成? 101
描繪圖片: 分辨率、清晰度、真實性與藝術(shù)性 111
音頻制作:精準還原、實時合成 127
影視創(chuàng)作:海量場景任你選 137
互動娛樂:游戲中的生成式 AI 革命 149
第四章 商業(yè)落地:AIGC 的產(chǎn)業(yè)應(yīng)用與前景
研發(fā)設(shè)計:設(shè)計能力樣樣俱全 163
生產(chǎn)制造: L4 級別的智能控制 179
市場營銷:營銷文案不再發(fā)愁 191
供應(yīng)鏈管理: 庫存計劃可自動編程? 201
客戶服務(wù):貼心服務(wù)打動客戶 211
第五章 主動還是被動?決勝 AIGC
展望未來: AIGC 是否是新一輪的技術(shù)革命? 225
智能并非萬能:AIGC 的優(yōu)勢與瓶頸 235
我們的工作機會還在嗎? 247
后記 259
參考文獻