關(guān)于我們
書單推薦
新書推薦
|
智能工程 全書共10章分別從構(gòu)建非生物智能體、感知、描述、連接、記憶和理解、學(xué)習(xí)與交互、智能體運算模式與處理功能、資源和任務(wù)功能系統(tǒng)、生存、思維、控制與主體性、智能體生命周期等角度深入討論了智能體的方方面面,本書討論一個極為龐大、復(fù)雜,且沒有先例、沒有形成共識的智能體或機器智能系統(tǒng)的實現(xiàn)機理、過程、要點,沒有能、也做不到面面俱到,存在作者有意或無意忽略的環(huán)節(jié)。本書沒有在工程細節(jié)層面討論,只是在整體實現(xiàn)的主要環(huán)節(jié)的可實現(xiàn)性進行了框架性討論。 前 言 歷經(jīng)兩年,本書終于脫稿。在2015年的寫作計劃中,并沒有這一本書。當(dāng)時的考慮是,將信息和智能這兩種客觀存在的屬性和發(fā)生發(fā)展規(guī)律說清楚,把超越人類智能的非生物智能體的目標、要求、邏輯架構(gòu)說清楚,我的研究目標就完成了。因此,2018年年初,我的書桌上已經(jīng)將寫作《論信息》和《智能原理》兩本書的參考資料撤掉,換上了經(jīng)濟學(xué)相關(guān)的資料。過了幾個月,收到一些讀者對兩本書的反饋,感到有必要就非生物智能體如何實現(xiàn)再寫一本書。原因在于沿著《論信息》和《智能原理》兩本書的認識邏輯和理論框架,去設(shè)計這種功能上媲美甚至寬于AGI的非生物智能體,方法上還不采用流行的人工智能領(lǐng)域的模式和算法,可能難以達到,需要將實現(xiàn)思路進行系統(tǒng)的介紹。于是我重新回到已經(jīng)劃了句號的領(lǐng)域,開始《智能工程》的寫作,并將三本書合在一起,稱為“智能三部曲”。 本書的非生物智能體,本質(zhì)上是機器智能,重點是以生物智能為模板,在既有機器智能的基礎(chǔ)上,實現(xiàn)以含義計算為基礎(chǔ),以理解為前提,可以自我積累知識和經(jīng)驗的非生物智能,也就是具有理解、思考、判斷、決策行為的思維機器。這種機器能夠與人合作,能夠集成既有的機器智能,能以持續(xù)增長的模式發(fā)展。 開始的時候,我低估了寫作的難度,以為在理論和邏輯方面已經(jīng)厘清的問題,只需要具體化就可以了,隨著研究和寫作的進展,發(fā)現(xiàn)這個判斷是錯誤的。難點集中在三個地方:第一,什么樣的體系架構(gòu)能實現(xiàn)《智能原理》中定義的非生物智能體的所有功能和要求;第二,用傳統(tǒng)的IT模式形成的軟硬件,如何轉(zhuǎn)變?yōu)楹x—理解—思維—行為的智能處理模式;第三,可實現(xiàn)性應(yīng)該在什么顆粒度水平描述。 對于第一個問題,本書第1章中的圖1.5是回答的總綱。智能體的架構(gòu)要支持其所有活動過程:認知、任務(wù)、生存和控制。智能體的架構(gòu)要滿足智能體的8個原則要求:主體性、多樣性、發(fā)展性、生存性、交互性、結(jié)構(gòu)性、傳承性、整體性。滿足這些要求的一種可能架構(gòu)由圖1.5中給出的11個功能體系組成。它的所有構(gòu)件,從基礎(chǔ)的微處理器到此上各個層面的功能集合,均具備自主、自治的獨立性,又處于相應(yīng)功能集合和整體的有效管理和控制之下。11個功能體系是:感知、描述、連接、記憶、學(xué)習(xí)、交互、處理、任務(wù)、資源、生存和控制。 主體性、生存性這兩個要求,主要通過四個功能模塊實現(xiàn):資源模塊、生存模塊、思維模塊和控制模塊。資源模塊聯(lián)合生存模塊保證智能體正常運轉(zhuǎn),思維模塊辨析智能體面臨的風(fēng)險,控制模塊決策并主導(dǎo)應(yīng)急處置。智能體所有構(gòu)件均被賦予自主、自治的獨立性,以避免系統(tǒng)性風(fēng)險,提高智能體生存性。傳承性要求主要通過生命周期的前三個階段:初始、賦予、培育來體現(xiàn),并在此后的學(xué)習(xí)和交互過程中延續(xù)。發(fā)展性的要求主要通過學(xué)習(xí)模塊實現(xiàn),學(xué)習(xí)是發(fā)展的主要來源,其他功能模塊也會在自身行為中總結(jié)成長,或經(jīng)由學(xué)習(xí)提升自身功能。交互性的要求主要通過交互功能模塊實現(xiàn),以滿足智能體感知、學(xué)習(xí)、任務(wù)、資源和生存各個功能對交互的需求。結(jié)構(gòu)性和整體性這兩個既矛盾又統(tǒng)一的要求,主要通過11個功能體系內(nèi)在的自主結(jié)構(gòu)和相互之間的協(xié)同模塊,控制功能的整體協(xié)調(diào)實現(xiàn)。 認知、任務(wù)、生存、控制這四個智能過程涵蓋了智能體的全部構(gòu)成要素、功能和行為。每個過程的實現(xiàn)都需要11個功能體系的支持,都在生命周期的全過程發(fā)揮作用,全書就是從實現(xiàn)這四個過程的需要去安排11個功能體系的結(jié)構(gòu)、功能、相互關(guān)系。本書對這四個過程的功能及其實現(xiàn)有四個特別的安排,這是閱讀和使用本書的關(guān)鍵。 第一,認知過程以理解為目的,以智能體可自主發(fā)展為中心,以逐步疊加為路徑,而智能體所有的功能,包括認知的發(fā)展,均基于認知!爸疄橹,不知為不知,是知也”這句2500年前孔子的名言是本書的哲學(xué)基礎(chǔ)!安环e硅步,何以至千里”是本書實踐路徑所遵循的原則。以互聯(lián)網(wǎng)為平臺,以交互功能為媒介,一個字接著一個字、一個動作接著一個動作、一個場景接著一個場景,一個主題接著一個主題,將人類智能的進展用愚公移山的精神,大規(guī)模自主并行,疊加到智能體的記憶中,形成遠遠超越一個自然人可理解、可使用的記憶,并在交互和使用中校驗、完善。與認知相關(guān)的功能體系設(shè)計就是按照這樣的原則執(zhí)行的。 第二,任務(wù)過程是以認知的積累為基礎(chǔ)的,也就是只承擔(dān)能夠做的任務(wù),力所不逮的不承擔(dān)。智能體認知過程的核心就是先積累常識和基礎(chǔ)知識,待達到一定程度后,在擬承擔(dān)的任務(wù)類型方向不斷深化,達到專精的程度。所謂專精,就是對所有需要求解的問題在實際工作場景的所有可能形式都已經(jīng)遍歷,所有這些形式的求解過程也已經(jīng)遍歷,而且形成的所有求解過程都是確定的,或即使存在一定的不確定性,也不影響結(jié)果可靠性要求。換言之,圍繞任務(wù)的認知,就是力爭窮盡一個個特定任務(wù)的問題空間和解空間,任務(wù)執(zhí)行只承擔(dān)可以判斷解的路徑是確定的問題。有些人可能認為,窮盡特定問題的問題空間和解空間是一個不可能實現(xiàn)的命題,從抽象的角度,或者從純邏輯的角度,可以得出這樣的結(jié)論,但從實際經(jīng)濟社會的工作崗位看,隨著發(fā)展,絕大部分工作崗位的任務(wù),其問題空間和解空間是可以窮盡的。一個生產(chǎn)線上的工人,一個銷售員、一個理財師、管理者,在實際工作中處理的的問題類型及其變形都是有限的。對于智能體來說,從可窮盡的開始,在其龐大、不知疲倦、快速度迭代、相互獨立又可以協(xié)同的認知功能支持下,可窮盡空間的問題類型會越來越多,在一定的發(fā)展階段,就會超越普通的員工,并能繼續(xù)發(fā)展,超越一群人,直至超越大部分人,直到具有所有人都達不到的新特征或新高度。 第三,生存過程是當(dāng)智能體成為社會獨立主體時,能承擔(dān)社會責(zé)任,能不間斷、自主地積累知識、經(jīng)驗、技能、事實、數(shù)據(jù),所必需的是在生命周期的某個時間點開始能將生存能力掌控在自己手里。 第四,控制過程更是智能體所有過程能夠形成、發(fā)展、發(fā)揮作用的關(guān)鍵。智能體是由數(shù)以千億到萬億量級的自治構(gòu)件組成的,這些不同類型、功能、層級的自治構(gòu)件都有各自和相互之間的控制和協(xié)調(diào)功能,這是控制過程的基礎(chǔ)和重要的組成部分。智能體的控制更重要的是整體的控制,這是控制功能系統(tǒng)的職責(zé)。控制功能有兩個重要模塊,一是意識和思維,對智能體的運行和環(huán)境不間斷地觀察,分析判斷是否存在風(fēng)險,是否存在被局部忽略,控制功能體系處置的事項;二是智能體全局的決策、控制、調(diào)度和處置。 對于另一個難點,本書以六個功能系統(tǒng)中的相關(guān)功能和規(guī)則,解釋為什么可以將傳統(tǒng)的IT模式組成的軟硬件,轉(zhuǎn)變?yōu)楹x—理解—思維—決策—控制的智能處理模式。 其實,傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)分析系統(tǒng)、商業(yè)智能系統(tǒng),都能通過嚴格的數(shù)據(jù)控制、數(shù)據(jù)格式、數(shù)據(jù)字典和確定的處理函數(shù),從數(shù)字(符號)得出預(yù)期的、具有含義的結(jié)論,也可以根據(jù)數(shù)據(jù)結(jié)構(gòu)、函數(shù)和數(shù)據(jù)字典給出解釋。這就是從符號中得出了含義的結(jié)果,也可以說在這個范疇內(nèi),系統(tǒng)可以給出數(shù)據(jù)庫中的特定字段、處理結(jié)果的“理解”,因為它可以解釋。缺點在于,不能泛化、跨系統(tǒng)積累,只在該系統(tǒng)能達到的范疇和深度。這個例子也給我們一個重要的啟示,剛性的符合數(shù)字內(nèi)在含義的結(jié)構(gòu)和處理、解釋規(guī)則,是可以從符號中導(dǎo)出含義的。盡管另外一些處理模式也可以得出符合所處理符號隱含的含義,但如果不可解釋,就不能認為是智能的,智能的基本條件是能解釋。 基于這樣的分析,我們能將得到信息以一種結(jié)構(gòu)化的、可解釋的方式轉(zhuǎn)換感知到的對象(符號),然后以智能體統(tǒng)一的、可理解的符號和標識體系對這些符號進行轉(zhuǎn)換,并保持由傳感器決定的感知內(nèi)容及感知對象的全部結(jié)構(gòu),以及靜態(tài)的各種空間關(guān)系;動態(tài)的則加上時間序列的所有細化對象的空間關(guān)系,再與已有的以前感知的同類對象、以前描述的同類符號轉(zhuǎn)換,用連接表述本次感知的全部關(guān)系,把感知對象的基本單元與已有的記憶比較,將所有的關(guān)系顯性表述。經(jīng)由這樣的模式保存起來的感知對象,就轉(zhuǎn)換成了智能體可理解、可利用的記憶。這里有三個關(guān)鍵環(huán)節(jié),感知、連接和記憶。感知把關(guān)是基礎(chǔ),所有的外部對象(文檔、圖形、音視頻),必須經(jīng)由唯一的感知器感知,一個感知器感知的結(jié)果,都可以由描述功能以智能體可理解的符號表示。實現(xiàn)這個要求的方法就是感知器的單一性,如一個漢字,就是一個傳感器;一種聲紋特征就是一個傳感器,聲音是片段聲紋的時間序列;圖像則以一個個基本形狀特征及色彩組合為傳感器,視頻是圖像系列。數(shù)以十億、百億的邏輯感知微處理器和數(shù)量較少的協(xié)同的物理感知微處理器與其識別對象的描述處理器直連,將對象中的要素及其連接描述完成后傳送到記憶,在記憶與其他可能的相關(guān)連接成為智能體所有功能模塊可理解、可利用的記憶單元。任務(wù)過程在一定意義上是認知過程的逆過程,任務(wù)被感知后,進入規(guī)定的任務(wù)類區(qū)域,在該任務(wù)類匹配到適用的執(zhí)行微處理器,通過執(zhí)行微處理器調(diào)用物質(zhì)資源、記憶單元和確定的處理微處理器,完成任務(wù)的執(zhí)行。生存和控制過程也以類似的模式完成。所有的智能體功能過程或智能行為以感知為起點,用特殊的結(jié)構(gòu),實現(xiàn)了從符號到含義、從存儲到記憶、從計算到理解的轉(zhuǎn)換。 最后一個難點本質(zhì)上是技術(shù)性問題、工作量問題。顆粒度越細,工作量越大,對理論到實踐的前瞻性要求越高。本書在寫作的初期計劃用28章的大篇幅,在類似于概念設(shè)計的顆粒度層次上完成,后來發(fā)現(xiàn)工作量太大,也沒有必要,因為本書的任務(wù)不是以具體項目的方式去考慮,而是對可實現(xiàn)性的一種解釋,所以盡可能將顆粒度放大,能看到可實現(xiàn)就達到了本書的目的。最粗略的估計,一個通用的非生物智能體是一個大體需要千億美元或萬億元人民幣量級的資金,用6~8年時間,高峰時需要數(shù)千人的開發(fā)團隊及大量基于互聯(lián)網(wǎng)的志愿者參與的工程。它沒有先例,細粒度的討論缺乏基礎(chǔ)。所以,本書沒有描述細節(jié),去掉了原計劃中對主要功能實現(xiàn)例子的邏輯過程描述。既有篇幅與前兩本書一致性的考慮,也有不約束實現(xiàn)模式和細節(jié)多樣性想象的考慮。 有人說,這個系統(tǒng)太過龐大復(fù)雜,熱力學(xué)第二定律必然使其窒息;有人說這樣的系統(tǒng)必然存在計算復(fù)雜性,并因此而崩潰。實際上這是在不同維度上的思考。智能體的所有過程都是含義處理,含義處理的基礎(chǔ)是理解,在理解上疊加,是1+1+…直至一個個邏輯對象、 1984-2001, 國家信息化中心;2001-2008,國務(wù)院信息辦;2008-2015,工業(yè)和信息化部副部長。研究領(lǐng)域:漢字信息處理,信息系統(tǒng)和網(wǎng)絡(luò)的設(shè)計和開發(fā),信息經(jīng)濟學(xué),信息法學(xué),國家信息化發(fā)展戰(zhàn)略,人工智能理論等。1981年以來,先后發(fā)表了150余篇論文,著有《專家系統(tǒng)及其在管理中的應(yīng)用》,《知識經(jīng)濟時代的企業(yè)技術(shù)創(chuàng)新和改造》、《企業(yè)信息化建設(shè)與管理》、《論信息》《智能原理》等著作。 目 錄
你還可能感興趣
我要評論
|