無數(shù)據(jù),不AI。
而沒有統(tǒng)一完整的基礎數(shù)據(jù)資源平臺管理,AIOps也無從談起。
基礎運維數(shù)據(jù)資源平臺是AIOps的數(shù)據(jù)基石,也是未來支撐企業(yè)數(shù)據(jù)戰(zhàn)略的兩大數(shù)據(jù)平臺之一。
構(gòu)建數(shù)據(jù)平臺需要數(shù)據(jù)治理工作的保駕護航。然而在運維數(shù)據(jù)治理領(lǐng)域開展數(shù)據(jù)治理工作尚屬空白,缺乏理論體系支撐和值得借鑒的成功經(jīng)驗。
本書在分析運維數(shù)據(jù)治理與傳統(tǒng)數(shù)據(jù)治理的差異化特點基礎上,對于數(shù)據(jù)治理的DAMA理論體系在運維數(shù)據(jù)管理領(lǐng)域?qū)崿F(xiàn)了在廣義元數(shù)據(jù)管理、廣義數(shù)據(jù)標準、廣義數(shù)據(jù)模型等理論突破,創(chuàng)造性的提出運維數(shù)據(jù)模型建設,為運維數(shù)據(jù)治理構(gòu)建了體系化理論并提供了具有方法論支撐的完整藍圖。
同時,就運維數(shù)據(jù)平臺建設本書也分享了基于數(shù)據(jù)模型實體庫的概要設計,以數(shù)據(jù)湖為基礎,包含運維數(shù)據(jù)中臺建設的架構(gòu)規(guī)劃。
本書還在工業(yè)運維領(lǐng)域略作延展,分析工業(yè)運維數(shù)據(jù)模型的差異化特點,就包括數(shù)字孿生、時空數(shù)據(jù)等關(guān)鍵工業(yè)技術(shù)為核心的物理融合技術(shù)做了介紹,提出了開展智能工業(yè)運維的必要內(nèi)容。
運維數(shù)據(jù)治理體系建設
企業(yè)基礎數(shù)據(jù)資源平臺建設
創(chuàng)造性地提出運維數(shù)據(jù)模型建設,為運維數(shù)據(jù)治理構(gòu)建了體系化理論并提供了具有方法論支撐的完整藍圖
分享了基于數(shù)據(jù)模型實體庫的概要設計,以數(shù)據(jù)湖為基礎,包含運維數(shù)據(jù)中臺建設的架構(gòu)規(guī)劃
分析了工業(yè)運維數(shù)據(jù)模型的差異化特點,就包括數(shù)字孿生、時空數(shù)據(jù)等關(guān)鍵工業(yè)技術(shù)為核心的物理融合技術(shù)做了介紹,提出了開展智能工業(yè)運維的必要內(nèi)容
中國著名的科幻小說《三體》中有一個來自理工男作者極為天才大膽且具有顛覆性的設想,叫做:降維攻擊。
我們可以學習這種思維的方式來對今天的運維成本中心予以升維定位。我們認為,未來的運維中心將會成為企業(yè)的基礎資源管理中心、基礎能力中心和基礎創(chuàng)新中心。
之所以有這樣的定位,是因為未來企業(yè)的所有數(shù)據(jù)資源將集中在業(yè)務數(shù)據(jù)平臺和基礎數(shù)據(jù)平臺兩大核心平臺之上,企業(yè)所有的能力,所有的創(chuàng)新,都需要這兩大平臺的支撐。而這樣的升維定位也為企業(yè)運維數(shù)據(jù)資產(chǎn)化和運維數(shù)字化轉(zhuǎn)型明確了方向。
有了這樣的定位,讀者就會明白未來的AIOps一定是平臺化的,是具有科學方法論的,也是在全局基礎數(shù)據(jù)資源統(tǒng)一管理基礎上的創(chuàng)新和發(fā)展。這其實與近期提出的Dataops概念異曲同工。同時,讀者也就一定理解本書所定義的AIOps與目前業(yè)界各運維工具類廠商的根本不同。工具類的運維軟件廠商就某些業(yè)務場景開展數(shù)據(jù)分析其實是算法運維(Algorithmic IT Operations)的范疇,AIOps應該具有體系化的理論依據(jù)與平臺化的整體構(gòu)思。
只有平臺才能發(fā)揮數(shù)據(jù)整合的威力與能量,而數(shù)據(jù)的整合當然需要治理先行。在傳統(tǒng)業(yè)務數(shù)據(jù)平臺領(lǐng)域有太多由于沒有開展數(shù)據(jù)治理造成種種問題的前車之鑒值得運維數(shù)據(jù)平臺建設予以借鑒。
然而在構(gòu)思運維數(shù)據(jù)治理體系的時候我們也曾經(jīng)有很多困惑。傳統(tǒng)比較成熟的數(shù)據(jù)治理的方法或最佳實踐在運維領(lǐng)域很難得以照搬套用,比如運維數(shù)據(jù)領(lǐng)域就無法直接從結(jié)構(gòu)化數(shù)據(jù)庫中獲取全量元數(shù)據(jù),似乎在套用業(yè)務數(shù)據(jù)治理理論時總是有很多不同之處。一直到我們提出了廣義元數(shù)據(jù)管理、廣義數(shù)據(jù)標準和廣義數(shù)據(jù)模型后這些問題才迎刃而解,并由此順藤摸瓜般總結(jié)出運維數(shù)據(jù)治理的差異化需求和特點。這是我寫這本書的過程中最大的收獲。由此我們提出了業(yè)界第一版的運維概念模型,也分析出數(shù)據(jù)湖技術(shù)更為符合運維數(shù)據(jù)平臺的特點和需求。
本書力求通過創(chuàng)新的思考幫助用戶厘清思路,發(fā)現(xiàn)問題,確立方向,找到那條數(shù)字化轉(zhuǎn)型可行的路。在書中我們有三大預言,希望與讀者一起去見證未來。
本書最后一章對于工業(yè)運維略作延展,因為今天正在火熱的智能制造、工業(yè)4.0同樣需要智能工業(yè)運維的保駕護航。工業(yè)運維與IT運維同樣具有極大的差異化,所以書中對包括數(shù)字孿生技術(shù)和時空數(shù)據(jù)技術(shù)在內(nèi)的物理融合模型(CPS)做了介紹和說明。我們認為工業(yè)運維不是簡單的搭建了一個云平臺,通過數(shù)據(jù)接口接通了很多生產(chǎn)線的實時物聯(lián)網(wǎng)數(shù)據(jù),然后開展了若干統(tǒng)計與可視化,就可以稱為工業(yè)運維。智慧的工業(yè)運維同樣需要在數(shù)據(jù)融合的基礎上通過治理實現(xiàn)數(shù)據(jù)資源體系化的梳理,然后結(jié)合實際環(huán)境結(jié)合具體業(yè)務場景和業(yè)務需求開展AI分析并支撐快速決策。
我們認為工業(yè)運維可以借鑒AIOps的理論與方法,結(jié)合工業(yè)運維需求予以分析和開展。今天由IT(信息技術(shù))、CT(通信技術(shù))和OT(運營技術(shù))的融合已經(jīng)沒有技術(shù)障礙,這為在工業(yè)運維領(lǐng)域通過AI技術(shù)實現(xiàn)自動化智能化奠定了堅實的技術(shù)基礎。我們相信,未來的智能工業(yè)運維一定將是蓬勃的發(fā)展前景。
最后,感謝在本書的完成過程中給予我指導和建議的所有的朋友和老師,感謝大家的支持,本書的成果離不開你們的幫助,這里一并致謝!由于是全新領(lǐng)域的構(gòu)思,相信書中一定有很多紕漏瑕疵之處,我希望得到業(yè)界同仁的批評指正,與大家共同創(chuàng)新,共同探討運維發(fā)展之路!
湯濱
2019年夏 北京
湯濱 20年以上企業(yè)數(shù)據(jù)管理和應用領(lǐng)域從業(yè)生涯,先后服務SPSS、SAP、Splunk等國際知名軟件廠商,并作為核心團隊成員在多家創(chuàng)業(yè)公司帶領(lǐng)團隊開拓業(yè)務。
目錄
第一章 總論11
1 運維管理的現(xiàn)狀11
2 AIOps為什么會成為公認的運維管理的方向13
3 AIOps對于運維數(shù)據(jù)管理提出的需求與挑戰(zhàn)17
第二章 需求分析24
1 企業(yè)數(shù)據(jù)治理概論24
2 運維數(shù)據(jù)治理的差異化分析46
3 運維數(shù)據(jù)治理工作的策略與原則49
4 運維數(shù)據(jù)治理工作的創(chuàng)新思路51
第三章 解決方案—企業(yè)基礎數(shù)據(jù)平臺建設56
1 運維數(shù)據(jù)管理系統(tǒng)58
2 運維數(shù)據(jù)模型建設思路69
3 企業(yè)統(tǒng)一基礎數(shù)據(jù)管理平臺84
第四章 實施規(guī)劃與案例分享118
1 案例分享118
2 運維知識圖譜125
3 實施規(guī)劃128
4 對AI的認知149
第五章 運維數(shù)據(jù)資產(chǎn)化與運維管理數(shù)字化轉(zhuǎn)型155
第六章 智能工業(yè)運維探索164
1 數(shù)字孿生技術(shù)173
2 時空數(shù)據(jù)181
3 工業(yè)運維數(shù)據(jù)模型186
4 基于物聯(lián)網(wǎng)的工業(yè)運維數(shù)據(jù)平臺188
5 物理信息融合197
第七章 結(jié)語203