統(tǒng)一星型模型 一種敏捷靈活的數(shù)據(jù)倉(cāng)庫(kù)和分析設(shè)計(jì)方法
定 價(jià):108 元
- 作者:[美]比爾?因蒙(BillInmon);[美]弗朗切斯科?普皮尼(FrancescoPuppini)
- 出版時(shí)間:2022/4/1
- ISBN:9787111702795
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP311.13
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
數(shù)據(jù)模型作為倉(cāng)庫(kù)和集市的核心組成部分,它的價(jià)值不言而喻。而統(tǒng)一星型模型是一種構(gòu)建分析型應(yīng)用的*敏捷和靈活的設(shè)計(jì)方式,與傳統(tǒng)的維度模型相比,它具有諸多優(yōu)勢(shì)。這本書(shū)是數(shù)據(jù)倉(cāng)庫(kù)之父BIllInmon強(qiáng)力推薦的,書(shū)中可看到統(tǒng)一星型模型作為單一星型模型的強(qiáng)大功能。Inmon和Francesco Pupplin在書(shū)中闡述了為什么統(tǒng)一星型模型是當(dāng)前商業(yè)智能設(shè)計(jì)的方法,介紹了它的發(fā)展歷程、背景、設(shè)計(jì)方法以及如何解決業(yè)務(wù)問(wèn)題。
統(tǒng)一星型模型是實(shí)現(xiàn)業(yè)務(wù)價(jià)值的關(guān)鍵,從數(shù)據(jù)丟失、Chasm陷阱、多事實(shí)查詢、循環(huán)、非一致粒度等方面都展示了它的優(yōu)勢(shì)。所以對(duì)于企業(yè)來(lái)說(shuō),不論是現(xiàn)在的業(yè)務(wù)還是將來(lái)的業(yè)務(wù),統(tǒng)一模型都可以作為基礎(chǔ)業(yè)務(wù)模型,為企業(yè)業(yè)務(wù)的數(shù)字化轉(zhuǎn)型保駕護(hù)航。
本書(shū)原作者是數(shù)據(jù)倉(cāng)庫(kù)傳奇人物Bill Inmon和數(shù)據(jù)倉(cāng)庫(kù)專家Francesco Puppini,在行業(yè)內(nèi)是全球公認(rèn)的權(quán)威專家,本書(shū)可幫助讀者掌握用于構(gòu)建分析型應(yīng)用*敏捷和靈活的設(shè)計(jì)方式:統(tǒng)一星型模型。在國(guó)內(nèi)書(shū)籍中尚無(wú)該類書(shū)籍,填補(bǔ)市場(chǎng)空缺。
本書(shū)特點(diǎn):
統(tǒng)一星型模型是一個(gè)高性能的有效工具,能夠幫助交付和使用業(yè)務(wù)信息。本書(shū)原作者是數(shù)據(jù)倉(cāng)庫(kù)傳奇人物Bill Inmon和數(shù)據(jù)倉(cāng)庫(kù)專家Francesco Puppini,在行業(yè)內(nèi)是全球公認(rèn)的權(quán)威專家,本書(shū)可幫助讀者掌握用于構(gòu)建分析型應(yīng)用*敏捷和靈活的設(shè)計(jì)方式:統(tǒng)一星型模型(USS-Unified Star Schema)。與傳統(tǒng)的維度模型相比,統(tǒng)一星型模型有很多優(yōu)勢(shì)。在這本書(shū)里可以看到統(tǒng)一星型模型作為單一星型模型的強(qiáng)大功能,不論是現(xiàn)在的業(yè)務(wù)還是將來(lái)的業(yè)務(wù),都可以作為業(yè)務(wù)基礎(chǔ)模型來(lái)使用。
掌握用于構(gòu)建分析型應(yīng)用敏捷和靈活的設(shè)計(jì)方式:統(tǒng)一星型模型(USSUnified Star Schema)。與傳統(tǒng)的維度模型相比,統(tǒng)一星型模型有很多優(yōu)勢(shì)。在這本書(shū)里你可以看到統(tǒng)一星型模型作為單一星型模型的強(qiáng)大功能,對(duì)于你的公司來(lái)說(shuō),不論是現(xiàn)在的業(yè)務(wù)還是將來(lái)的業(yè)務(wù),都可以作為你的業(yè)務(wù)基礎(chǔ)模型來(lái)使用。
數(shù)據(jù)倉(cāng)庫(kù)傳奇人物Bill Inmon(比爾?因蒙)和數(shù)據(jù)倉(cāng)庫(kù)專家Francesco Puppini(弗朗切斯科?普皮尼)逐步解釋了為什么統(tǒng)一星型模型方法是當(dāng)今商業(yè)智能設(shè)計(jì)的方法,并通過(guò)許多示例來(lái)驗(yàn)證這一點(diǎn)。
本書(shū)分為兩部分。
部分,體系結(jié)構(gòu)。介紹了數(shù)據(jù)集市和數(shù)據(jù)倉(cāng)庫(kù)的優(yōu)點(diǎn),包括組織如何發(fā)展到當(dāng)前的分析狀態(tài),以及當(dāng)前商業(yè)智能體系結(jié)構(gòu)所面臨的挑戰(zhàn)。部分共分為8章:
第1章數(shù)據(jù)集市與維度模型:了解數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市背后的驅(qū)動(dòng)力以及特征。
第2章維度建模概念:掌握維度模型的概念,包括事實(shí)表、維表、星型模型和雪花模型。
第3章數(shù)據(jù)集市演變:了解多個(gè)數(shù)據(jù)集市的優(yōu)勢(shì),以及由于數(shù)據(jù)集市管理不當(dāng)而引起的數(shù)據(jù)質(zhì)量、版本控制和可信度問(wèn)題。
第4章轉(zhuǎn)換:了解數(shù)據(jù)提取、轉(zhuǎn)換和加載(ETL)的過(guò)程,以及提取、轉(zhuǎn)換和加載(ETL)為報(bào)告帶來(lái)的價(jià)值。
第5章集成數(shù)據(jù)集市的方法:了解數(shù)據(jù)倉(cāng)庫(kù)如何為您的公司報(bào)表工作帶來(lái)收益。
第6章監(jiān)控?cái)?shù)據(jù)集市環(huán)境:了解監(jiān)控?cái)?shù)據(jù)集市的動(dòng)機(jī)。確定需要修改的數(shù)據(jù),區(qū)分活躍數(shù)據(jù)和非活躍數(shù)據(jù),以及如何清除休眠數(shù)據(jù)。
第7章數(shù)據(jù)集市環(huán)境中的元數(shù)據(jù)和文檔:了解數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中元數(shù)據(jù)的不同類型,包括簡(jiǎn)單表和元素的元數(shù)據(jù)、數(shù)據(jù)來(lái)源元數(shù)據(jù)、加載日期型元數(shù)據(jù)、組合型元數(shù)據(jù)和使用型元數(shù)據(jù)。
第8章向集成型數(shù)據(jù)集市演變:了解當(dāng)前數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的演變?nèi)〉玫倪M(jìn)展。
第二部分,統(tǒng)一星型模型的應(yīng)用。涵蓋了統(tǒng)一星型模型方法以及它如何解決部分中討論的挑戰(zhàn)。第二部分包含8章:
前言第9章統(tǒng)一星型模型簡(jiǎn)介:熟悉統(tǒng)一星型模型。了解其架構(gòu)和用例,以及統(tǒng)一星型模型方法與傳統(tǒng)構(gòu)建模型方法的差異。統(tǒng)一星型模型的關(guān)鍵概念舉例,如獵人和獵物以及與電話線相連的房屋。了解去范式化的危險(xiǎn)。
第10章數(shù)據(jù)丟失:了解數(shù)據(jù)丟失的原因,以及為什么不建議在數(shù)據(jù)集市中進(jìn)行完全外連接(full outer join)的原因。根據(jù)定義,所有其他連接(內(nèi)連接、左連接和右連接)均會(huì)丟棄某些數(shù)據(jù)。因此,使用這些連接構(gòu)建的數(shù)據(jù)集市也只能解決一部分的問(wèn)題。然而,統(tǒng)一星型模型方法不會(huì)創(chuàng)建任何連接,因此,它不會(huì)丟失任何數(shù)據(jù)。join被引入統(tǒng)一星型模型命名約定中,可使開(kāi)發(fā)人員和終用戶的日常工作更加輕松。另外,需要了解Bridge表,并了解其如何連接到其他表。跟隨Spotfire的實(shí)際效果,它能讓終用戶在沒(méi)有數(shù)據(jù)專家的情況下也很容易創(chuàng)建儀表盤所需要的展示內(nèi)容。
第11章扇形陷阱:了解面向數(shù)據(jù)模型的規(guī)范,并通過(guò)示例學(xué)習(xí)扇形陷阱的危險(xiǎn)。了解一對(duì)多關(guān)系的另一種表示法。區(qū)分連接和關(guān)聯(lián),并能意識(shí)到內(nèi)存關(guān)聯(lián)是扇形陷阱的解決方案。另外,應(yīng)了解“拆分度量(Splitting the Measures)”和“將所有度量移至Bridge表(moving all the measures to the Bridge)”的技術(shù)。后了解習(xí)慣于使用JSON的相關(guān)人員遇到的陷阱及其修復(fù)方法的示例。
第12章Chasm陷阱:回顧笛卡兒乘積,會(huì)看到一個(gè)基于LinkedIn的Chasm陷阱示例,該示例說(shuō)明Chasm陷阱會(huì)產(chǎn)生不需要的重復(fù)項(xiàng)。了解Chasm陷阱如何呈線性增長(zhǎng)以及呈平方增長(zhǎng)。了解Chasm陷阱行計(jì)數(shù)的方法,該方法有助于計(jì)算所得表的準(zhǔn)確行數(shù)。Bridge表基于一個(gè)聯(lián)合體(Union),它不會(huì)創(chuàng)建任何重復(fù)項(xiàng)。后,請(qǐng)參閱JSON Chasm陷阱的示例及其修復(fù)方法。
第13章多事實(shí)查詢:區(qū)分直接連接的多個(gè)事實(shí)與無(wú)直接連接的多個(gè)事實(shí)。了解盡管具有多對(duì)多關(guān)系的操作是聯(lián)合(Union),但該聯(lián)合很難創(chuàng)建并且會(huì)造成混亂。探索BI工具如何能夠構(gòu)建聚合的虛擬行(Rows),以及統(tǒng)一星型模型方法在Bridge表的基礎(chǔ)上如何自然地嵌入聯(lián)合(Union)中。跟隨Spotfire中的實(shí)現(xiàn),了解終用戶可以多么容易地構(gòu)建有價(jià)值的儀表盤(Dashboard)。
第14章循環(huán):了解有關(guān)循環(huán)和解決循環(huán)的5種傳統(tǒng)技術(shù)的更多信息。統(tǒng)一星型模型方法是一種很好的循環(huán)解決方案。在SAP Business Objects實(shí)踐中,說(shuō)明使用統(tǒng)一星型模型方法,終用戶可以擁有真正的“自助服務(wù)體驗(yàn)”。
第15章非一致粒度:通過(guò)示例了解非一致粒度。當(dāng)維度不符合要求時(shí),創(chuàng)建BI解決方案會(huì)帶來(lái)許多挑戰(zhàn),這些挑戰(zhàn)傳統(tǒng)上是通過(guò)創(chuàng)建臨時(shí)查詢或通過(guò)構(gòu)建沒(méi)有集成的儀表盤來(lái)解決的。了解統(tǒng)一星型模型引入了一種稱為“重新范式化”的解決方案。它的優(yōu)勢(shì)在于,只在統(tǒng)一星型模型的設(shè)置階段需要開(kāi)發(fā)人員,同時(shí)統(tǒng)一星型模型不依賴于業(yè)務(wù)需求,因此終用戶可以自由地生成其個(gè)性化的報(bào)告和儀表盤(Dashboard)。
第16章Northwind案例學(xué)習(xí):見(jiàn)證使用ODM檢測(cè)Northwind缺陷有多么簡(jiǎn)單。驗(yàn)證涉及產(chǎn)生扇形陷阱和Chasm陷阱的表,它們的連接存在產(chǎn)生不正確總數(shù)的風(fēng)險(xiǎn)。
比爾?英蒙(Bill Inmon),(生于 1945 年)是一位美國(guó)計(jì)算機(jī)科學(xué)家,被許多人公認(rèn)為數(shù)據(jù)倉(cāng)庫(kù)之父。他是個(gè)提供數(shù)據(jù)倉(cāng)庫(kù)課程的人,創(chuàng)建了數(shù)據(jù)倉(cāng)庫(kù)的公認(rèn)定義——一種面向主題的、非易失的、集成的、時(shí)變的數(shù)據(jù)集合,以支持管理層的決策。與另一位開(kāi)創(chuàng)性的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)師 Ralph Kimball 的方法相比,Inmon 的方法通常被描述為自上而下的方法。1999 年,Bill 創(chuàng)建了企業(yè)信息工廠網(wǎng)站,向?qū)I(yè)人士和決策者介紹數(shù)據(jù)倉(cāng)庫(kù)和企業(yè)信息工廠。此外,Bill Inmon 是政府信息工廠和數(shù)據(jù)倉(cāng)庫(kù) 2.0 的創(chuàng)建者。 Bill Inmon先生在數(shù)據(jù)倉(cāng)庫(kù)和企業(yè)信息工廠的構(gòu)建、使用和維護(hù)方面是一位多產(chǎn)的作者。他的著作包括“構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)”(1992 年,以及后來(lái)的版本)和“DW 2.0:下一代數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)”(2008 年)。
2007 年 7 月,Bill Inmon被 Computerworld 評(píng)為對(duì)計(jì)算機(jī)行業(yè)前 40 年影響*大的十位人物之一。
序言
前言
推薦語(yǔ)
致謝
部分體系結(jié)構(gòu) /
第1章數(shù)據(jù)集市與維度模型 /
第2章維度建模概念 /
第3章數(shù)據(jù)集市演變 /
第4章轉(zhuǎn)換 /
第5章集成數(shù)據(jù)集市的方法 /
第6章監(jiān)控?cái)?shù)據(jù)集市環(huán)境 /
被頻繁使用的數(shù)據(jù)與不被頻繁使用的數(shù)據(jù) /
刪除不被頻繁使用的數(shù)據(jù) /
丟棄舊版本的數(shù)據(jù)集市 /
第7章數(shù)據(jù)集市環(huán)境中的元數(shù)據(jù)和文檔 /
簡(jiǎn)單表和元素的元數(shù)據(jù) /
數(shù)據(jù)來(lái)源元數(shù)據(jù) /
加載日期型元數(shù)據(jù) /
組合型元數(shù)據(jù) /
使用型元數(shù)據(jù) /
第8章向集成型數(shù)據(jù)集市演變 /
數(shù)據(jù)不一致 /
糟糕的公司決策 /
進(jìn)入數(shù)據(jù)倉(cāng)庫(kù):?jiǎn)我话姹臼聦?shí) /
第二部分統(tǒng)一星型模型的應(yīng)用 /
第9章統(tǒng)一星型模型簡(jiǎn)介 /
架構(gòu) /
統(tǒng)一星型建模方法 /
獵食者與獵物 /
循環(huán) /
中央表 /
去范式化的威脅 /
第10章數(shù)據(jù)丟失 /
基于Sales表和Products表的示例 /
延遲連接 /
統(tǒng)一星型模型的核心:Bridge表 /
統(tǒng)一星型模型命名約定 /
統(tǒng)一星型模型如何解決數(shù)據(jù)丟失 /
使用Tibco Spotfire實(shí)施 /
第11章扇形陷阱 /
面向數(shù)據(jù)模型的約定 /
扇形陷阱的定義 /
基于Sales表和Shipments表的示例 /
一對(duì)多關(guān)系可視化 /
統(tǒng)一星型模型如何解決扇形陷阱 /
使用Microsoft Power BI實(shí)現(xiàn) /
你的BI工具支持關(guān)聯(lián)嗎 /
拆分度量 /
將所有度量移到Bridge表 /
JSON扇形陷阱 /
第12章Chasm陷阱 /
笛卡兒乘積 /
Chasm陷阱的定義 /
基于LinkedIn的示例 /
Chasm陷阱行數(shù)計(jì)算方法 /
有度量的Chasm陷阱 /
USS如何解決Chasm陷阱 /
Tableau應(yīng)用 /
基于多表的Chasm陷阱 /
JSON Chasm陷阱 /
第13章多事實(shí)查詢 /
直接連接的多事實(shí)查詢(一對(duì)多) /
無(wú)直接連接的多事實(shí)查詢(多對(duì)多) /
基于Sales表和Purchases表的示例 /
聯(lián)合 /
BI工具中聚合的彈簧效應(yīng) /
統(tǒng)一星型模型如何解決多事實(shí)查詢 /
用Tibco Spotfire實(shí)施 /
第14章循環(huán) /
基于客戶關(guān)系管理系統(tǒng)的例子 /
使用傳統(tǒng)技術(shù)解決循環(huán) /
用聯(lián)合(Union)來(lái)處理循環(huán) /
統(tǒng)一星型模型如何解決循環(huán)問(wèn)題 /
采用SAP Business Objects實(shí)現(xiàn)統(tǒng)一星型模型 /
第15章非一致粒度 /
基于Sales表和Targets表的示例 /
了解挑戰(zhàn) /
重新范式化 /
統(tǒng)一星型模型怎樣解決非一致粒度 /
QlikView實(shí)現(xiàn) /
處理聚合和詳細(xì)信息 /
第16章Northwind案例學(xué)習(xí) /
Northwind的面向數(shù)據(jù)模型 /
發(fā)現(xiàn)問(wèn)題 /
了解陷阱的影響 /
安全區(qū) /
從即席查詢到自助式商業(yè)智能 /
具有挑戰(zhàn)性的業(yè)務(wù)需求示例 /
如何在Northwind數(shù)據(jù)庫(kù)中實(shí)現(xiàn)統(tǒng)一星型模型 /
使用各種商業(yè)智能工具實(shí)施 /
總結(jié) /