數(shù)據(jù)自助服務(wù)實(shí)踐指南:數(shù)據(jù)開(kāi)放與洞察提效
定 價(jià):99 元
叢書(shū)名:O'Reilly精品圖書(shū)系列
- 作者:[美]桑迪普·烏坦坎達(dá)尼(SandeepUttamchandani)著,吳瑞誠(chéng),熊暢,王曉倩譯
- 出版時(shí)間:2022/5/1
- ISBN:9787111703853
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):TP274-62
- 頁(yè)碼:228
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
本書(shū)主要介紹數(shù)據(jù)洞察及其四個(gè)階段,第1部分為自助服務(wù)數(shù)據(jù)發(fā)現(xiàn),包括元數(shù)據(jù)目錄服務(wù)、搜索服務(wù)、特征存儲(chǔ)服務(wù)、數(shù)據(jù)遷移服務(wù)、點(diǎn)擊流跟蹤服務(wù)。第二部分 為自助服務(wù)數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)湖管理服務(wù)、數(shù)據(jù)整理服務(wù)、數(shù)據(jù)權(quán)限治理服務(wù)。第三部分為自助服務(wù)數(shù)據(jù)構(gòu)建,包括、數(shù)據(jù)虛擬化服務(wù)、模型訓(xùn)練服務(wù)、持續(xù)集成服務(wù)、A/B測(cè)試服務(wù)。第四部分為自助服務(wù)數(shù)據(jù)實(shí)施,包括查詢(xún)優(yōu)化服務(wù)、管道編排服務(wù)、模型部署服務(wù)、質(zhì)量監(jiān)控服務(wù)、成本管理服務(wù)。通過(guò)學(xué)習(xí)本書(shū),數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和團(tuán)隊(duì)經(jīng)理將學(xué)習(xí)如何構(gòu)建一個(gè)自助數(shù)據(jù)科學(xué)平臺(tái),幫助你的組織中的任何人從數(shù)據(jù)中提取見(jiàn)解。
適讀人群 :數(shù)據(jù)工程師、數(shù)據(jù)平臺(tái)開(kāi)發(fā)人員
數(shù)據(jù)驅(qū)動(dòng)的洞察是當(dāng)今所有行業(yè)的關(guān)鍵競(jìng)爭(zhēng)優(yōu)勢(shì)。從原始數(shù)據(jù)中提取洞察往往需要幾天或幾周時(shí)間,大多數(shù)組織無(wú)法足夠快地?cái)U(kuò)大數(shù)據(jù)科學(xué)團(tuán)隊(duì)以跟上需要轉(zhuǎn)換的數(shù)據(jù)量的增長(zhǎng)。那么如何解決這一問(wèn)題呢?答案是實(shí)現(xiàn)數(shù)據(jù)自助服務(wù)。
通過(guò)本書(shū),數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和團(tuán)隊(duì)經(jīng)理將學(xué)習(xí)如何構(gòu)建自助數(shù)據(jù)平臺(tái),以幫助組織從數(shù)據(jù)中提取洞察。作者在書(shū)中提供了一個(gè)記分卡,用于跟蹤并解決在數(shù)據(jù)發(fā)現(xiàn)、轉(zhuǎn)換、處理和生產(chǎn)過(guò)程中增加洞察耗時(shí)的瓶頸問(wèn)題。
本書(shū)彌合了數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師之間的鴻溝——數(shù)據(jù)科學(xué)家被工程現(xiàn)實(shí)所束縛,而數(shù)據(jù)工程師對(duì)自助服務(wù)的工作方式一無(wú)所知。
通過(guò)學(xué)習(xí)本書(shū),你將能夠:
? 構(gòu)建自助服務(wù)門(mén)戶(hù)以支持?jǐn)?shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)沿襲和數(shù)據(jù)治理。
? 使用開(kāi)源技術(shù)為每個(gè)自助服務(wù)功能選擇佳方法。
? 為數(shù)據(jù)的發(fā)現(xiàn)、準(zhǔn)備、構(gòu)建、實(shí)施定制自助服務(wù)。
? 實(shí)現(xiàn)數(shù)據(jù)開(kāi)放與洞察提效的功能。
? 擴(kuò)展自助服務(wù)門(mén)戶(hù)以為組織內(nèi)的大量用戶(hù)提供支持。
排版約定
本書(shū)中使用以下排版約定:
斜體(Italic)
表示新的術(shù)語(yǔ)、URL、電子郵件地址、文件名和文件擴(kuò)展名。
等寬字體(Constant width)
用于程序清單,以及段落中的程序元素,例如變量名、函數(shù)名、數(shù)據(jù)庫(kù)、數(shù)據(jù)類(lèi)型、環(huán)境變量、語(yǔ)句以及關(guān)鍵字。
等寬粗體(Constant width bold)
表示應(yīng)由用戶(hù)直接輸入的命令或其他文本。
等寬斜體(Constant width italic)
表示應(yīng)由用戶(hù)提供的值或由上下文確定的值替換的文本。
該圖示表示提示或建議。
該圖示表示一般性說(shuō)明。
該圖示表示警告或注意。
示例代碼
可以從https://oreil.ly/ssdr-book下載補(bǔ)充材料(示例代碼、練習(xí)、勘誤等)。
這里的代碼是為了幫助你更好地理解本書(shū)的內(nèi)容。通常,可以在程序或文檔中使用本書(shū)中的代碼,而不需要聯(lián)系O’Reilly獲得許可,除非需要大段地復(fù)制代碼。例如,使用本書(shū)中所提供的幾個(gè)代碼片段來(lái)編寫(xiě)一個(gè)程序不需要得到我們的許可,但銷(xiāo)售或發(fā)布O’Reilly的示例代碼則需要獲得許可。引用本書(shū)的示例代碼來(lái)回答問(wèn)題也不需要許可,將本書(shū)中的很大一部分示例代碼放到自己的產(chǎn)品文檔中則需要獲得許可。
非常歡迎讀者使用本書(shū)中的代碼,希望(但不強(qiáng)制)注明出處。注明出處時(shí)包含書(shū)名、作者、出版社和ISBN,例如:
The Self-Service Data Roadmap,作者Sandeep Uttamchandani,由O’Reilly出版,書(shū)號(hào)978-1-492-07525-7
如果讀者覺(jué)得對(duì)示例代碼的使用超出了上面所給出的許可范圍,歡迎通過(guò)permissions@oreilly.com聯(lián)系我們。
O’Reilly在線學(xué)習(xí)平臺(tái)(O’Reilly Online Learning)
40多年來(lái),O’Reilly Media致力于提供技術(shù)和商業(yè)培訓(xùn)、知識(shí)和卓越見(jiàn)解,來(lái)幫助眾多公司取得成功。
我們擁有獨(dú)一無(wú)二的專(zhuān)家和革新者組成的龐大網(wǎng)絡(luò),他們通過(guò)圖書(shū)、文章、會(huì)議和我們的在線學(xué)習(xí)平臺(tái)分享他們的知識(shí)和經(jīng)驗(yàn)。O’Reilly的在線學(xué)習(xí)平臺(tái)允許你按需訪問(wèn)現(xiàn)場(chǎng)培訓(xùn)課程、深入的學(xué)習(xí)路徑、交互式編程環(huán)境,以及O’Reilly和200多家其他出版商提供的大量文本和視頻資源。有關(guān)的更多信息,請(qǐng)?jiān)L問(wèn)http://oreilly.com。
如何聯(lián)系我們
對(duì)于本書(shū),如果有任何意見(jiàn)或疑問(wèn),請(qǐng)按照以下地址聯(lián)系本書(shū)出版商。
美國(guó):
O’Reilly Media,Inc.
1005 Gravenstein Highway North
Sebastopol,CA 95472
中國(guó):
北京市西城區(qū)西直門(mén)南大街2號(hào)成銘大廈C座807室(100035)
奧萊利技術(shù)咨詢(xún)(北京)有限公司
要詢(xún)問(wèn)技術(shù)問(wèn)題或?qū)Ρ緯?shū)提出建議,請(qǐng)發(fā)送電子郵件至bookquestions@oreilly.com。
本書(shū)配套網(wǎng)站https://oreil.ly/ssdr上列出了勘誤表、示例以及其他信息。
關(guān)于書(shū)籍、課程、會(huì)議和新聞的更多信息,請(qǐng)?jiān)L問(wèn)我們的網(wǎng)站http://www.oreilly.com。
我們?cè)贔acebook上的地址:http://facebook.com/oreilly
我們?cè)赥witter上的地址:http://twitter.com/oreillymedia
我們?cè)赮ouTube上的地址:http://www.youtube.com/oreillymedia
前言1
第1章 數(shù)據(jù)介紹5
1.1 從原始數(shù)據(jù)到洞察6
1.2 定義洞察耗時(shí)記分卡13
1.3 建立數(shù)據(jù)自助服務(wù)路線圖17
第一部分 數(shù)據(jù)發(fā)現(xiàn)自助服務(wù)
第2章 元數(shù)據(jù)目錄服務(wù)21
2.1 路線圖22
2.2 最小化解釋耗時(shí)23
2.3 定義需求26
2.4 實(shí)現(xiàn)模式28
2.5 總結(jié)32
第3章 搜索服務(wù)33
3.1 路線圖33
3.2 最小化搜索耗時(shí)34
3.3 定義需求36
3.4 實(shí)現(xiàn)模式38
3.5 總結(jié)45
第4章 特征存儲(chǔ)服務(wù)46
4.1 路線圖47
4.2 最小化特征處理耗時(shí)48
4.3 定義需求49
4.4 實(shí)現(xiàn)模式51
4.5 總結(jié)55
第5章 數(shù)據(jù)遷移服務(wù)56
5.1 路線圖56
5.2 最小化數(shù)據(jù)可用性耗時(shí)57
5.3 定義需求58
5.4 實(shí)現(xiàn)模式62
5.5 總結(jié)68
第6章 點(diǎn)擊流跟蹤服務(wù)69
6.1 路線圖70
6.2 最小化點(diǎn)擊指標(biāo)耗時(shí)71
6.3 定義需求73
6.4 實(shí)現(xiàn)模式75
6.5 總結(jié)79
第二部分 數(shù)據(jù)準(zhǔn)備自助服務(wù)
第7章 數(shù)據(jù)湖管理服務(wù)83
7.1 路線圖84
7.2 最小化數(shù)據(jù)湖管理耗時(shí)86
7.3 實(shí)現(xiàn)模式91
7.4 總結(jié)94
第8章 數(shù)據(jù)整理服務(wù)95
8.1 路線圖96
8.2 最小化數(shù)據(jù)整理耗時(shí)97
8.3 定義需求98
8.4 實(shí)現(xiàn)模式98
8.5總結(jié)100
第9章 數(shù)據(jù)權(quán)限治理服務(wù)101
9.1 路線圖102
9.2 最小化合規(guī)耗時(shí)103
9.3 定義需求104
9.4 實(shí)現(xiàn)模式107
9.5總結(jié)111
第三部分 數(shù)據(jù)構(gòu)建自助服務(wù)
第10章 數(shù)據(jù)虛擬化服務(wù)115
10.1 路線圖116
10.2 最小化查詢(xún)耗時(shí)116
10.3 定義需求117
10.4 實(shí)現(xiàn)模式119
10.5 總結(jié)124
第11章 數(shù)據(jù)轉(zhuǎn)換服務(wù)125
11.1 路線圖125
11.2 最小化轉(zhuǎn)換耗時(shí)126
11.3 定義需求127
11.4 實(shí)現(xiàn)模式128
11.5總結(jié)133
第12章 模型訓(xùn)練服務(wù)134
12.1 路線圖135
12.2 最小化訓(xùn)練耗時(shí)136
12.3 定義需求138
12.4實(shí)現(xiàn)模式140
12.5 總結(jié)144
第13章 持續(xù)集成服務(wù)145
13.1 路線圖146
13.2 最小化集成耗時(shí)147
13.3 定義需求148
13.4 實(shí)現(xiàn)模式149
13.5 總結(jié)152
第14章 A/B測(cè)試服務(wù)153
14.1 路線圖155
14.2 最小化A/B測(cè)試耗時(shí)156
14.3 實(shí)現(xiàn)模式158
14.4 總結(jié)160
第四部分 數(shù)據(jù)實(shí)施自助服務(wù)
第15章 查詢(xún)優(yōu)化服務(wù)163
15.1 路線圖164
15.2 最小化優(yōu)化耗時(shí)165
15.3 定義需求167
15.4 實(shí)現(xiàn)模式168
15.5 總結(jié)173
第16章 管道編排服務(wù)174
16.1 路線圖175
16.2 最小化編排耗時(shí)176
16.3 定義需求177
16.4 實(shí)現(xiàn)模式179
16.5總結(jié)183
第17章 模型部署服務(wù)184
17.1 路線圖184
17.2 最小化部署耗時(shí)185
17.3 定義需求186
17.4 實(shí)現(xiàn)模式189
17.5 總結(jié)193
第18章 質(zhì)量可觀測(cè)性服務(wù)194
18.1 路線圖195
18.2 最小化洞察質(zhì)量耗時(shí)196
18.3 定義需求198
18.4 實(shí)現(xiàn)模式199
18.5 總結(jié)204
第19章 成本管理服務(wù)205
19.1 路線圖206
19.2 最小化優(yōu)化成本耗時(shí)207
19.3 定義需求208
19.4 實(shí)現(xiàn)模式209
19.5 總結(jié)213