本書是“大數(shù)據(jù)技術”叢書的首冊,編譯自Yang Y. Lee、Leo L.Pipino、James D. Funk和Richard Y. Wang合作編著的《Journey to Data Quality》,四位作者都是國際數(shù)據(jù)質(zhì)量研究的先驅(qū),該書堪稱數(shù)據(jù)質(zhì)量領域的經(jīng)典之作。
第1章 引言
1.1 信息可以被共享嗎
1.2 新系統(tǒng)不是解決辦法
1.3 開啟數(shù)據(jù)質(zhì)量之旅
1.4 成功開始的故事
1.5 CEO領導的旅程
1.6 數(shù)據(jù)質(zhì)量之旅面臨的挑戰(zhàn)
1.7 數(shù)據(jù)質(zhì)量為什么重要
1.8 本書概覽
第2章 成本一效益分析
2.1 挑戰(zhàn)性
2.2 成本一收益的權衡
2.3 -個案例
2.4 高級成本一效益分析技術
2.5 本章小結
第3章 數(shù)據(jù)質(zhì)量評估(一)
3.1 評估技術和相關方法
3.2 實際中的評價方法
3.3 差距分析技術
3.4 數(shù)據(jù)完整性評價
3.5 本章小結
附錄 數(shù)據(jù)質(zhì)量評價調(diào)查(IQA)問卷
第4章 數(shù)據(jù)質(zhì)量評估(二)
4.1 科德完整性約束
4.2 數(shù)據(jù)質(zhì)量指標
4.3 自動化的測量方法
4.4 嵌入過程的數(shù)據(jù)整體性方法
4.5 本章小結
第5章 保證數(shù)據(jù)質(zhì)量的抽樣方法
5.1 基本概念
5.2 選擇抽樣過程
5.3 確定樣本量
5.4 交易數(shù)據(jù)庫的抽樣
5.5 環(huán)境擴展:分布式數(shù)據(jù)庫和數(shù)據(jù)倉庫
5.6 本章小結
第6章 數(shù)據(jù)質(zhì)量問題及其模式剖析
6.1 數(shù)據(jù)質(zhì)量問題的十大根源
6.2 數(shù)據(jù)質(zhì)量問題的表現(xiàn)
6.3 數(shù)據(jù)質(zhì)量問題的轉(zhuǎn)換
6.4 本章小結
第7章 識別數(shù)據(jù)質(zhì)量問題的根本原因——一個醫(yī)療保健組織案例
7.1 案例:好感覺健康系統(tǒng)公司
7.2 識別問題
7.3 組建跨部門的團隊
7.4 采用一種框架:建立并測試假設
7.5 關鍵信息
7.6 找出數(shù)據(jù)質(zhì)量問題的誘因
7.7 本章小結
第8章 數(shù)據(jù)的產(chǎn)品化管理
8.1 數(shù)據(jù)產(chǎn)品
8.2 四個案例
8.3 四個原則
8.4 把數(shù)據(jù)當成副產(chǎn)品來管理是無效的
8.5 本章小結
第9章 開發(fā)數(shù)據(jù)產(chǎn)品地圖
9.1 數(shù)據(jù)產(chǎn)品地圖的概念、定義和符號
9.2 繪制數(shù)據(jù)產(chǎn)品地圖的步驟
9.3 建立數(shù)據(jù)產(chǎn)品地圖的一個案例
9.4 本章小結
附錄 基于IPMAP的圖形化編輯軟件
第10章 數(shù)據(jù)質(zhì)量實踐——一家大型教學醫(yī)院的案例
10.1 LTH健康系統(tǒng)案例研究
10.2 提交數(shù)據(jù)質(zhì)量改進項目
10.3 數(shù)據(jù)產(chǎn)品地圖
10.4 改進方案:當前的處理過程和未來計劃
10.5 本章小結
第11章 數(shù)據(jù)質(zhì)量政策
11.1 十大政策指引
11.2 本章小結
附錄1 數(shù)據(jù)質(zhì)量崗位介紹
附錄2 來自全球制造公司的數(shù)據(jù)架構政策示例
附錄3 數(shù)據(jù)質(zhì)量實踐與產(chǎn)品評估工具
第12章 旅途結束了嗎
12.1 要點回顧
12.2 面臨的挑戰(zhàn)和威脅
12.3 對數(shù)據(jù)質(zhì)量特征的規(guī)范定義
12.4 公司家族化
12.5 數(shù)據(jù)挖掘
12.6 數(shù)據(jù)集成
12.7 安全性
12.8 有線和無線的世界
12.9 后記
附錄一 種基于期望失驗理論的信息質(zhì)量評估指標體系
F.1 引言
F.2 文獻回顧
F.3 信息質(zhì)量的概念
F.4 信息質(zhì)量的指標體系
F.5 討論
參考文獻
編譯者后記