數(shù)據(jù)陷阱:不可不知的數(shù)據(jù)處理、分析和可視化錯(cuò)誤
定 價(jià):99 元
- 作者:[美]本·瓊斯(Ben Jones)
- 出版時(shí)間:2022/11/1
- ISBN:9787300310633
- 出 版 社:中國人民大學(xué)出版社
- 中圖法分類:TP274
- 頁碼:264
- 紙張:
- 版次:1
- 開本:16開
7大數(shù)據(jù)陷阱的干貨總結(jié)與避坑錦囊,教會(huì)數(shù)據(jù)工作者如何在數(shù)據(jù)陷阱中迅速恢復(fù),避免踩雷
數(shù)據(jù)陷阱無處不在,任何處理過數(shù)據(jù)的人都會(huì)在不知不覺中多次陷入其中。我們大多數(shù)人都還沒有學(xué)會(huì)如何使用現(xiàn)代工具和所掌握的數(shù)據(jù)類型,從而導(dǎo)致了一些本可以輕易避免的常見的錯(cuò)誤。
在本書中,作者為我們展示了以下七種在數(shù)據(jù)處理過程中常見的數(shù)據(jù)陷阱:
陷阱 1:認(rèn)知誤差——我們?nèi)绾慰创龜?shù)據(jù);
陷阱 2:技術(shù)陷阱——我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行處理;
陷阱 3:數(shù)學(xué)失誤——我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行計(jì)算;
陷阱 4:統(tǒng)計(jì)疏忽——我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行比較;
陷阱 5:分析偏差——我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行分析;
陷阱 6:繪圖烏龍——我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行可視化;
陷阱 7:設(shè)計(jì)風(fēng)險(xiǎn)——我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行修飾。
同時(shí)也向我們展示了這些數(shù)據(jù)陷阱是如何產(chǎn)生、如何變得如此常見的,指導(dǎo)我們?nèi)绾螐囊婚_始就避免它們,并針對(duì)上述數(shù)據(jù)陷阱,提供了與之相對(duì)應(yīng)的真實(shí)示例,以及數(shù)據(jù)可視化的實(shí)用指導(dǎo)。閱讀本書,你將:
·深入了解隨著我們對(duì)數(shù)據(jù)的依賴而增長的“數(shù)據(jù)與現(xiàn)實(shí)的差距”;
·了解如何使用正確的工具簡(jiǎn)化可視化過程;
·避免數(shù)據(jù)分析、可視化和演示中的常見錯(cuò)誤;
·創(chuàng)建并呈現(xiàn)清晰、準(zhǔn)確、有效的數(shù)據(jù)可視化。
◆ 作者簡(jiǎn)介
本·瓊斯
Data Literacy公司創(chuàng)始人兼首席執(zhí)行官,在華盛頓大學(xué)連續(xù)學(xué)院教授數(shù)據(jù)可視化。著有《用Tableau交流數(shù)據(jù)》(Communicating Data with Tableau)和《數(shù)據(jù)素養(yǎng)的17個(gè)關(guān)鍵特征》(17 Key Traits of Data Literacy)。憑借20多年的機(jī)械工程師、持續(xù)改進(jìn)項(xiàng)目負(fù)責(zé)人和導(dǎo)師以及商業(yè)智能營銷人員的工作經(jīng)驗(yàn),他學(xué)到很多關(guān)于處理數(shù)據(jù)時(shí)應(yīng)該做什么和不應(yīng)該做什么的知識(shí)。
◆ 譯者簡(jiǎn)介
陳天皓
工商管理和信息技術(shù)雙碩士,項(xiàng)目管理專業(yè)人士。曾譯有《商業(yè)儀表盤可視化解決方案》《人類未來進(jìn)化史》等書,長期關(guān)注科技發(fā)展趨勢(shì)與數(shù)據(jù)應(yīng)用領(lǐng)域。
段力鱺
香港城市大學(xué)統(tǒng)計(jì)學(xué)碩士,深耕大數(shù)據(jù)挖掘與分析領(lǐng)域,曾分別于英國保誠(亞洲總部)、平安壽險(xiǎn)總部擔(dān)任數(shù)據(jù)科學(xué)家。現(xiàn)就職于沃爾瑪中國,擔(dān)任商業(yè)分析經(jīng)理。
步凡
北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院本科,美國杜克大學(xué)統(tǒng)計(jì)學(xué)博士,F(xiàn)任美國加州大學(xué)洛杉磯分校(UCLA)博士后研究員。主要研究方向?yàn)樨惾~斯統(tǒng)計(jì)、隨機(jī)過程模型、傳染病動(dòng)力模型等。
第1章 七類數(shù)據(jù)陷阱 / 1
七種特定類型的數(shù)據(jù)陷阱 / 5
避免七種數(shù)據(jù)陷阱 / 9
“我掉進(jìn)陷阱里,爬不出來了” / 10
第2章 陷阱 1: 認(rèn)知誤差 / 13
我們?nèi)绾慰创龜?shù)據(jù) / 15
陷阱 1A:數(shù)據(jù)與現(xiàn)實(shí)的差距 / 16
陷阱 1B:過度依賴手工的數(shù)據(jù) / 26
陷阱 1C:前后矛盾的評(píng)分 / 34
陷阱 1D:黑天鵝陷阱 / 42
陷阱 1E:可證偽性與上帝陷阱 / 45
避免天鵝陷阱和上帝陷阱 / 47
第3章 陷阱 2:技術(shù)陷阱 / 51
我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行處理 / 53
陷阱 2A:臟數(shù)據(jù) / 54
陷阱 2B:糟糕的混合和連接 / 73
第4章 陷阱 3:數(shù)學(xué)失誤 / 77
我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行計(jì)算 / 79
陷阱 3A:多重匯總 / 80
陷阱 3B:缺失值 / 86
陷阱 3C:匯總數(shù) / 91
陷阱 3D:荒謬的百分比 / 96
陷阱 3E:不匹配的單位 / 102
第5章 陷阱 4:統(tǒng)計(jì)疏忽 / 107
我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行比較 / 109
陷阱 4A:描述性錯(cuò)誤 / 111
陷阱 4B:推斷陷阱 / 131
陷阱 4C:狡猾的抽樣 / 135
陷阱 4D:對(duì)樣本量不敏感 / 142
第6章 陷阱 5:分析偏差 / 147
我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行分析 / 149
陷阱 5A:錯(cuò)誤地認(rèn)為直覺和分析相互對(duì)立 / 150
陷阱 5B:浮夸的外推 / 158
陷阱 5C:欠考慮的插值 / 163
陷阱 5D:不靠譜的預(yù)測(cè) / 166
陷阱 5E:不過腦子的衡量指標(biāo) / 168
第7章 陷阱 6:繪圖烏龍 / 175
我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行可視化 / 177
陷阱 6A:棘手的圖表 / 179
陷阱 6B:數(shù)據(jù)教條主義 / 204
陷阱 6C:錯(cuò)誤地認(rèn)為“最優(yōu)”和“滿意”相互對(duì)立 / 209
第8章 陷阱 7:設(shè)計(jì)風(fēng)險(xiǎn) / 215
我們?nèi)绾螌?duì)數(shù)據(jù)進(jìn)行修飾 / 217
陷阱 7A:令人困惑的顏色 / 219
陷阱 7B:遺漏的機(jī)會(huì) / 224
陷阱 7C:可用性 / 230
第9章 結(jié)語 / 239
避免陷入數(shù)據(jù)陷阱的檢查單 / 245
“未被聽見的聲音”陷阱 / 247
譯者后記 / 251