數(shù)據(jù)科學(xué)與商業(yè)分析 用機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué)優(yōu)化商業(yè)決策
定 價(jià):99 元
- 作者:[美] 馬特·塔迪(Matt Taddy)
- 出版時(shí)間:2021/3/1
- ISBN:9787115559135
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:251
- 紙張:
- 版次:01
- 開本:16開
大數(shù)據(jù)和機(jī)器學(xué)習(xí)等的興起使得商業(yè)分析領(lǐng)域越來越倚重?cái)?shù)據(jù)科學(xué)。本書詳細(xì)介紹了商業(yè)數(shù)據(jù)科學(xué)中的關(guān)鍵元素,匯集了機(jī)器學(xué)習(xí)、經(jīng)濟(jì)學(xué)以及統(tǒng)計(jì)學(xué)領(lǐng)域的核心原則和最佳實(shí)踐,內(nèi)容涵蓋識(shí)別商業(yè)政策中的重要變量、通過實(shí)驗(yàn)測(cè)量這些變量,以及挖掘社交媒體以了解公眾對(duì)于政策修改的反應(yīng),為從事商業(yè)數(shù)據(jù)科學(xué)的數(shù)據(jù)科學(xué)家和商業(yè)人士提供了必備工具。書中通過大量數(shù)據(jù)分析示例講解如何利用R語言編寫腳本來解決復(fù)雜的數(shù)據(jù)科學(xué)問題。
1.亞馬遜北美首席經(jīng)濟(jì)學(xué)家,前芝加哥大學(xué)統(tǒng)計(jì)學(xué)教授帶你解決從數(shù)據(jù)到業(yè)務(wù)實(shí)操的最后一公里問題;
2.書中通過大量數(shù)據(jù)分析示例講解如何利用R語言編寫腳本來解決復(fù)雜的數(shù)據(jù)科學(xué)問題;
3.本書是解決數(shù)據(jù)業(yè)務(wù)問題的實(shí)踐指南,旨在通過大量真實(shí)的一線案例,介紹如何將業(yè)務(wù)問題和數(shù)據(jù)聯(lián)系起來;
4.本書詳細(xì)展示應(yīng)用統(tǒng)計(jì)學(xué)+機(jī)器學(xué)習(xí)+經(jīng)濟(jì)學(xué)進(jìn)行數(shù)據(jù)分析,進(jìn)而驅(qū)動(dòng)和優(yōu)化商業(yè)決策的過程。
5.基于R語言。
Matt Taddy,美國經(jīng)濟(jì)學(xué)家、數(shù)據(jù)科學(xué)家,F(xiàn)任亞馬遜北美首席經(jīng)濟(jì)學(xué)家、大名鼎鼎的亞馬遜經(jīng)濟(jì)學(xué)家團(tuán)隊(duì)Central Economics Team VP。曾任芝加哥大學(xué)布斯商學(xué)院計(jì)量經(jīng)濟(jì)學(xué)和統(tǒng)計(jì)學(xué)教授,明星教師,開創(chuàng)了數(shù)據(jù)科學(xué)課程。曾任微軟商務(wù)人工智能首席研究員、eBay研究員。
對(duì)本書的贊譽(yù)
獻(xiàn)詞
前言
常見符號(hào)的標(biāo)準(zhǔn)用法
第0章 引言 1
從兩張圖說起 1
大數(shù)據(jù)與機(jī)器學(xué)習(xí) 4
計(jì)算 6
第 1章 不確定性 14
1.1 頻率不確定性和bootstrap方法 14
1.2 假設(shè)檢驗(yàn)和錯(cuò)誤發(fā)現(xiàn)率控制 25
1.3 貝葉斯推斷 33
第 2章 回歸 37
2.1 線性模型 37
2.2 邏輯回歸 46
2.3 偏差與似然 49
2.4 ◆回歸不確定性 53
2.5 空間和時(shí)間 56
第3章 正則化 64
3.1 樣本外預(yù)測(cè)效果 64
3.2 正則化方法 68
3.3 模型選擇 77
3.4 ◆lasso的不確定性量化 87
第4章 分類 94
4.1 最近鄰 94
4.2 概率、成本和分類 97
4.3 多元邏輯回歸 102
4.4 分布式多元回歸 106
4.5 分布式與大數(shù)據(jù) 110
第5章 實(shí)驗(yàn) 114
5.1 隨機(jī)控制試驗(yàn) 115
5.2 近似實(shí)驗(yàn)設(shè)計(jì) 125
5.3 ◆工具變量 135
第6章 控制 143
6.1 條件可忽略性與線性處理效果 143
6.2 高維混淆變量調(diào)整 146
6.3 ◆樣本分割與正交機(jī)器學(xué)習(xí) 148
6.4 異質(zhì)性處理效果 152
6.5 合成控制法 164
第7章 分解 167
7.1 聚類 167
7.2 因子模型和主成分分析 173
7.3 主成分回歸 180
7.4 偏最小二乘法 184
第8章 文本作為數(shù)據(jù) 189
8.1 分詞 190
8.2 文本回歸 194
8.3 主題模型 194
8.4 多元逆回歸 200
8.5 協(xié)同過濾 204
8.6 詞嵌入技術(shù) 206
第9章 非參數(shù)方法 209
9.1 決策樹 210
9.2 隨機(jī)森林 216
9.3 因果關(guān)系樹 224
9.4 半?yún)?shù)方法與高斯過程 228
第 10章 人工智能 233
10.1 什么是人工智能 233
10.2 通用機(jī)器學(xué)習(xí) 237
10.3 深度學(xué)習(xí) 240
10.4 ◆SGD 244
10.5 強(qiáng)化學(xué)習(xí) 248
10.6 商業(yè)環(huán)境中的人工智能 251