久久嫩草,有夫之妇中文字幕,色综合激情一区二区三区

本書是一本區(qū)分統(tǒng)計數(shù)據(jù)挖掘和機器學(xué)習(xí)數(shù)據(jù)挖掘的圖書。它創(chuàng)造性地匯編了數(shù)據(jù)挖掘技術(shù)，解決了對經(jīng)典和現(xiàn)代統(tǒng)計方法框架的擴展，用于預(yù)測建模和大數(shù)據(jù)分析。SM-DM為數(shù)據(jù)挖掘領(lǐng)域新晉的數(shù)據(jù)科學(xué)家所面臨的共同問題提供了適當(dāng)?shù)慕鉀Q方案。它的展示側(cè)重于數(shù)據(jù)科學(xué)家(通常被稱為統(tǒng)計學(xué)家、數(shù)據(jù)采礦者和數(shù)據(jù)分析師)的需求，提供實用但又強大的、簡單而又有洞察力的量化技術(shù)，其中大部分使用了新機器學(xué)習(xí)影響改進的舊統(tǒng)計方法。

第3版前言
大數(shù)據(jù)的預(yù)測分析法在本書第2版出版之后的四年來一直保持著穩(wěn)定的熱度。我之所以決定寫作新版，不是因為第2版的成功，而是因為我收到的大量正面反饋（讀者來信）。而且，重要的是，我需要分享解決問題的方法。這些問題還沒有被人們普遍接受的、可靠的或者已知的解決方案。與上一版一樣，約翰·圖基（John Tukey）原則是推進統(tǒng)計學(xué)的發(fā)展以及提高靈活性、實用性、創(chuàng)新性和普遍性所必需的，是各章介紹的新分析法和建模方法論的試金石。
第3版的主要目標(biāo)如下：
1）擴充核心內(nèi)容，包括解決問題的策略和方法，它們來自預(yù)測分析學(xué)術(shù)會議和統(tǒng)計建模研討會，以及我對Statistics on the Table [1]的一些想法。
2）重新編輯現(xiàn)有章節(jié)，提高寫作質(zhì)量；修改結(jié)尾部分，使內(nèi)容更緊湊。
3）提供本書推薦的分析方法和建模的統(tǒng)計子程序。我使用Base SAS和STAT/SAS。這些子程序也可以從 http://www.geniq.net/articles.html#section9下載，代碼很容易轉(zhuǎn)換成用戶喜歡的其他語言。
在第2版的基礎(chǔ)上，本書新增了13章，它們穿插在原來的章節(jié)中間，以限度地保證內(nèi)容的連貫性。新章節(jié)如下：
第2章介紹統(tǒng)計學(xué)與數(shù)據(jù)科學(xué)。如果人們不留意，可能就會按下刪除鍵，刪掉統(tǒng)計學(xué)和統(tǒng)計學(xué)家，代之以科學(xué)和數(shù)據(jù)科學(xué)家。我討論了近期出現(xiàn)的術(shù)語數(shù)據(jù)科學(xué)是否意味著統(tǒng)計學(xué)是一個發(fā)展更快的領(lǐng)域的子集合，或者數(shù)據(jù)科學(xué)是否掩蓋了當(dāng)前的統(tǒng)計學(xué)應(yīng)用狀況。
第8章介紹一個市場份額估算模型，其獨特之處是不采用常規(guī)的基于抽樣調(diào)研的市場份額情境分析，而是采用主成分分析（PCA）作為估算一個真實案例的市場份額的基礎(chǔ)。我提供了構(gòu)建這個案例研究的市場份額模型的SAS子程序。
第11章介紹無抽樣調(diào)研數(shù)據(jù)預(yù)測錢包份額。這種預(yù)測錢包份額（SOW）的日常方法需要抽樣調(diào)研數(shù)據(jù)。由于抽樣調(diào)研工作耗時多、成本高，而且會出現(xiàn)不可靠數(shù)據(jù)，所以通常不采用。我提供了一種不需要數(shù)據(jù)就能預(yù)測SOW的兩步法。步定義一個準(zhǔn)SOW并通過模擬法對總金額進行估算。第二步采用分數(shù)邏輯斯諦回歸法預(yù)測SOW_q，巧妙地將普通的邏輯斯諦回歸用于比例或比率不變的因變量。我給出了詳細的案例分析和SAS子程序，讀者會發(fā)現(xiàn)這種方法很有價值。
第19章提出了一種基于模型的潛在類別分析（LCA）聚類方法。這種細分的創(chuàng)新型策略包含在時間序列數(shù)據(jù)的應(yīng)用之中。時間序列LCA模型是一種完全不同的方法，可以作為處理截面數(shù)據(jù)集中的時間序列數(shù)據(jù)的模板。這種LCA法可以替代目前流行的基于數(shù)據(jù)的啟發(fā)式k均值法。我提供了SAS子程序，數(shù)據(jù)挖掘人員可以用來執(zhí)行與演示類似的市場細分工作。我還提供了一種將時間序列數(shù)據(jù)合并到其他截面數(shù)據(jù)集中的獨特方法。
隨后是第20章。文獻通常會介紹各種可以用來進行市場細分的聚類方法，而有關(guān)如何解讀細分結(jié)果的文獻卻寥寥無幾。這一章提供了一種理解客戶細分的便捷方法。我用一個常見的簡單例子說明新方法，以充分展示這種方法的威力。本章提供了執(zhí)行這種新方法所用的SAS子程序，數(shù)據(jù)挖掘人員可以將這個有價值的統(tǒng)計技術(shù)收入工具箱。
第21章是第20章的擴展。本章的目的是提供一種理解統(tǒng)計回歸模型的簡單方法，即普通小二乘法和邏輯斯諦回歸（LR）模型。我用一個LR模型演示了這種方法，展示了這種方法的威力。這種方法含有補充信息，用于彌補一直以來人們需要依靠回歸系數(shù)才能理解統(tǒng)計回歸模型的不足。我提供了SAS子程序，可以作為其他統(tǒng)計方法的一個有價值的補充。
第23章介紹大數(shù)據(jù)建模，接在使用CHAID作為歸因方法的章節(jié)之后。缺失的數(shù)據(jù)會警告統(tǒng)計學(xué)家：除非你知道如何接納我，否則你毫無勝算。在大數(shù)據(jù)出現(xiàn)之前，用傳統(tǒng)的基于數(shù)據(jù)的方法（完整案例分析）處理任何數(shù)據(jù)集都會出現(xiàn)問題。這些方法能否有效用于大數(shù)據(jù)分析令人懷疑。我提出了一個兩步法，即先用完整的回應(yīng)數(shù)據(jù)建模，然后用PCA對不完整的回應(yīng)數(shù)據(jù)建模。這兩個模型可以單獨使用，也可以與具體任務(wù)目標(biāo)結(jié)合使用。我提供了這種方法的SAS子程序，它會成為統(tǒng)計建模者的一個有用工具。
第24章高度融合了藝術(shù)、科學(xué)、數(shù)字和詩歌，它們都受到了埃及金字塔、達·芬奇和愛因斯坦的啟發(fā)。這一章會引發(fā)你的思考。
第27章是對前一章的補充。營銷人員使用十分位分析評估他們的回應(yīng)模型相對于隨機獲得的回應(yīng)的可預(yù)測優(yōu)勢。我定義了兩種新指標(biāo)，即回應(yīng)模型十分位分析精確度和隨機模型十分位精確度，可以讓營銷人員對回應(yīng)模型的優(yōu)缺點進行更深入的評估。我提供了構(gòu)建這兩種新指標(biāo)的SAS子程序，這會成為市場營銷統(tǒng)計學(xué)家的可靠工具。
第28章將評估回應(yīng)模型的方法擴展到適當(dāng)使用對照組（文獻中使用諸如提升或凈提升度模型這類名稱），以替代第27章中討論的隨機模型。有關(guān)凈提升度模型的文獻有很多，有些相互矛盾而且容易引起混淆。我提供了另一種方法T-C凈提升度模型，這是一個簡單、直觀、可靠、易于實現(xiàn)和理解的模型，緩解了有關(guān)這個主題的文獻之間的不相容情況。我提供了T-C凈提升度模型的SAS子程序，統(tǒng)計學(xué)家可以用于建模，而不必購買昂貴的軟件。
對于統(tǒng)計學(xué)家來說，當(dāng)踏上數(shù)據(jù)處理旅程時，第34章會給

你還可能感興趣

我要評論