數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘教程(21世紀(jì)高等學(xué)校規(guī)劃教材·計(jì)算機(jī)科學(xué)與技術(shù))
定 價(jià):54.9 元
- 作者:黃德才
- 出版時(shí)間:2016/7/4
- ISBN:9787302434122
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP311.13
- 頁(yè)碼:405
- 紙張:膠版紙
- 版次:1
- 開本:16K
本書較詳細(xì)地介紹了數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的原理、方法及應(yīng)用技術(shù)。全書共有14章,分為4篇。第1章為緒論篇,介紹數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基本概念及其相互關(guān)系;第2~6章為數(shù)據(jù)倉(cāng)庫(kù)原理及應(yīng)用篇,主要介紹數(shù)據(jù)倉(cāng)庫(kù)的概念模型、邏輯模型和物理模型,以及數(shù)據(jù)倉(cāng)庫(kù)的規(guī)劃、設(shè)計(jì)、實(shí)施和OLAP應(yīng)用等;第7~10章為傳統(tǒng)數(shù)據(jù)挖掘原理及算法篇,介紹數(shù)據(jù)的屬性類型與相似性度量、關(guān)聯(lián)規(guī)則挖掘、分類規(guī)則挖掘、聚類分析和離群點(diǎn)挖掘算法等;第11~14章為數(shù)據(jù)挖掘創(chuàng)新篇,主要內(nèi)容取自編者近年指導(dǎo)研究生發(fā)表的學(xué)術(shù)論文,并根據(jù)教學(xué)需要進(jìn)行適當(dāng)補(bǔ)充修改而成,包括混合屬性數(shù)據(jù)、數(shù)據(jù)流和不確定數(shù)據(jù)的聚類分析,以及量子遺傳聚類算法等。本書可作為普通高等院校計(jì)算機(jī)專業(yè)與IT相關(guān)專業(yè)高年級(jí)本科生和研究生的教材,也可作為經(jīng)濟(jì)管理類專業(yè)同名課程的教材和參考書,還可作為電子商務(wù)、金融保險(xiǎn)等行業(yè)數(shù)據(jù)管理與數(shù)據(jù)分析人員的培訓(xùn)教材或自學(xué)參考書。
兼顧應(yīng)用型人才與學(xué)術(shù)型人才的培養(yǎng)需求;
有機(jī)融合傳統(tǒng)理論方法與創(chuàng)新思想方法;
理論敘述深入淺出,實(shí)際應(yīng)用具體完整;
算法描述自然易懂,計(jì)算實(shí)例詳略得當(dāng)。
第1章緒論
1.1數(shù)據(jù)倉(cāng)庫(kù)概述
1.1.1從傳統(tǒng)數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
1.1.2數(shù)據(jù)倉(cāng)庫(kù)的4個(gè)特征
1.1.3數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)
1.1.4數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)體系結(jié)構(gòu)
1.1.5數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)的粒度與組織
1.2數(shù)據(jù)挖掘概述
1.2.1數(shù)據(jù)挖掘產(chǎn)生的背景
1.2.2數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
1.2.3數(shù)據(jù)挖掘的數(shù)據(jù)來(lái)源
1.2.4數(shù)據(jù)挖掘的任務(wù)
1.2.5數(shù)據(jù)挖掘的步驟
1.2.6數(shù)據(jù)挖掘的應(yīng)用
1.3數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘
1.3.1數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的區(qū)別
1.3.2數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
1.4教程章節(jié)組織與學(xué)時(shí)建議
習(xí)題1
第2章數(shù)據(jù)倉(cāng)庫(kù)原理
2.1多數(shù)據(jù)源問題
2.2數(shù)據(jù)預(yù)處理
2.2.1數(shù)據(jù)清洗
2.2.2數(shù)據(jù)變換
2.2.3數(shù)據(jù)歸約
2.3ER模型
2.4數(shù)據(jù)倉(cāng)庫(kù)的概念模型
2.4.1多維數(shù)據(jù)模型
2.4.2維度與粒度
2.5數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型
2.5.1多維數(shù)據(jù)庫(kù)系統(tǒng)
2.5.2星形模型
2.5.3雪花模型
2.6數(shù)據(jù)倉(cāng)庫(kù)的物理模型
2.6.1位圖索引模型
2.6.2廣義索引模型
2.6.3連接索引模型
2.6.4RAID存儲(chǔ)結(jié)構(gòu)
習(xí)題2
第3章數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)開發(fā)應(yīng)用
3.1數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的特點(diǎn)
3.2數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)開發(fā)過程
3.3數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的規(guī)劃
3.4數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)
3.4.1需求分析
3.4.2概念設(shè)計(jì)
3.4.3邏輯設(shè)計(jì)
3.4.4物理設(shè)計(jì)
3.5數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施
3.5.1數(shù)據(jù)倉(cāng)庫(kù)的創(chuàng)建
3.5.2數(shù)據(jù)的抽取、轉(zhuǎn)換和加載
3.6數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的開發(fā)
3.6.1開發(fā)任務(wù)
3.6.2開發(fā)方法
3.6.3系統(tǒng)測(cè)試
3.7數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的應(yīng)用
3.7.1用戶培訓(xùn)
3.7.2決策支持
3.7.3維護(hù)評(píng)估
習(xí)題3
第4章警務(wù)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)
4.1SQL Server 2008 R2
4.1.1SQL Server的服務(wù)功能
4.1.2SQL Server Management Studio
4.1.3Microsoft Visual Studio
4.2創(chuàng)建集成服務(wù)項(xiàng)目與SSIS包
4.3配置“旅館_ETL”數(shù)據(jù)流任務(wù)
4.3.1創(chuàng)建“旅館_ETL”對(duì)象
4.3.2配置“旅館_ETL”參數(shù)
4.4配置“人員_ETL”數(shù)據(jù)流任務(wù)
4.4.1創(chuàng)建“人員_ETL”對(duì)象
4.4.2配置“人員_ETL”參數(shù)
4.5配置“時(shí)間_ETL”數(shù)據(jù)流任務(wù)
4.5.1創(chuàng)建“時(shí)間_ETL”對(duì)象
4.5.2配置“時(shí)間_ETL”參數(shù)
4.6配置“入住_ETL”數(shù)據(jù)流任務(wù)
4.6.1創(chuàng)建“入住_ETL”對(duì)象
4.6.2配置“入住_ETL”參數(shù)
4.7部署前面配置的SSIS包
4.7.1將包另存到SSIS服務(wù)器
4.7.2創(chuàng)建作業(yè)代理
習(xí)題4
第5章聯(lián)機(jī)分析處理技術(shù)
5.1OLAP概述
5.1.1OLAP的定義
5.1.2OLAP的12條準(zhǔn)則
5.1.3OLAP的簡(jiǎn)要準(zhǔn)則
5.1.4OLAP系統(tǒng)的基本結(jié)構(gòu)
5.2OLAP的多維分析操作
5.2.1切片
5.2.2切塊
5.2.3旋轉(zhuǎn)
5.2.4鉆取
5.3OLAP系統(tǒng)的分類
5.3.1多維OLAP
5.3.2關(guān)系OLAP
5.3.3MOLAP與ROLAP的比較
5.3.4混合OLAP
5.4OLAP、DW與DM的關(guān)系
5.4.1OLAP、DW與DM的聯(lián)系
5.4.2OLAP、DW與DM的區(qū)別
5.4.3OLAP與DW的關(guān)系
5.4.4OLAP與DM的關(guān)系
5.5DOLAM決策支持系統(tǒng)方案
習(xí)題5
第6章警務(wù)數(shù)據(jù)倉(cāng)庫(kù)的OLAP應(yīng)用
6.1創(chuàng)建分析服務(wù)項(xiàng)目
6.1.1進(jìn)入商業(yè)智能開發(fā)平臺(tái)
6.1.2創(chuàng)建分析服務(wù)項(xiàng)目
6.2配置項(xiàng)目的數(shù)據(jù)源
6.3構(gòu)建數(shù)據(jù)源視圖
6.4創(chuàng)建多維數(shù)據(jù)集
6.5配置維的層次結(jié)構(gòu)
6.5.1配置日期維的層次
6.5.2配置地址維的層次
6.5.3配置人員維的層次
6.5.4配置旅館維的層次
6.6添加人口來(lái)源地址維
6.7分析服務(wù)項(xiàng)目的部署
6.8瀏覽多維數(shù)據(jù)集
習(xí)題6
第7章數(shù)據(jù)的屬性與相似性
7.1數(shù)據(jù)集的結(jié)構(gòu)
7.1.1二維表
7.1.2數(shù)據(jù)矩陣
7.2屬性的類型
7.2.1連續(xù)屬性
7.2.2離散屬性
7.2.3分類屬性
7.2.4二元屬性
7.2.5序數(shù)屬性
7.2.6數(shù)值屬性
7.3相似度與相異度
7.3.1數(shù)值屬性的距離
7.3.2分類屬性的相似度
7.3.3余弦相似度
7.3.4混合屬性的相異度
習(xí)題7
第8章關(guān)聯(lián)規(guī)則挖掘
8.1關(guān)聯(lián)規(guī)則的概念
8.1.1基本概念
8.1.2項(xiàng)集的性質(zhì)
8.2關(guān)聯(lián)規(guī)則的Apriori算法
8.2.1發(fā)現(xiàn)頻繁項(xiàng)集
8.2.2產(chǎn)生關(guān)聯(lián)規(guī)則
8.3FP增長(zhǎng)算法
8.3.1算法的背景
8.3.2構(gòu)造FP樹
8.3.3生成頻繁項(xiàng)集
8.4關(guān)聯(lián)規(guī)則的評(píng)價(jià)
8.4.1支持度和置信度的不足
8.4.2相關(guān)性分析
8.5序列模式發(fā)現(xiàn)算法
8.5.1序列模式的概念
8.5.2類Apriori算法
8.6關(guān)聯(lián)規(guī)則其他算法
8.6.1頻繁項(xiàng)集算法優(yōu)化
8.6.2CLOSE算法
8.6.3時(shí)態(tài)關(guān)聯(lián)規(guī)則
8.6.4含負(fù)項(xiàng)的關(guān)聯(lián)規(guī)則
習(xí)題8
第9章分類規(guī)則挖掘
9.1分類問題概述
9.2k最近鄰分類法
9.3決策樹分類方法
9.3.1決策樹生成框架
9.3.2ID3分類方法
9.3.3決策樹的剪枝
9.3.4C4.5算法
9.4貝葉斯分類方法
9.4.1貝葉斯定理
9.4.2樸素貝葉斯分類器
9.4.3樸素貝葉斯分類方法的改進(jìn)
9.5其他分類方法
習(xí)題9
第10章聚類分析方法
10.1聚類分析原理
10.1.1聚類分析概述
10.1.2聚類的數(shù)學(xué)定義
10.1.3簇的常見類型
10.1.4聚類框架及性能要求
10.1.5簇的距離
10.2劃分聚類算法
10.2.1劃分聚類框架
10.2.2劃分聚類的質(zhì)量
10.2.3kmeans算法
10.2.4空簇與離群點(diǎn)
10.2.5k中心點(diǎn)算法
10.3層次聚類方法
10.3.1層次聚類策略
10.3.2AGNES算法
10.3.3DIANA算法
10.4密度聚類方法
10.4.1基本概念
10.4.2算法描述
10.4.3計(jì)算實(shí)例
10.4.4算法的性能分析
10.5聚類的質(zhì)量評(píng)價(jià)
10.5.1簇的數(shù)目估計(jì)
10.5.2外部質(zhì)量評(píng)價(jià)
10.5.3內(nèi)部質(zhì)量評(píng)價(jià)
10.6離群點(diǎn)挖掘
10.6.1相關(guān)問題概述
10.6.2基于距離的方法
10.6.3基于相對(duì)密度的方法
10.7其他聚類方法
習(xí)題10
第11章混合屬性數(shù)據(jù)的聚類分析
11.1混合屬性數(shù)據(jù)集聚類
11.1.1混合屬性數(shù)據(jù)普遍存在
11.1.2kprototypes算法
11.1.3kprototypes算法的不足
11.2改進(jìn)的kprototypes算法
11.2.1加權(quán)頻率最大原型
11.2.2離散屬性的頻率相異度
11.2.3改進(jìn)的kprototypes算法
11.3強(qiáng)連通聚類融合算法
11.3.1聚類融合方法
11.3.2強(qiáng)連通聚類融合
11.3.3聚類融合優(yōu)化算法
習(xí)題11
第12章數(shù)據(jù)流挖掘與聚類分析
12.1數(shù)據(jù)流挖掘的概念
12.1.1數(shù)據(jù)流的定義
12.1.2數(shù)據(jù)流挖掘的任務(wù)
12.2數(shù)據(jù)流處理技術(shù)
12.2.1概要數(shù)據(jù)結(jié)構(gòu)
12.2.2時(shí)間傾斜技術(shù)
12.2.3數(shù)據(jù)流聚類的要求
12.2.4數(shù)據(jù)流聚類的一般步驟
12.3兩層數(shù)據(jù)流聚類框架
12.4三層數(shù)據(jù)流聚類框架
12.5最優(yōu)2k近鄰聚類算法
12.5.1算法設(shè)計(jì)動(dòng)因
12.5.2定義2k最近鄰集
12.5.3在線2k最近鄰集生成
12.5.4最優(yōu)2k近鄰集算法
12.5.5最優(yōu)2k近鄰聚類算法
12.5.6實(shí)例計(jì)算結(jié)果
習(xí)題12
第13章不確定數(shù)據(jù)的聚類分析
13.1不確定數(shù)據(jù)挖掘概述
13.1.1不確定數(shù)據(jù)的產(chǎn)生
13.1.2不確定數(shù)據(jù)的種類
13.1.3不確定數(shù)據(jù)的聚類
13.2基于相對(duì)密度的不確定數(shù)據(jù)聚類算法
13.2.1基于相對(duì)密度的聚類思想
13.2.2不確定相異度與k最近鄰集
13.2.3不確定k最近鄰密度
13.2.4RDBCAU算法描述
13.2.5計(jì)算實(shí)例
13.3不確定分類屬性數(shù)據(jù)聚類算法
13.3.1傳統(tǒng)分類屬性相似度
13.3.2分類屬性加權(quán)相似度
13.3.3分類屬性雙重加權(quán)相似度
13.3.4不確定分類屬性雙重加權(quán)相似度
13.3.5基于連通分支的不確定分類屬性聚類算法
習(xí)題13
第14章量子計(jì)算與量子遺傳聚類算法
14.1量子計(jì)算與數(shù)據(jù)挖掘
14.1.1量子計(jì)算的誕生
14.1.2量子計(jì)算研究
14.1.3量子數(shù)據(jù)挖掘算法
14.2量子計(jì)算原理
14.2.1量子態(tài)與量子比特
14.2.2量子門與基本運(yùn)算
14.2.3量子糾纏特性
14.3經(jīng)典量子算法
14.3.1量子傅里葉變換
14.3.2Shor因子分解算法
14.3.3Grover算法
14.4基于3D角度編碼的量子遺傳算法
14.4.1量子遺傳算法
14.4.2量子3D角度編碼
14.4.3解空間的映射
14.4.4量子染色體更新
14.4.5量子位的變異
14.4.6QGAB3DC算法
14.5量子遺傳聚類算法
14.5.1屬性值q分位數(shù)與極差
14.5.2基于極差的廣義加權(quán)距離
14.5.3量子遺傳聚類算法
習(xí)題14
參考文獻(xiàn)