定 價:39 元
叢書名:1 X職業(yè)技能等級證書(數(shù)據(jù)采集)配套教材
- 作者:穆建平 陳天真
- 出版時間:2021/7/1
- ISBN:9787111684145
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書為1 X職業(yè)技能等級證書(數(shù)據(jù)采集)配套教材,內(nèi)容涵蓋1 X《數(shù)據(jù)采集職業(yè)技能等級標準》規(guī)定的技能要求。
本書以項目任務(wù)驅(qū)動,圍繞企業(yè)級應(yīng)用進行項目任務(wù)設(shè)計,講解了不同類型數(shù)據(jù)采集的實現(xiàn),全書共6個項目,包括Scrapy框架網(wǎng)頁數(shù)據(jù)采集、Windows操作系統(tǒng)數(shù)據(jù)采集、Linux基本操作、Apache容器數(shù)據(jù)采集、Tomcat容器數(shù)據(jù)采集和JavaScript埋點式數(shù)據(jù)采集。本書理論和實踐相結(jié)合,由淺入深,內(nèi)容實用,可操作性強。
本書適用于1 X數(shù)據(jù)采集職業(yè)技能等級證書培訓,也可以作為各類職業(yè)院校大數(shù)據(jù)及相關(guān)專業(yè)的教材,還可作為數(shù)據(jù)采集從業(yè)人員的參考用書。
本書配有電子課件等教學資源,教師可登錄機械工業(yè)出版社教育服務(wù)網(wǎng)(www.cmpedu.com)注冊后免費下載,或聯(lián)系編輯(010-88379807)咨詢。
前 言
· III ·
在數(shù)據(jù)飛速增長的今天,數(shù)據(jù)產(chǎn)生的路徑也多種多樣,如網(wǎng)頁數(shù)據(jù)、客戶端APP數(shù)據(jù)、
操作系統(tǒng)數(shù)據(jù)、服務(wù)容器數(shù)據(jù)等,如何快速、準確地采集這些數(shù)據(jù)成為開發(fā)人員必須面對
的問題。不管是大數(shù)據(jù)、云計算還是人工智能技術(shù)的實現(xiàn)都離不開數(shù)據(jù),都需要以數(shù)據(jù)為支
撐,因此數(shù)據(jù)采集技術(shù)應(yīng)運而生。數(shù)據(jù)采集人員可以根據(jù)數(shù)據(jù)來源的不同,選擇合適的技術(shù)
來實現(xiàn)海量數(shù)據(jù)的高效采集。
本書為數(shù)據(jù)采集的實現(xiàn)提供技術(shù)指導,可幫助開發(fā)人員快速實現(xiàn)不同類型數(shù)據(jù)的采集。
本書的特點
本書以不同類型數(shù)據(jù)采集的實現(xiàn)為主線,通過理論與實踐相結(jié)合的方式,詳細地對數(shù)據(jù)采
集技術(shù)的使用進行講解,涉及多個數(shù)據(jù)采集技術(shù),主要包含Scrapy網(wǎng)絡(luò)爬蟲技術(shù)、Windows操
作系統(tǒng)數(shù)據(jù)采集技術(shù)、Apache容器和Tomcat容器數(shù)據(jù)采集技術(shù)、JavaScript埋點式數(shù)據(jù)采集技術(shù)
等,在提高實際開發(fā)水平和項目能力的同時,加深對理論知識的掌握。全書知識點講解詳細,
在便于教師教學、學生理解的同時,還保持了整本書的知識深度。
本書結(jié)構(gòu)條理清晰、內(nèi)容詳細,每個項目都通過項目情景、學習目標、任務(wù)描述、任務(wù)
步驟、知識儲備、拓展任務(wù)、任務(wù)總體評價和練習題8個模塊進行相應(yīng)知識的講解。其中,項
目情景通過實際情景對本項目學習的主要內(nèi)容進行講解,學習目標對本項目內(nèi)容的學習提出要
求、任務(wù)描述對當前任務(wù)的實現(xiàn)進行概述,任務(wù)步驟對當前任務(wù)進行具體的實現(xiàn),知識儲備對
當前項目所需知識進行講解,拓展任務(wù)對當前知識進行補充,使學生全面掌控所講內(nèi)容。
本書的主要內(nèi)容
本書共6個項目。
項目1從網(wǎng)頁數(shù)據(jù)采集開始,分別講述了Scrapy的安裝、項目結(jié)構(gòu)、采集流程以及操作命
令使用、Spider和Selectors編寫、數(shù)據(jù)保存等。
項目2詳細介紹了Windows操作系統(tǒng)數(shù)據(jù)采集的過程,包含操作系統(tǒng)結(jié)構(gòu)、進程及進程管
理、資源分配與調(diào)度、設(shè)備管理、文件管理系統(tǒng)、Windows的種類與應(yīng)用、Windows的Shell腳
本以及Windows用戶的日志數(shù)據(jù)拆分。
項目3詳細介紹了Linux基本操作,包括Linux發(fā)展史、Linux在各領(lǐng)域的發(fā)展、Linux常見發(fā)
行版、用戶操作、目錄操作、文件操作以及Linux的Shell腳本等。
項目4詳細介紹了Apache容器數(shù)據(jù)采集,包括中間件容器的概述、Apache的歷史與發(fā)展、
Apache的管理與使用以及Apache日志文件等。
項目5詳細介紹了Tomcat容器數(shù)據(jù)采集,包括Tomcat的應(yīng)用和Linux下查看Tomcat狀態(tài)和日志。
PREFACE
· IV ·
項目6詳細介紹了JavaScript埋點式數(shù)據(jù)采集,包括JavaScript埋點式數(shù)據(jù)采集的意義、埋點
技術(shù)分析以及埋點實現(xiàn)方案等。
教學建議
項 目操作學時理論學時
項目1 Scrapy框架網(wǎng)頁數(shù)據(jù)采集4 4
項目2 Windows操作系統(tǒng)數(shù)據(jù)采集4 4
項目3 Linux基本操作4 4
項目4 Apache容器數(shù)據(jù)采集4 4
項目5 Tomcat容器數(shù)據(jù)采集4 4
項目6 JavaScript埋點式數(shù)據(jù)采集4 4
本書由浪潮優(yōu)派科技教育有限公司組編,由穆建平、陳天真任主編,宋磊、許國彬、劉濤
任副主編,參與編寫的還有李海斌、王緒良、商程。
由于編者水平有限,書中難免出現(xiàn)疏漏或不足之處,懇請讀者批評指正。
編 者
目 錄
前言
二維碼索引
項目1
Scrapy框架網(wǎng)頁數(shù)據(jù)采集 1
任務(wù)1 安裝Scrapy 2
任務(wù)2 Scrapy框架網(wǎng)頁數(shù)據(jù)采集 7
任務(wù)總體評價 24
練習題 24
項目2
Windows操作系統(tǒng)數(shù)據(jù)采集 27
任務(wù)1 Windows數(shù)據(jù)收集器的
使用 28
任務(wù)2 Windows日志數(shù)據(jù)采集 37
任務(wù)總體評價 48
練習題 49
項目3
Linux基本操作 51
任務(wù)1 Linux環(huán)境安裝 52
任務(wù)2 Linux常見命令操作 70
任務(wù)總體評價 85
練習題 85
項目4
Apache容器數(shù)據(jù)采集 87
任務(wù)1 Linux下Apache的安裝 88
任務(wù)2 Linux下Apache容器數(shù)據(jù)
采集 92
任務(wù)3 Linux下Apache日志
分析與查看 105
任務(wù)4 Windows下Apache容器
數(shù)據(jù)采集 116
任務(wù)總體評價 128
練習題 128
項目5
Tomcat容器數(shù)據(jù)采集 131
任務(wù)1 Tomcat安裝 132
任務(wù)2 Tomcat日志配置遠程
rsyslog采集 140
任務(wù)3 Linux下Tomcat日志
數(shù)據(jù)采集 150
任務(wù)總體評價 159
練習題 159
項目6
JavaScript埋點式數(shù)據(jù)采集 161
任務(wù)1 初識JavaScript埋點式數(shù)據(jù)
采集 162
任務(wù)2 JavaScript埋點采集用戶
網(wǎng)頁瀏覽日志 173
任務(wù)總體評價 184
練習題 184
參考文獻 186