本書為十四五高等職業(yè)教育新形態(tài)一體化教材之一,通過貼近生活的挑橘子一例引出機器學(xué)習(xí)的概念,并展開介紹了機器學(xué)習(xí)的完整流程、算法分類以及常用工具等。 本書以項目任務(wù)的組織方式,以通俗的情境作為項目導(dǎo)入,制定明確的項目目標(biāo),以算法的基本原理為知識導(dǎo)入,然后開始項目實施環(huán)節(jié),以多個實訓(xùn)任務(wù)分別練習(xí)算法在解決回歸、分類或聚類問題時的一般流程,最后以習(xí)題的形式鞏固所學(xué)知識和技能。本書的實訓(xùn)項目主要包含機器學(xué)習(xí)中基礎(chǔ)的算法應(yīng)用,即線性回歸算法、k-近鄰算法、邏輯回歸算法、決策樹算法、聚類算法、樸素貝葉斯算法。 通讀本書,你會了解機器學(xué)習(xí)解決的是什么問題,目前它應(yīng)用在我們生活中的哪些場景;跟著本書動手實踐,你會清楚數(shù)據(jù)怎么來、怎么加工,以及模型是什么,怎么訓(xùn)練與調(diào)用;另外,面對一個實際問題,你能夠有依據(jù)地選擇合適的算法。本書適合作為高等職業(yè)院校人工智能技術(shù)應(yīng)用專業(yè)的教材,也適用于有編程基礎(chǔ)的學(xué)生以及對機器學(xué)習(xí)感興趣且亟需入門的社會工作者。
機器學(xué)習(xí)領(lǐng)域的著名學(xué)者湯姆·米切爾(Tom Mitchell)將機器學(xué)習(xí)定義為:對于計算機
程序有經(jīng)驗 E、學(xué)習(xí)任務(wù) T 和性能度量 P,如果計算機程序針對任務(wù) T 的性能 P 隨著經(jīng)驗 E 不
斷增長,就稱這個計算機程序從經(jīng)驗 E 學(xué)習(xí)。 這一概念對于大多數(shù)人而言確實過于抽象簡潔。
如果其定義為用計算機通過算法來學(xué)習(xí)數(shù)據(jù)中包含的內(nèi)在規(guī)律和信息,從而獲得新的經(jīng)驗和
知識,以提高計算機的智能性,使計算機面對問題時能夠做出與人類相似的決策,則更加符合
大家對機器學(xué)習(xí)的認(rèn)知。
近年來,隨著機器學(xué)習(xí)向各行各業(yè)的滲透,機器學(xué)習(xí)算法在普羅大眾中也得到了一定的認(rèn)
可。 從事相關(guān)領(lǐng)域工作的人員提到機器學(xué)習(xí),想必都會了解甚至十分熟悉監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)
習(xí)和強化學(xué)習(xí)這三個分類,對于樸素貝葉斯算法、k-均值算法、回歸算法都耳熟能詳。 然而如
何利用機器學(xué)習(xí)解決自身領(lǐng)域的問題卻又有些不知如何下手。 面對如依據(jù)天氣、時間等因素推
薦一種合適的通勤工具,或者預(yù)測自身體重的變化,抑或分析員工離職情況這類數(shù)據(jù)結(jié)構(gòu)相對
簡單、數(shù)據(jù)來源相對單一的問題時,很多人很難將機器學(xué)習(xí)的理論和技術(shù)應(yīng)用其中,更不要提
構(gòu)建符合行業(yè)要求的機器學(xué)習(xí)算法。
當(dāng)想進一步深入了解時,發(fā)現(xiàn)需要面對汗牛充棟的理論、公式和編程技術(shù),令人望而
卻步。 如果你也面臨類似的問題,那么本書適合你;本書也適合機器學(xué)習(xí)零基礎(chǔ)的讀者學(xué)習(xí)。
本書編者在機器學(xué)習(xí)高等教育領(lǐng)域辛勤耕耘十余年,此次將自身豐富的教學(xué)經(jīng)驗以及較深
厚的理論知識進行融合,并配以生動且貼近生活的應(yīng)用實例,將機器學(xué)習(xí)算法的知識體系、應(yīng)
用場景、實施方式與步驟進行了細(xì)致的說明。
本書的緒論向讀者介紹了機器學(xué)習(xí)的概念、機器學(xué)習(xí)的應(yīng)用與分類等基礎(chǔ)知識,同時對本
書代碼實現(xiàn)的核心開源庫 sklearn 進行了說明。 此后各項目分別對應(yīng)了線性回歸算法、k-近鄰
算法、邏輯回歸算法、決策樹、聚類算法以及樸素貝葉斯算法,在每種算法介紹前通過知識導(dǎo)
入,對背景知識、學(xué)習(xí)前需要掌握的技術(shù)能力進行詳細(xì)說明,以方便讀者學(xué)習(xí);在正文中通過
生動形象的實例深入淺出地講解不同項目的目標(biāo)、主要知識點以及編程實現(xiàn)步驟;最后通過習(xí)
題的形式鞏固本項目學(xué)習(xí)成果。
本書注意貫徹落實立德樹人根本任務(wù),堅定文化自信,踐行二十大報告精神,充分體現(xiàn)黨
的二十大報告提出的實施科教興國戰(zhàn)略,強化現(xiàn)代人才建設(shè)支撐的精神,落實加強教材
建設(shè)和管理新要求。
本書由杜輝、葛鵬、趙瑞豐任主編,王亞楠、王磊、劉明浩任副主編,丁雷、金光浩、汪勝平
參與編寫。 在此,感謝所有在本書的內(nèi)容制作、代碼驗證及編排校對工作中付出辛苦勞動和支
持的同志。 本書配套的相關(guān)資源可通過派 Lab人工智能教學(xué)實訓(xùn)平臺(平臺網(wǎng)址:lab.
314ai.com)查看和動手實踐,還可與本書編者聯(lián)系(E-mail:1318475816@ qq.com)。
機器學(xué)習(xí)技術(shù)是一門前景廣闊的新興技術(shù),本書力圖從實用性角度為高職同學(xué)打開一條通
往未來世界的通道。
由于編者水平有限,書中難免有不足之處,歡迎廣大讀者予以指正。
編 者
2023 年 6 月