編輯推薦
《機器學習》是迄今市麵上內容全麵的機器學習教材之一,書中匯集瞭所有用於理解、挖掘和分析數據的先進方法,並且通過數百個精選實例和解說性插圖,直觀而準確地闡釋瞭這些方法背後的原理,內容涵蓋瞭機器學習的構成要素和機器學習任務、邏輯模型、幾何模型、統計模型,以及矩陣分解、ROC分析等時下熱點話題。
本書不僅內容豐富,而且圖文並茂,無論是新手還是有經驗的讀者都能從中獲益。
內容簡介
《機器學習》是全麵的機器學習教材之一。書中首先介紹瞭機器學習的構成要素(任務、模型、特徵)和機器學習任務,接著詳細分析瞭邏輯模型(樹模型、規則模型)、幾何模型(綫性模型和基於距離的模型)和概率模型,然後討論瞭特徵、模型的集成,以及被機器學習研究者稱為“實驗”的方法。作者不僅使用瞭已有術語,還引入瞭一些新的概念,同時提供瞭大量精選的示例和插圖解說。
作者簡介
Peter Flach,布裏斯托大學人工智能教授,擁有20多年的機器學習教研經驗。在高度結構化的數據挖掘以及通過ROC分析來評估和改進機器學習模型方麵,Flach是國際領先的研究人員。他還是Machine Learning期刊總編。曾擔任2009年ACM知識發現與數據挖掘國際會議、2012年歐洲機器學習與數據挖掘國際會議的程序委員會共同主席。另著有Simply Logical: Intelligent Reasoning by Example。
精彩書評
“本書寫作思路清楚,邏輯性強。作者首先介紹瞭機器學習的基礎知識,然後提供瞭大量有價值的結論、對若乾機器學習技術性能的洞見,以及許多核心算法的高層僞代碼,巧妙地引領讀者循序漸進地學習。”
——Fernando Berzal,Computing Reviews
“本書條理清晰,對機器學習技術的核心要素進行瞭全麵的論述。作者首先從宏觀角度審視機器學習,然後由麵到點,深入闡釋瞭各項技術的具體細節。如果你是機器學習領域的專業人士或學生,閱讀本書可以幫助你鞏固所學的知識。我嚮所有想認真研究機器學習的人強烈推薦本書!”
——讀者評論
“本書抽象、係統地闡述瞭機器學習的方方麵麵,讓讀者能夠深入理解常用機器學習技術的原理。這是攻略和實用手冊類圖書所做不到的。”
——讀者評論
目錄
緒 論 機器學習概述 1
第1章 機器學習的構成要素 9
1.1 任務:可通過機器學習解決的問題 9
1.1.1 探尋結構 11
1.1.2 性能評價 13
1.2 模型:機器學習的輸齣 14
1.2.1 幾何模型 14
1.2.2 概率模型 17
1.2.3 邏輯模型 22
1.2.4 分組模型與評分模型 26
1.3 特徵:機器學習的馬達 26
1.3.1 特徵的兩種用法 28
1.3.2 特徵的構造與變換 29
1.3.3 特徵之間的交互 32
1.4 總結與展望 33
第2章 兩類分類及相關任務 37
2.1 分類 39
2.1.1 分類性能的評價 40
2.1.2 分類性能的可視化 43
2.2 評分與排序 46
2.2.1 排序性能的評價及可視化 48
2.2.2 將排序器轉化為分類器 52
2.3 類概率估計 54
2.3.1 類概率估計量 55
2.3.2 將排序器轉化為概率估計子 57
2.4 小結與延伸閱讀 59
第3章 超越兩類分類 61
3.1 處理多類問題 61
3.1.1 多類分類 61
3.1.2 多類得分及概率 65
3.2 迴歸 68
3.3 無監督學習及描述性學習 70
3.3.1 預測性聚類與描述性聚類 71
3.2.2 其他描述性模型 74
3.4 小結與延伸閱讀 76
第4章 概念學習 77
4.1 假設空間 78
4.1.1 最小一般性 79
4.1.2 內部析取 82
4.2 通過假設空間的路徑 84
4.2.1 最一般相容假設 86
4.2.2 封閉概念 87
4.3 超越閤取概念 88
4.4 可學習性 92
4.5 小結與延伸閱讀 94
第5章 樹模型 97
5.1 決策樹 100
5.2 排序與概率估計樹 103
5.3 作為減小方差的樹學習方法 110
5.3.1 迴歸樹 110
5.3.2 聚類樹 113
5.4 小結與延伸閱讀 115
第6章 規則模型 117
6.1 學習有序規則列錶 117
6.2 學習無序規則集 124
6.2.1 用於排序和概率估計的規則集 128
6.2.2 深入探究規則重疊 130
6.3 描述性規則學習 131
6.3.1 用於子群發現的規則學習 131
6.3.2 關聯規則挖掘 135
6.4 一階規則學習 139
6.5 小結與延伸閱讀 143
第7章 綫性模型 145
7.1 最小二乘法 146
7.1.1 多元綫性迴歸 150
7.1.2 正則化迴歸 153
7.1.3 利用最小二乘迴歸實現分類 153
7.2 感知機 155
7.3 支持嚮量機 158
7.4 從綫性分類器導齣概率 164
7.5 超越綫性的核方法 168
7.6 小結與延伸閱讀 170
第8章 基於距離的模型 173
8.1 距離測度的多樣性 173
8.2 近鄰與範例 178
8.3 最近鄰分類器 182
8.4 基於距離的聚類 184
8.4.1 K均值算法 186
8.4.2 K中心點聚類 187
8.4.3 silhouette 188
8.5 層次聚類 190
8.6 從核函數到距離 194
8.7 小結與延伸閱讀 195
第9章 概率模型 197
9.1 正態分布及其幾何意義 200
9.2 屬性數據的概率模型 205
9.2.1 利用樸素貝葉斯模型實現分類 206
9.2.2 訓練樸素貝葉斯模型 209
9.3 通過優化條件似然實現鑒彆式學習 211
9.4 含隱變量的概率模型 214
9.4.1 期望最大化算法 215
9.4.2 高斯混閤模型 216
9.5 基於壓縮的模型 218
9.6 小結與延伸閱讀 220
第10章 特徵 223
10.1 特徵的類型 223
10.1.1 特徵上的計算 223
10.1.2 屬性特徵、有序特徵及數量特徵 227
10.1.3 結構化特徵 228
10.2 特徵變換 229
10.2.1 閾值化與離散化 229
10.2.2 歸一化與標定 234
10.2.3 特徵缺失 239
10.3 特徵的構造與選擇 240
10.4 小結與延伸閱讀 243
第11章 模型的集成 245
11.1 Bagging 與隨機森林 246
11.2 Boosting 247
11.3 集成學習進階 250
11.3.1 偏差、方差及裕量 250
11.3.2 其他集成方法 251
11.3.3 元學習 252
11.4 小結與延伸閱讀 252
第12章 機器學習的實驗 255
12.1 度量指標的選擇 256
12.2 量指標的獲取 258
12.3 如何解釋度量指標 260
12.4 小結與延伸閱讀 264
後記 路在何方 267
記憶要點 269
參考文獻 271
前言/序言
人工智能、大數據分析、機器人等領域在近年來日益引人矚目,而機器學習則是其中一類非常重要的理論和工具。Peter Flach 教授的這部著作可作為機器學習的入門圖書,幫助廣大迫切希望瞭解和掌握機器學習的同學和工程師奠定良好的基礎。
本書各章節的選題恰到好處,不但對經典機器學習框架中的模型做瞭非常係統的梳理和分類,涵蓋瞭機器學習基礎知識的主要部分,如不同的學習模型、特徵、集成學習,而且還對機器學習實驗,尤其是機器學習算法的評價(ROC分析)給予瞭特彆的關注,這是十分難能可貴的(在一定程度上彌補瞭同類教科書的空白)。隻要理解瞭上述內容,相信讀者便掌握瞭機器學習的基本要素,同時有能力進一步就一些更專門、更前沿的主題,如在綫學習、主動學習、強化學習、深度學習等,進行更為深入的學習和探索。從這個意義上講,作者對本書的導論性著作的定位已充分地達成瞭。
對於如何幫助讀者充分理解書中的知識點,作者也予以瞭充分考慮。書中配有相當數量的圖解和實例,旨在突齣機器學習理論的直觀性。這些內容的數學門檻不高,對工程師和工科學生無疑會有很大的幫助。在各章節中,作者還對每種方法的曆史影響進行瞭介紹,相信會十分有助於提升讀者的學習興趣。作者作為在該領域耕耘多年的研究人員,擁有非常豐富的實踐經驗,在不少章節中都詳盡地分享瞭實踐經驗,比如特徵和實驗這兩章。相信這些寶貴的經驗會為讀者朋友們具體實踐機器學習理論帶來更好的可操作性。
最後要提到譯者段菲的翻譯,通篇用語規範、錶達準確,總體說來是非常不錯的翻譯版本。作為計算機視覺領域的優秀研究人員,他本人也在使用機器學習方麵有著豐富的研究和實踐經驗,相信這些都為這本書的翻譯質量帶來不少保證。
張益民
英特爾(中國)研究院首席研究員
機器學習 下載 mobi epub pdf txt 電子書