內容簡介
機器學習應用遍及人工智能的各個領域,是眾多數學科學傢需要學習的內容。本書第壹部分提供瞭一個相當復雜的機器學習係統,以幫助讀者提高其效率。第二部分重點介紹瞭三個不同的基於現實世界的數據的案例研究,並提供相應解決方案。全書通過知識介紹,使讀者瞭解收集數據、準備使用數據、訓練模型、評估模型的性能,以及改進模型的性能的方法;通過對實際問題解決的講解,幫助讀者獲得處理機器學習問題的經驗。
目錄
目 錄?Contents
譯者序
前言
第1章 機器學習引言 1
1.1 什麼是機器學習 1
1.2 分類方法概述 2
1.3 聚類方法概述 2
1.4 監督學習概述 3
1.5 無監督學習概述 4
1.6 增強學習概述 4
1.7 結構化預測概述 5
1.8 神經網絡概述 5
1.9 深度學習概述 6
第2章 分類 7
2.1 引言 7
2.2 判彆函數分析:地下鹵水地質化學測量 8
2.3 多元邏輯迴歸:理解學生的課程計劃選擇 15
2.4 Tobit迴歸:評估學生的學術能力 20
2.5 泊鬆迴歸:理解加拉帕戈斯群島現存物種 27
第3章 聚類 38
3.1 引言 38
3.2 層次聚類:世界銀行樣本數據集 39
3.3 層次聚類:1999~2010年
亞馬遜雨林的燒毀情況 44
3.4 層次聚類:基因聚類 55
3.5 二進製聚類:數學測驗 68
3.6 k均值聚類:歐洲各國蛋白質消耗量 75
3.7 k均值聚類:食品 80
第4章 模型選擇和正則化 86
4.1 引言 86
4.2 壓縮方法:每天消耗的卡路裏 87
4.3 降維方法:Delta航空公司航空隊 100
4.4 主成分分析:理解世界菜肴 109
第5章 非綫性 114
5.1 廣義加性模型:衡量新西蘭的傢庭收入 114
5.2 平滑樣條:理解汽車和速度 119
5.3 局部迴歸:理解乾旱警告和影響 129
第6章 監督學習 136
6.1 引言 136
6.2 決策樹學習:對胸痛患者的預先醫療護理指示 137
6.3 決策樹學習:基於收入的房地産價值分布 145
6.4 決策樹學習:預測股票走勢方嚮 154
6.5 樸素貝葉斯:預測股票走勢方嚮 170
6.6 隨機森林:貨幣交易策略 184
6.7 支持嚮量機:貨幣交易策略 193
6.8 隨機梯度下降:成人收入 201
第7章 無監督學習 208
7.1 引言 208
7.2 自組織映射:可視化熱圖 209
7.3 矢量量化:圖像聚類 212
第8章 增強學習 217
8.1 引言 217
8.2 馬爾可夫鏈:股票區製轉移模型 218
8.3 馬爾可夫鏈:多渠道歸因模型 229
8.4 馬爾可夫鏈:汽車租賃代理服務 239
8.5 連續馬爾可夫鏈:加油站的車輛服務 243
8.6 濛特卡羅模擬:校準Hull-White短期利率 247
第9章 結構化預測 257
9.1 引言 257
9.2 隱馬爾可夫模型:歐元和美元 257
9.3 隱馬爾可夫模型:區製檢測 263
第10章 神經網絡 270
10.1 引言 270
10.2 為S&P; 500建模 270
10.3 衡量失業率 278
第11章 深度學習 292
11.1 引言 292
11.2 循環神經網絡:預測周期信號 292
第12章 案例研究:探索世界銀行數據 299
12.1 引言 299
12.2 探索世界銀行數據 299
第13章 案例研究:再保險閤同定價 316
13.1 引言 316
13.2 再保險閤同定價 316
第14章 案例研究:用電量預測 329
14.1 引言 329
14.2 用電量測量 329
前言/序言
Preface?前 言當今世界,數據已經成為新的“價值金礦”並以指數級的速度增長著。這種增長既包括現存數據的增長,也包括新數據的增長,這些新的數據以結構化和非結構化的形式展現,並來源於社交媒體、互聯網、文檔文獻以及物聯網等多種多樣的數據源。數據流必須實時地收集、處理、分析,並最終展現齣來以確保數據的使用者能夠在如今快速變化的環境中做齣理性且明智的決定。機器學習技術將待解決問題的上下文信息應用於這些數據上,用統計學技術確保不斷快速到達的復雜數據能夠以科學的方式加以分析。並利用機器學習算法從數據中進行迭代學習,發現數據中的隱藏模式和規律。機器學習的這種迭代學習的模式是非常重要的,正因如此,當機器學習模型被暴露在新的數據中時,它們纔能從新的數據集中獨立地適應和學習以産齣可靠的結論。
我們將首先介紹本書中包含的多種不同的機器學習主題,隨後,基於現實世界的問題在不同的章節中對各個主題進行一一探討,例如分類、聚類、模型選擇和正則化、非綫性問題、監督學習、無監督學習、增強學習、結構化預測、神經網絡、深度學習,還有最後的案例研究。本書的機器學習算法以R語言作為編程語言。本書適用於R語言的初學者,但是熟悉R語言對理解和使用本書的代碼肯定是會有所幫助的。
你將學習如何閤理地決定使用哪類算法以及如何應用這些算法得到最佳的效果。如果你想要對圖像、文字、語音或者其他形式的數據都建立有意義的多功能的應用,本書絕對會成為你的得力助手。
本書的主要內容第1章涵蓋瞭機器學習的各種概念。本章使讀者初步瞭解本書涵蓋的各個主題。
第2章包括以下算法:判彆函數分析、多元邏輯迴歸、Tobit迴歸、泊鬆迴歸。
第3章包括以下主題和算法:層次聚類、二進製聚類、k均值聚類。
第4章包括以下主題和算法:壓縮方法、降維方法和主成分分析。
第5章包括以下主題和算法:廣義加性模型、平滑樣條、局部迴歸。
第6章包括以下主題和算法:決策樹學習、樸素貝葉斯、隨機森林、支持嚮量機、隨機梯度下降。
第7章包括以下主題和算法:自組織映射和矢量量化。
第8章包括以下主題和算法:馬爾可夫鏈、濛特卡洛模擬。
第9章包括以下主題和算法:隱馬爾可夫模型。
第10章包括以下主題和算法:神經網絡。
第11章包括以下主題和算法:遞歸神經網絡。
第12章包括世界銀行數據分析。
第13章包括再保險閤同定價。
第14章包括用電量預測。
本書的重點本書的重點是用R語言構建基於機器學習的應用。我們已經使用R語言構建過各種解決方案。我們的重點是利用R語言庫和函數以最佳方式來剋服現實世界的挑戰。我們盡量保持所有代碼的友好性和可讀性。我們認為這將使讀者能夠很容易地理解代碼,並在不同的場景中隨時使用它。
本書的目標讀者本書是為想構建實用的基於機器學習的應用的專業人士,以及統計、數據分析、機器學習、計算機科學或其他專業的學生和專業人士準備的。本書適用於R語言的初學者,但是熟悉R語言對理解和使用本書的代碼肯定是會有所幫助的。對於那些希望在現有技術棧中探索機器學習技術的有經驗的R語言程序員來說,本書也將是非常有用的。
特殊章節在本書中,你將頻繁看到如下小節:準備工作和具體實施步驟。
為瞭更加清晰地說明怎樣完成一個機器學習方法,我們使用瞭如下特殊章節。
準備工作該節告訴你機器學習方法需要哪些準備,並描述瞭如何設置該機器學習方法所要求的軟件或其他先決條件。
具體實施步驟該節包含瞭機器學習方法的各個具體步驟。
下載示例代碼本書的代碼位於GitHub上,讀者可從https://github.com/PacktPublishing/Practical-Machine-Learning-Cookbook下載。
下載本書的彩圖本書還為你提供瞭一個PDF文件,其中包含瞭本書的彩圖。這些彩圖將幫助你更好地理解輸齣的變化。你能夠從地址https://www.packtpub.com/sites/default/files/downloads/PracticalMachineLearningCookbook_ColorImages.pdf下載該文件。
機器學習實踐指南 下載 mobi epub pdf txt 電子書