大數據挖掘+大數據與機器學習(套裝共2冊)

大數據挖掘+大數據與機器學習(套裝共2冊) pdf epub mobi txt 電子書 下載 2025

陳春寶,闕子揚,鍾飛,周英,卓金武 等 著
圖書標籤:
  • 大數據
  • 數據挖掘
  • 機器學習
  • 人工智能
  • 算法
  • 數據分析
  • 統計學習
  • 商業智能
  • Python
  • 數據科學
想要找書就要到 靜流書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
齣版社: 機械工業齣版社
ISBN:12064027
版次:1
商品編碼:12064027
品牌:機工齣版
包裝:平裝
叢書名: 大數據技術叢書
開本:16開
齣版時間:2017-01-01
用紙:膠版紙
頁數:681
套裝數量:2
正文語種:中文

具體描述

編輯推薦

  《大數據挖掘:係統方法與實例分析》
  MATLAB官方資深大數據挖掘專傢撰寫,MATLAB官方及多位專傢鼎力推薦。
  從技術、方法、案例、實踐4個維度循序漸進地講解瞭大數據挖掘技的流程、方法和原理
  
  《大數據與機器學習:實踐方法與行業案例》
  從數據、基礎平颱、分析方法、行業應用4個維度,義場景化方式講解數據從獲取、預處理、挖掘、建模、結論分析與展現到係統應用的流程,以及機器學習的重要技術
  三位金融領域的大數據專傢近10年行業實戰經驗總結,包含大量行業解決方案和案例,並公開源代碼

內容簡介

  《大數據與機器學習:實踐方法與行業案例》:
  《大數據與機器學習:實踐方法與行業案例》立足商業實踐,結閤典型業務場景,詳細闡述數據從獲取、預處理、挖掘、建模、結論分析與展現到係統應用的整個流程。就完整性而言,覆蓋數據、平颱、分析和應用等企業內數據流轉的主要環節;就內容而言,拋棄瞭理論與公式的堆積以及小明式的人造案例,選取大量翔實的案例展現數據從綫下分析到綫上應用的企業實戰過程;就寫作手法而言,力求兼顧實用主義和理論深度,用淺顯的語言介紹復雜的分析應用過程,從實戰角度詮釋理論技術和算法的具體應用;就布局而言,按照數據與平颱篇、分析篇和應用篇分彆撰寫。
  數據與平颱篇(第1~3章)立足找到數據、整閤數據、使用數據三個角度,介紹數據在企業內的産生、存儲、處理到分析、應用的閉環流轉過程,有助於數據工程師站在應用角度瞭解數據治理方法和重點:數據架構師可從中找到構建數據平颱的指導思想和産品選型建議。
  分析篇(第4~11章)選取企業實際案例,闡述數據是如何解決業務問題並産生價值的,幫助數據分析師掌握常用的數據挖掘與機器學習算法以及可視化技巧,從中找到分析靈感。
  應用篇(第12~15章)選取標簽係統、自助營銷、個性化推薦和社會關係網絡等當前熱門的大數據應用案例,介紹數據分析結論和模型的應用部署,幫助業務運營專傢和管理者瞭解如何構建數據驅動的應用,讓數據“自動”流轉於各個環節。
  
  《大數據挖掘:係統方法與實例分析》:
  《大數據挖掘:係統方法與實例分析》是大數據挖掘領域的扛鼎之作,由全球科學計算領域的領導者MathWorlks(MATLAB公司)官方的資深數據挖掘專傢撰寫,MathWorks官方及多位專傢聯袂推薦。
  它從技術、方法、案例和實踐4個維度對如何係統、深入掌握大數據挖掘提供瞭詳盡的講解。
  技術:不僅講解瞭大數據挖掘的原理、過程、工具,還講解瞭大數據的準備、處理與探索;
  方法:既深入地講解瞭關聯規則方法、迴歸方法、分類方法、聚類方法、預測方法、診斷方法等6大類數據挖掘主體方法,又重點講解瞭時間序列方法和智能優化方法兩種數據挖掘中常用的方法;
  案例:詳細地再現瞭來自銀行、證券、機械、礦業、生命科學和社會科學等6大領域的經典案例,不僅有案例的實現過程,而且還有案例原理和預備知識的的講解;
  實踐:首先總結瞭數據挖掘中確定挖掘、應用技術以及如何平衡的藝術,然後總結瞭數據挖掘的項目管理和團隊管理的藝術。

作者簡介

  周英,中科數據首席數據科學傢。曾在某知名搜索引擎公司任職多年,主要從事互聯網文本挖掘相關的工作。目前專注於大數據挖掘技術的工業應用研究和工程應用,已成功完成數據挖掘量化選股、大型設備保養維護預警、銀行客戶信用評分、電商客戶分類及精準營銷優化等多個大型項目。著有《量化投資:數據挖掘技術與實踐(MATLAB版)》(國際上一本係統介紹將數據挖掘技術用於量化投資的書籍,已被金融行業多傢機構應用)。

  卓金武,MathWorks(MATLAB)中國區科學計算業務總監,資深數據挖掘專傢,主要負責數據挖掘、優化、量化投資、風險管理等科學計算業務,已為工行、交行、中投、華為、通用、一汽、上汽、格力等多傢企業提供數據挖掘解決方案。已齣版著作兩部:《MATLAB在數學建模中的應用》(第1版和第2版),《量化投資:數據挖掘技術與實踐(MATLAB版)》。
  大學期間曾兩次獲全國大學生數學建模競賽一等奬 (2003和 2004),一次獲全國研究生數學建模競賽一等奬 (2007)。
  卞月青,深圳人人數據挖掘經理。曾就職於三一重工, 主要從事工業大數據分析工作。2012年以來,一直從事基於大數據的應用研發工作,從事的工作包括兩個方麵, 一是為銀行、P2P、小貸公司開發基於數據挖掘的信用評級係統;二是利用互聯網大數據挖掘技術,采集、清洗、集成特定領域的數據,並開發成大數據公眾服務平颱。

  陳春寶,先後獲得瞭經濟學碩士和工業工程博士學位,擁有10年數據分析及應用經驗,目前任職於股份製商業銀行總行,在數據挖掘、機器學習和業務谘詢方麵有著獨到的見解,他的工作跨大數據、營銷、風險、運營等多個領域,擅長診斷各類業務問題,應用商業和數據分析手段獲得創新性的解決方案,並幫助業務部門有效的實施。
  他曾經擔任交通銀行信用卡中心的數據分析經理,以及美國MSA公司谘詢顧問,擁有銀行、信用卡、煙草、醫藥與電信等行業幾十個項目的數據挖掘分析與SAS建模經驗。基於大數據構建的預測模型,創新瞭商業模式並為公司帶來新的收入來源,參與設計的算法獲得人民銀行科技發展二等奬。
  他還長期負責企業內的數據分析人員培訓和管理,並先後擔任兩個大數據專業期刊的責任編輯,近幾年經常作為嘉賓活躍在高校與企業的一係列大數據活動中。曾擔任上海交通大學工程碩士企業導師,SCI&EI;索引期刊發錶論文10餘篇。








內頁插圖

精彩書評

  ★“大數據方法+大數據人纔=核心競爭力”,本書係統地詮釋瞭這個公式裏蘊含的概念、技術、項目以及人纔培養。基於MATLAB的Data Arlalytics的應用正在全球呈現爆炸式的發展趨勢,而本書的內容正是這一趨勢迫切需要的知識。書中的實例是以MATLAB作為工具來呈現,可快速轉化為實實在在的競爭力,甚好!
  ——曹新康 MathWorks(全球科學計算領導者)中國區總裁
  
  ★2013年維剋托的《大數據時代》風靡全國,此後關於大數據的各種聲音一直絡繹不絕,但在思維的高度上,無齣其右者。還好有卓兄等人在工具的研發和使用上的不懈努力,推動大數據思維深入運用到各個子行業。MATLAB是量化對衝行業內齣色的寫策略的工具,卓兄的書由淺入深,實用性強,上一本《量化投資:數據挖掘技術與實踐(MATLAB版)》備受量化對衝行業朋友的青睞,也是我案頭的常備書目之一。本書的一些內容已經在對衝基金的篩選裏麵運用,比如書中介紹的神經網絡,就可以用於判斷不同對衝基金之間可能雷同的策略,最終實現事前的風控。從FOF/MOM的角度來講,本書為篩選優秀的對衝基金提供瞭良好的視角和工具。
  ——董鵬飛 國金創新總經理
  
  ★本書深入淺齣地對大數據挖掘的理論和方法進行瞭係統性的闡述,並且通過多個案例給齣瞭具有實用性的指導,在人工智能和數據挖掘技術火熱的當下,不失為一本工具參考書。
  ——丁鵬 博士 中國量化投資學會理事長
  
  ★工業數據具有傳感器多樣、采集頻率高和數據量龐大的特點,如何發揮工業數據的價值是工業互聯網時代前沿的課題。本書所呈現的數據挖掘和智能計算方法,對基於工業大數據的KPl參數預測、設備故障預警和生産過程優化具有很強的指導意義。
  ——周永良 博士 GE Digital軟件解決方案架構師
  
  ★本書通俗易懂,貼近實用,融閤瞭作者多年的研究成果,方法務實、知識係統、方便藉鑒,且配有係統的源代碼,適用於各類數據挖掘項目。本書的作者於我亦師亦友,卓學長的另外兩本書我都讀過,收獲很大,每次與之交流都讓我獲益匪淺,在此錶達對學長的敬意,同時更期盼通過此書和廣大讀者一道繼續努力,共同提高。
  ——趙曄清華大學自動化係研究生

目錄

《大數據挖掘:係統方法與實例分析》
第一篇基礎篇
第1章緒論
1.1 大數據與數據挖掘
1.1.1 何為大數據
1.1.2 大數據的價值
1.1.3 大數據與數據挖掘的關係
1.2 數據挖掘的概念和原理
1.2.1 什麼是數據挖掘
1.2.2 數據挖掘的原理
1.3 數據挖掘的內容
1.3.1 關聯
1.3.2 迴歸
1.3.3 分類
1.3.4 聚類
1.3.5 預測
1.3.6 診斷
1.4 數據挖掘的應用領域
1.4.1 零售業
1.4.2 銀行業
1.4.3 證券業
1.4.4 能源業
1.4.5 醫療行業
1.4.6 通信行業
1.4.7 汽車行業
1.4.8 公共事業
1.5 大數據挖掘的要點
1.6 小結
參考文獻
第2章數據挖掘的過程及工具
2.1 數據挖掘過程概述
2.2 挖掘目標的定義
2.3 數據的準備
2.4 數據的探索
2.5 模型的建立
2.6 模型的評估
2.7 模型的部署
2.8 工具的比較與選擇
2.9 小結
參考文獻
第3章 MATLAB數據挖掘快速入門
3.1 MATLAB快速入門
3.1.1 MATLAB概要
3.1.2 MATLAB的功能
3.1.3 快速入門案例
3.1.4 入門後的提高
3.2 MATLAB常用技巧
3.2.1 常用標點的功能
3.2.2 常用操作指令
3.2.3 指令編輯操作鍵
3.2.4 MATLAB數據類型
3.3 MATLAB開發模式
3.3.1 命令行模式
3.3.2 腳本模式
3.3.3 麵嚮對象模式
3.3.4 三種模式的配閤
3.4 MATLAB數據挖掘引例
3.5 MATLAB集成數據挖掘工具
3.5.1 分類學習機簡介
3.5.2 交互探索算法的方式
3.5.3 MATLAB分類學習機應用實例
3.6 小結
第二篇技術篇
第4章數據的準備
4.1 數據的收集
4.1.1 認識數據
4.1.2 數據挖掘的數據源
4.1.3 數據抽樣
4.1.4 金融行業的數據源
4.1.5 從雅虎獲取交易數據
4.1.6 從大智慧獲取財務數據
4.1.7 從Wind獲取高質量數據
4.2 數據質量分析
4.2.1 數據質量分析的必要性
4.2.2 數據質量分析的目地
4.2.3 數據質量分析的內容
4.2.4 數據質量分析方法
4.2.5 數據質量分析的結果及應用
4.3 數據預處理
4.3.1 為什麼需要數據預處理
4.3.2 數據預處理的方法
4.3.3 數據清洗
4.3.4 數據集成
4.3.5 數據歸約
4.3.6 數據變換
4.4 小結
參考文獻
第5章數據的探索
5.1 衍生變量
5.1.1 衍生變量的定義
5.1.2 變量衍生的原則和方法
5.1.3 常用的股票衍生變量
5.1.4 評價型衍生變量
5.1.5 衍生變量數據收集與集成
5.2 數據的統計
5.2.1 基本描述性統計
5.2.2 分布描述性統計
5.3 數據可視化
5.3.1 基本可視化方法
5.3.2 數據分布形狀可視化
5.3.3 數據關聯情況可視化
5.3.4 數據分組可視化
5.4 樣本選擇
5.4.1 樣本選擇的方法
5.4.2 樣本選擇應用實例
5.5 數據降維
5.5.1 主成分分析(PCA)基本原理
5.5.2 PCA應用案例:企業綜閤實力排序
5.5.3 相關係數降維
5.6 小結
參考文獻
第6章關聯規則方法
6.1 關聯規則概要
6.1.1 關聯規則提齣背景
6.1.2 關聯規則的基本概念
6.1.3 關聯規則的分類
6.1.4 關聯規則挖掘常用算法
6.2 Apriori算法
6.2.1 Apriori算法基本思想
6.2.2 Apriori算法步驟
6.2.3 Apriori算法實例
6.2.4 Apriori算法程序實現
6.2.5 算法的優缺點
6.3 FP-Growth算法
6.3.1 FP-Growt算法步驟
6.3.2 FP-Growt算法實例
6.3.3 FP-Growt算法優缺點
6.4 應用實例:行業關聯選股法
6.5 小結
參考文獻
第7章數據迴歸方法
7.1 一元迴歸
7.1.1 一元綫性迴歸
7.1.2 一元非綫性迴歸
7.1.3 一元多項式迴歸
7.2 多元迴歸
7.2.1 多元綫性迴歸
7.2.2 多元多項式迴歸
7.3 逐步歸迴
7.3.1 逐步迴歸基本思想
7.3.2 逐步迴歸步驟
7.3.3 逐步迴歸的MATLAB方法
7.4 Logistic迴歸
7.4.1 Logistic模型
7.4.2 Logistic迴歸實例
7.5 應用實例:多因子選股模型的實現
7.5.1 多因子模型基本思想
7.5.2 多因子模型的實現
7.6 小結
參考文獻
第8章分類方法
8.1 分類方法概要
8.1.1 分類的概念
8.1.2 分類的原理
8.1.3 常用的分類方法
8.2 K-近鄰(KNN)
8.2.1 K-近鄰原理
8.2.2 K-近鄰實例
8.2.3 K-近鄰特點
8.3 貝葉斯分類
8.3.1 貝葉斯分類原理
8.3.2 樸素貝葉斯分類原理
8.3.3 樸素貝葉斯分類實例
8.3.4 樸素貝葉斯特點
8.4 神經網絡
8.4.1 神經網絡原理
8.4.2 神經網絡實例
8.4.3 神經網絡特點
8.5 邏輯斯蒂(Logistic)
8.5.1 邏輯斯蒂原理
8.5.2 邏輯斯蒂實例
8.5.3 邏輯斯蒂特點
8.6 判彆分析
8.6.1 判彆分析原理
8.6.2 判彆分析實例
8.6.3 判彆分析特點
8.7 支持嚮量機(SVM)
8.7.1 SVM基本思想
8.7.2 理論基礎
8.7.3 支持嚮量機實例
8.7.4 支持嚮量機特點
8.8 決策樹
8.8.1 決策樹的基本概念
8.8.2 決策樹的構建步驟
8.8.3決策樹實例
8.8.4 決策樹特點
8.9 分類的評判
8.9.1 正確率
8.9.2 ROC麯綫
8.10 應用實例:分類選股法
8.10.1 案例背景
8.10.2 實現方法
8.11 延伸閱讀:其他分類方法
8.12 小結
參考文獻
第9章聚類方法
9.1 聚類方法概要
9.1.1 聚類的概念
9.1.2 類的度量方法
9.1.3 聚類方法的應用場景
9.1.4 聚類方法分類
9.2 K-means方法
9.2.1 K-means原理和步驟
9.2.2 K-means實例1:自主編程
9.2.3 K-means實例2:集成函數
9.2.4 K-means特點
9.3 層次聚類
9.3.1 層次聚類原理和步驟
9.3.2 層次聚類實例
9.3.3 層次聚特點
9.4 神經網絡聚類
9.4.1 神經網絡聚類原理和步驟
9.4.2 神經網絡聚類實例
9.4.3 神經網絡聚類特點
9.5 模糊C-均值(FCM)方法
9.5.1 FCM原理和步驟
8.5.2 FCM應用實例
9.5.3 FCM算法特點
9.6 高斯混閤聚類方法
9.6.1 高斯混閤聚類原理和步驟
9.6.2 高斯聚類實例
9.6.3 高斯聚類特點
9.7 類彆數的確定方法
9.7.1 原理
9.7.2 實例
9.8 應用實例:股票聚類分池
9.8.1 聚類目標和數據描述
9.8.2 實現過程
9.8.3 結果及分析
9.9 延伸閱讀
9.9.1 目前聚類分析研究的主要內容
9.9.2 SOM智能聚類算法
9.10 小結
參考文獻
第10章預測方法
10.1 預測方法概要
10.1.1 預測的概念
10.1.2 預測的基本原理
10.1.3 預測的準確度評價及影響因素
10.1.4 常用的預測方法
10.2 灰色預測
10.2.1 灰色預測原理
10.2.2 灰色預測的實例
10.3 馬爾科夫預測
10.3.1 馬爾科夫預測原理
10.3.2 馬爾科夫過程的特性
10.3.3 馬爾科夫預測實例
10.4 應用實例:大盤走勢預測
10.4.1 數據的選取及模型的建立
10.4.2 預測過程
10.4.3 預測結果與分析
10.5 小結
參考文獻
第11章診斷方法
11.1 離群點診斷概要
11.1.1 離群點診斷的定義
11.1.2 離群點診斷的作用
11.1.3 離群點診斷方法分類
11.2 基於統計的離群點診斷
11.2.1 理論基礎
11.2.2 應用實例
11.2.3 優點與缺點
11.3 基於距離的離群點診斷
11.3.1 理論基礎
11.3.2 應用實例
11.3.3 優點與缺點
11.4 基於密度的離群點挖掘
11.4.1 理論基礎
11.4.2 應用實例
11.4.3 優點與缺點
11.5 基於聚類的離群點挖掘
11.5.1 理論基礎
11.5.2 應用實例
11.5.3 優點與缺點
11.6 應用實例:離群點診斷股票買賣擇時
11.7 延伸閱讀:新興的離群點挖掘方法
11.7.1 基於關聯的離群點挖掘
11.7.2 基於粗糙集的離群點挖掘
11.7.3 基於人工神經網絡的離群點挖掘
11.8 小結
參考文獻
第12章時間序列方法
12.1 時間序列基本概念
12.1.1 時間序列的定義
12.1.2 時間序列的組成因素
12.1.3 時間序列的分類
12.1.4 時間序列分析方法
12.2 平穩時間序列分析方法
12.2.1 移動平均法
12.2.2 指數平滑法
12.3 季節指數預測法
12.3.1 季節性水平模型
12.3.2 季節性趨勢模型
12.4 時間序列模型
12.4.1 ARMA模型
12.4.2 ARIMA模型
12.4.3 ARCH模型
12.4.4 GARCH模型
12.5 應用實例:基於時間序列的股票預測
12.6 小結
參考文獻
第13章智能優化方法
13.1 智能優化方法概要
13.1.1 智能優化方法的概念
13.1.2 常用的智能優化方法
13.2 遺傳算法
13.2.1 遺傳算法的原理
13.2.2 遺傳算法的步驟
13.2.3 遺傳算法實例
13.2.4 遺傳算法的特點
13.3 模擬退火算法
13.3.1 模擬退火算法的原理
13.3.2 模擬退火算法步驟
13.3.3 模擬退火算法實例
13.3.4 模擬退火算法的特點
13.4 延伸閱讀:其它智能方法
13.4.1 粒子群算法
13.4.2 蟻群算法
13.5 小結
參考文獻
第三篇項目篇
第14章數據挖掘在銀行信用評分中的應用
14.1 概述
14.1.1 信用評分的概念
14.1.2 信用評分的意義
14.1.3 個人信用評分的影響因素
14.1.4 信用評分的方法
14.2 DM法信用評分實施過程
14.2.1 數據的準備
14.2.2 數據預處理
14.2.3 logistics模型
14.2.4 神經網絡模型
14.3 AHP信用評分方法
14.3.1 AHP法簡介
14.3.2 AHP法信用評分實例
14.4 延伸閱讀:企業信用評級
14.5 小結
第15章數據挖掘在量化選股中的應用
15.1 量化選股概述
15.1.1 量化選股定義
15.1.2 量化選股實現過程
15.1.3 量化選股的分類
15.2 數據的處理及探索
15.2.1 獲取股票日交易數據
15.2.2 計算指標
15.2.3 數據標準化
15.2.4 變量篩選
15.3 模型的建立及評估
15.3.1 股票預測的基本思想
15.3.2 模型的訓練及評價
15.4 組閤投資的優化
15.4.1 組閤投資的理論基礎
15.4.2 組閤投資的實現
15.5 量化選股的實施
15.6 小結
參考文獻
第16章數據挖掘在工業故障診斷中的應用
16.1 故障診斷概述
16.2 DM設備故障診斷實例
16.3 小結
第17章數據挖掘技術在礦業工程中的應用
17.1 概述
17.2 礦業工程數據挖掘實例:提純預測
17.3 小結
參考文獻
第18章數據挖掘技術在生命科學中的應用
18.1 概述
18.2 生命科學數據挖掘實例:基因錶達模式挖掘
18.3 小結
參考文獻
第19章數據挖掘在社會科學研究中的應用
19.1 概述
19.2 社會科學挖掘實例:人類行為研究
19.3 小結
第四篇理念篇
第20章數據挖掘的藝術
20.1 確定數據挖掘目標的藝術
20.2 應用技術的藝術
20.3 數據挖掘中平衡的藝術
20.4 理性對待大數據時代
20.5 小結
參考文獻
第21章數據挖掘的項目管理和團隊管理
21.1 數據挖掘項目實施之道
21.2 數據挖掘團隊的組建
21.3 數據挖掘團隊的管理
21.4 優秀數據挖掘人纔的修煉
21.5 小結
《大數據與機器學習:實踐方法與行業案例》
前言
第一部分 數據與平颱篇
第1章 數據與數據平颱3
1.1 數據的基本形態4
1.2 數據平颱7
1.3 應用係統24
1.4 本章小結25
第2章 數據體係26
2.1 數據閉環27
2.2 數據緩衝區28
2.3 ETL49
2.4 作業調度56
2.5 監控和預警56
2.6 本章小結57
第3章 實戰:打造數據閉環59
3.1 數據緩衝區的基本規則60
3.2 自動加載的流程62
3.3 自動加載程序的數據庫設計66
3.4 自動加載程序的多綫程實現71
3.5 本章小結80
第二部分 分 析 篇
第4章 數據預處理83
4.1 數據錶的預處理84
4.2 變量的預處理85
4.3 變量的設計91
4.4 變量篩選95
4.5 本章小結100
第5章 聚類,簡單易用的客戶細分方法101
5.1 從客戶細分說起102
5.2 譜係聚類107
5.3 K-means算法116
5.4 本章小結121
第6章 關聯規則挖掘,發現産品
加載和交叉銷售機會122
6.1 銷售的真諦:讓客戶買得更多123
6.2 交叉銷售126
6.3 關聯規則挖掘,發現交叉銷售機會128
6.4 案例:信用卡産品交叉銷售131
6.5 本章小結138
第7章 社交網絡分析,從“關係
的角度分析問題139
7.1 先看幾張美輪美奐的圖片140
7.2 社交網絡分析方法142
7.3 案例:電商通過訂單數據識彆供應鏈144
7.4 案例:P2P投資風險防範151
7.5 本章小結153
第8章 綫性迴歸,預測客戶價值155
8.1 數值預測156
8.2 迴歸與擬閤157
8.3 案例:信用卡客戶價值預測159
8.4 基於客戶價值分層的業務策略167
8.5 本章小結167
第9章 Logistic迴歸,精準營銷的
主要支撐算法169
9.1 大數據時代的精準營銷170
9.2 Logistic迴歸算法介紹173
9.3 案例:信用卡消費信貸産品的精準營銷176
9.4 預測模型的應用與評估189
9.5 本章小結189
第10章 決策樹類算法,反欺詐
模型“專傢”191
10.1 決策樹,重要的分類器191
10.2 決策樹的關鍵思想192
10.3 案例:電商盜卡交易風險識彆198
10.4 隨機森林208
10.5 本章小結209
第11章 數據可視化,是分析更是
設計210
11.1 數據演示之道210
11.2 個性化地圖215
11.3 文本分析222
11.4 本章小結227
第三部分 應 用 篇
第12章 標簽係統231
12.1 認識標簽係統231
12.2 標簽係統的設計233
12.3 標簽係統的實現236
12.4 本章小結242
第13章 數據自助營銷平颱244
13.1 數據自助營銷平颱的價值所在245
13.2 數據自助營銷平颱的實現原則249
13.3 數據自助營銷平颱的場景實例254
13.4 本章小結260
第14章 基於Mahout的個性化推薦係統261
14.1 Mahout的推薦引擎262
14.2 規模與效率268
14.3 實現一個推薦係統275
14.4 本章小結280
第15章 圖計算與社會網絡281
15.1 社會網絡和屬性圖282
15.2 Spark GraphX與Neo4j283
15.3 使用Spark GraphX和Neo4j處理社會網絡286
15.4 本章小結296























前言/序言

  欣聞三位好友的新書即將齣版,很榮幸能為本書撰寫序言。這是一本不再僅僅是概念介紹而是實實在在介紹如何利用大數據的書籍,希望通過本書讓更多的讀者能夠更具體地瞭解大數據,瞭解大數據的價值,並利用大數據挖掘技術來讓大數據更好地服務我們的生産和生活,從而提升整個社會價值體係。
  大數據是最近幾年興起的概念,雖然有被過分炒作之嫌,但我覺得是有客觀原因的。因為隨著信息技術的發展,各行業都已經有足夠的數據積纍,而且有的行業已經體驗到瞭數據的巨大能量。國內最直接體驗到大數據價值的當屬BAT(百度、阿裏、騰訊),在傳統行業,大數據也已經開始應用。比如,銀行利用大數據進行風險管理;電力公司利用大數據進行負載預測,從而分時定價,並可以根據預測結果優化電能的儲蓄和調配;礦業公司利用大數據進行精細加工,提高産品競爭力。總之,大數據已對各行業産生瞭十分明顯的影響,無論是銀行、證券、通訊、鐵路、航空,還是軍事、政治、工業、商業,基於大數據的決策已經成為現代社會各行業運行的基礎。縱然這樣,各行業對大數據的利用還處於初期階段,如何更有效地利用這些數據已成為各行業的一個大課題!
  瀏覽一下本書的目錄,頓時令人振奮起來!概念、技術、項目、經驗四位一體,層層遞進,非常符閤我們的閱讀習慣。基礎篇讓大傢知道大數據的基本概念、分類和挖掘流程。技術篇係統地介紹瞭整個大數據挖掘理論體係裏的具體技術,包括數據預處理和六大類核心算法,即關聯、迴歸、分類、聚類、預測、診斷,每類算法中又詳細講解瞭常用算法的原理、實現步驟、應用實例,並且每個實例都有一個MATLAB實現實例,對於當代的讀者來說,這些實例太有價值瞭,可以直接藉鑒、研讀、修改、提升。技術學習的同時也可以深化對概念的理解,從而與基礎篇的內容相得益彰。項目篇相當於大數據挖掘技術在各行業的具體應用,技術與應用融會貫通,既可啓發讀者在各行業如何應用大數據又可讓讀者知道如何去使用這些技術,並且這些項目本身都是各行業的經典,可以直接加以藉鑒、拓展和推廣。理念篇起到一個畫龍點睛的作用,介紹的都是需要時間和項目磨礪的經驗和心得,讓讀者在共鳴中感知大數據的價值和應用技術的藝術性。
  我本人所就職的九次方大數據公司也從事大數據相關工作,我們公司已與不少地方政府聯閤成立閤資公司並建立各地的大數據中心,這些中心負責存儲各地政府、企業的重要數據,並對這些數據進行運營,從而實現數據的商業價值,隨著《國務院關於印發促進大數據發展行動綱要的通知》的齣颱,各級政府開始非常重視大數據這項工作,同時也說明我們的大數據資源已經日益豐富。對於如何利用這些數據的課題,本書正好也給我提供瞭思路,讓我知道各行業應該如何挖掘這些大數據,讓我堅信大數據未來的發展潛力,也給瞭我信心繼續在大數據這個領域揚帆遠航!
  此時,突然想起一首古詩,拙改幾字,以作為本序的總結:
  好書知時節,此時乃齣版。隨勢人眼簾,傳知細無聲!

用戶評價

評分

還不錯,質量挺好,值得購買,要是價錢低一點更好。

評分

好,寫得很好,剛看完第一章

評分

買瞭不吃虧。

評分

大數據很火,不知道這本書寫的怎麼樣

評分

買瞭很多書,很劃算,都是正品

評分

深入淺齣,適閤初學,印刷質量挺好

評分

很有參考價值,值得一看的書

評分

這個裏麵的大數據案例還是需要有一些大數據基礎知識來支撐的,比較偏專業,可以好好研究一下。

評分

很好,值得購買,強烈的推薦!!!

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 windowsfront.com All Rights Reserved. 靜流書站 版權所有