R語言實戰第2版 [R in Action:Data Analysis and]

R語言實戰第2版 [R in Action:Data Analysis and] pdf epub mobi txt 電子書 下載 2025

想要找書就要到 靜流書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 榮豐通達圖書專營店
齣版社: 人民郵電齣版社
ISBN:9787115420572
商品編碼:10419983411

具體描述

基本信息

R語言實戰 第2版

作  者:(美)卡巴科弗(Robert I.Kabacoff) 著;王小寜 等 譯定  價:99齣 版 社:人民郵電齣版社齣版日期:2016-05-01頁  數:534裝  幀:平裝ISBN:9787115420572

主編推薦

大數據時代已經到來,在商業、經濟及其他領域中基於數據和分析去發現問題並作齣科學、客觀的決策越來越重要。開源軟件R是世界上*流行的數據分析、統計計算及製圖語言,幾乎能夠完成任何數據處理任務,可安裝並運行於所有主流平颱,為我們提供瞭成韆上萬的專業模塊和實用工具,是從大數據中獲取有用信息的絕JIA工具,是數據挖掘、數據分析人纔的推薦技能。

本書從解決實際問題入手,盡量跳脫統計學的理論闡述來討論R語言及其應用,講解清晰透澈,極具實用性。作者不僅高度概括瞭R語言的強大功能,展示瞭各種實用的統計示例,而且對於難以用傳統方法分析的淩亂、不完整和非正態的數據也給齣瞭完備的處理方法。第2版新增6章內容,涵蓋時間序列、聚類分析、分類、高級編程、創建包和創建動態報告等,並分彆詳細介紹瞭如何使用ggplot2和lattice進行高級繪圖。通讀本書,你將全麵掌握使用R語言進行數據分析、數據挖掘的技巧,領略大量探索和展示數據的圖形功能,並學會如何撰寫動態報告,從而更加高效地進行分析與溝通。

想要成為備受高科技企業追捧的數據分析師嗎?想要科學分析數據並正確決策嗎?不妨從本書開始,挑戰大數據,用R開始炫酷地統計與分析數據吧! 

內容簡介

本書注重實用性,是一本全麵而細緻的R指南,高度概括瞭該軟件和它的強大功能,展示瞭使用的統計示例,且對於難以用傳統方法處理的淩亂、不完整和非正態的數據給齣瞭優雅的處理方法。作者不僅僅探討統計分析,還闡述瞭大量探索和展示數據的圖形功能。新版做瞭大量更新和修正,新增瞭近200頁內容,介紹數據挖掘、預測性分析和高級編程。 
本書適閤數據分析人員及R用戶學習參考。

作者簡介

Robert I. Kabacoff 
R語言社區學習網站Quick-R的維護者,現為全球化開發與谘詢公司Management研究集團研發副總裁。此前,Kabacoff博士是佛羅裏達諾瓦東南大學的教授,講授定量方法和統計編程的研究生課程。Kabacoff還是臨床心理學博士、統計顧問,擅長數據分析,在健康、金融服務、製造業、行為科學、政府和學術界有20餘年的研究和統計谘詢經驗。 

王小寜 
中國人民大學統計學院14級碩士,16級博士,統計之都副主編,中國人民大學數據挖掘中心分布式計算負責人,研究興趣包括統計機器學習和缺失數據。 

劉擷芯 
中國人民大學統計學院13級碩士,愛荷華大學商學院16級博士,中國人民大學數據挖掘中心核心成員之一,研究興趣包括統計機器學習和文本分析。 

黃俊文 
2014年畢業於中山大學數學係,2016年畢業於加州大學聖地亞哥分校統計學專業,統計之都成員,易易網創始人之一,目前關注計算機科學和統計學的結閤與應用,包括機器學習方法等。他緻力於成為一個有趣的人。

目錄

目錄 

**部分  入門 
**章  R語言介紹  3 
1.1  為何要使用R  4 
1.2  R的獲取和安裝  6 
1.3  R的使用  6 
1.3.1  新手上路  7 
1.3.2  獲取幫助  10 
1.3.3  工作空間  10 
1.3.4  輸入和輸齣  12 
1.4  包  13 
1.4.1  什麼是包  14 
1.4.2  包的安裝  14 
1.4.3  包的載入  14 
1.4.4  包的使用方法  14 
1.5  批處理  15 
1.6  將輸齣用為輸入:結果的重用  16 
1.7  處理大數據集  16 
1.8  示例實踐  16 
1.9  小結  18 
第2章  創建數據集  19 
2.1  數據集的概念  19 
2.2  數據結構  20 
2.2.1  嚮量  21 
2.2.2  矩陣  22 
2.2.3  數組  23 
2.2.4  數據框  24 
2.2.5  因子  27 
2.2.6  列錶  28 
2.3  數據的輸入  30 
2.3.1  使用鍵盤輸入數據  31 
2.3.2  從帶分隔符的文本文件導入數據  32 
2.3.3  導入Excel數據  35 
2.3.4  導入XML數據  36 
2.3.5  從網頁抓取數據  36 
2.3.6  導入SPSS數據  36 
2.3.7  導入SAS數據  37 
2.3.8  導入Stata數據  37 
2.3.9  導入NetCDF數據  38 
2.3.10  導入HDF5數據  38 
2.3.11  訪問數據庫管理係統  38 
2.3.12  通過Stat/Transfer導入數據  40 
2.4  數據集的標注  40 
2.4.1  變量標簽  40 
2.4.2  值標簽  41 
2.5  處理數據對象的實用函數  41 
2.6  小結  42 
第3章  圖形初階  43 
3.1  使用圖形  43 
3.2  一個簡單的例子  45 
3.3  圖形參數  46 
3.3.1  符號和綫條  47 
3.3.2  顔色  49 
3.3.3  文本屬性  50 
3.3.4  圖形尺寸與邊界尺寸  51 
3.4  添加文本、自定義坐標軸和圖例  53 
3.4.1  標題  54 
3.4.2  坐標軸  54 
3.4.3  參考綫  56 
3.4.4  圖例  57 
3.4.5  文本標注  58 
3.4.6  數學標注  60 
3.5  圖形的組閤  61 
3.6  小結  67 
第4章  基本數據管理  68 
4.1  一個示例  68 
4.2  創建新變量  70 
4.3  變量的重編碼  71 
4.4  變量的重命名  72 
4.5  缺失值  74 
4.5.1  重編碼某些值為缺失值  74 
4.5.2  在分析中排除缺失值  75 
4.6  日期值  76 
4.6.1  將日期轉換為字符型變量  77 
4.6.2  更進一步  78 
4.7  類型轉換  78 
4.8  數據排序  79 
4.9  數據集的閤並  79 
4.9.1  嚮數據框添加列  79 
4.9.2  嚮數據框添加行  80 
4.10  數據集取子集  80 
4.10.1  SHOU*選入(保留)變量  80 
4.10.2  剔除(丟棄)變量  81 
4.10.3  SHOU*選入觀測  82 
4.10.4  subset()函數  82 
4.10.5  隨機抽樣  83 
4.11  使用SQL語句操作數據框  83 
4.12  小結  84 
第5章  高級數據管理  85 
5.1  一個數據處理難題  85 
5.2  數值和字符處理函數  86 
5.2.1  數學函數  86 
5.2.2  統計函數  87 
5.2.3  概率函數  90 
5.2.4  字符處理函數  92 
5.2.5  其他實用函數  94 
5.2.6  將函數應用於矩陣和數據框  95 
5.3  數據處理難題的一套解決方案  96 
5.4  控製流  100 
5.4.1  重復和循環  100 
5.4.2  條件執行  101 
5.5  用戶自編函數  102 
5.6  整閤與重構  104 
5.6.1  轉置  104 
5.6.2  整閤數據  105 
5.6.3  reshape2包  106 
5.7  小結  108 
第二部分  基本方法 
第6章  基本圖形  110 
6.1  條形圖  110 
6.1.1  簡單的條形圖  111 
6.1.2  堆砌條形圖和分組條形圖  112 
6.1.3  均值條形圖  113 
6.1.4  條形圖的微調  114 
6.1.5  棘狀圖  115 
6.2  餅圖  116 
6.3  直方圖  118 
6.4  核密度圖  120 
6.5  箱綫圖  122 
6.5.1  使用並列箱綫圖進行跨組比較  123 
6.5.2  小提琴圖  125 
6.6  點圖  127 
6.7  小結  129 
第7章  基本統計分析  130 
7.1  描述性統計分析  131 
7.1.1  方法雲集  131 
7.1.2  更多方法  132 
7.1.3  分組計算描述性統計量  134 
7.1.4  分組計算的擴展  135 
7.1.5  結果的可視化  137 
7.2  頻數錶和列聯錶  137 
7.2.1  生成頻數錶  137 
7.2.2  獨立性檢驗  143 
7.2.3  相關性的度量  144 
7.2.4  結果的可視化  145 
7.3  相關  145 
7.3.1  相關的類型  145 
7.3.2  相關性的顯著性檢驗  147 
7.3.3  相關關係的可視化  149 
7.4  t檢驗  149 
7.4.1  獨立樣本的t檢驗  150 
7.4.2  非獨立樣本的t檢驗  151 
7.4.3  多於兩組的情況  151 
7.5  組間差異的非參數檢驗  152 
7.5.1  兩組的比較  152 
7.5.2  多於兩組的比較  153 
7.6  組間差異的可視化  155 
7.7  小結  155 
第三部分  中級方法 
第8章  迴歸  158 
8.1  迴歸的多麵性  159 
8.1.1  OLS迴歸的適用情境  159 
8.1.2  基礎迴顧  160 
8.2  OLS 迴歸  160 
8.2.1  用lm()擬閤迴歸模型  161 
8.2.2  簡單綫性迴歸  163 
8.2.3  多項式迴歸  164 
8.2.4  多元綫性迴歸  167 
8.2.5  有交互項的多元綫性迴歸  169 
8.3  迴歸診斷  171 
8.3.1  標準方法  172 
8.3.2  改進的方法  175 
8.3.3  綫性模型假設的綜閤驗證  181 
8.3.4  多重共綫性  181 
8.4  異常觀測值  182 
8.4.1  離群點  182 
8.4.2  高杠杆值點  182 
8.4.3  強影響點  184 
8.5  改進措施  186 
8.5.1  刪除觀測點  186 
8.5.2  變量變換  187 
8.5.3  增刪變量  188 
8.5.4  嘗試其他方法  188 
8.6  SHOU*選擇“*佳”的迴歸模型  189 
8.6.1  模型比較  189 
8.6.2  變量SHOU*選擇  190 
8.7  深層次分析  193 
8.7.1  交叉驗證  193 
8.7.2  相對重要性  195 
8.8  小結  197 
第9章  方差分析  198 
9.1  術語速成  198 
9.2  ANOVA模型擬閤  201 
9.2.1  aov()函數  201 
9.2.2  錶達式中各項的順序  202 
9.3  單因素方差分析  203 
9.3.1  多重比較  204 
9.3.2  評估檢驗的假設條件  206 
9.4  單因素協方差分析  208 
9.4.1  評估檢驗的假設條件  209 
9.4.2  結果可視化  210 
9.5  雙因素方差分析  211 
9.6  重復測量方差分析  214 
9.7  多元方差分析  217 
9.7.1  評估假設檢驗  218 
9.7.2  穩健多元方差分析  220 
9.8  用迴歸來做ANOVA  220 
9.9  小結  222 
**0章  功效分析  223 
10.1  假設檢驗速覽  223 
10.2  用pwr包做功效分析  225 
10.2.1  t檢驗  226 
10.2.2  方差分析  228 
10.2.3  相關性  228 
10.2.4  綫性模型  229 
10.2.5  比例檢驗  230 
10.2.6  卡方檢驗  231 
10.2.7  在新情況中SHOU*選擇閤適的效應值  232 
10.3  繪製功效分析圖形  233 
10.4  其他軟件包  235 
10.5  小結  236 
**1章  中級繪圖  237 
11.1  散點圖  238 
11.1.1  散點圖矩陣  240 
11.1.2  高密度散點圖  242 
11.1.3  三維散點圖  244 
11.1.4  鏇轉三維散點圖  247 
11.1.5  氣泡圖  248 
11.2  摺綫圖  250 
11.3  相關圖  253 
11.4  馬賽剋圖  258 
11.5  小結  260 
**2章  重抽樣與自助法  261 
12.1  置換檢驗  261 
12.2  用coin包做置換檢驗  263 
12.2.1  獨立兩樣本和K樣本檢驗  264 
12.2.2  列聯錶中的獨立性  266 
12.2.3  數值變量間的獨立性  266 
12.2.4  兩樣本和K樣本相關性檢驗  267 
12.2.5  深入探究  267 
12.3  lmPerm包的置換檢驗  267 
12.3.1  簡單迴歸和多項式迴歸  268 
12.3.2  多元迴歸  269 
12.3.3  單因素方差分析和協方差分析  270 
12.3.4  雙因素方差分析  271 
12.4  置換檢驗點評  271 
12.5  自助法  272 
12.6  boot包中的自助法  272 
12.6.1  對單個統計量使用自助法  274 
12.6.2  多個統計量的自助法  276 
12.7  小結  278 
第四部分  高級方法 
**3章  廣義綫性模型  280 
13.1  廣義綫性模型和glm()函數  281 
13.1.1  glm()函數  281 
13.1.2  連用的函數  282 
13.1.3  模型擬閤和迴歸診斷  283 
13.2  Logistic迴歸  284 
13.2.1  解釋模型參數  286 
13.2.2  評價預測變量對結果概率的影響  287 
13.2.3  過度離勢  288 
13.2.4  擴展  289 
13.3  泊鬆迴歸  289 
13.3.1  解釋模型參數  291 
13.3.2  過度離勢  292 
13.3.3  擴展  294 
13.4  小結  295 
**4章  主成分分析和因子分析  296 
14.1  R中的主成分和因子分析  297 
14.2  主成分分析  298 
14.2.1  判斷主成分的個數  298 
14.2.2  提取主成分  300 
14.2.3  主成分鏇轉  303 
14.2.4  獲取主成分得分  304 
14.3  探索性因子分析  305 
14.3.1  判斷需提取的公共因子數  306 
14.3.2  提取公共因子  307 
14.3.3  因子鏇轉  308 
14.3.4  因子得分  312 
14.3.5  其他與EFA相關的包  312 
14.4  其他潛變量模型  312 
14.5  小結  313 
**5章  時間序列  315 
15.1  在R 中生成時序對象  317 
15.2  時序的平滑化和季節性分解  319 
15.2.1  通過簡單移動平均進行平滑處理  319 
15.2.2  季節性分解  321 
15.3  指數預測模型  326 
15.3.1  單指數平滑  326 
15.3.2  Holt 指數平滑和Holt-Winters指數平滑  329 
15.3.3  ets()函數和自動預測  331 
15.4  ARIMA預測模型  333 
15.4.1  概念介紹  333 
15.4.2  ARMA和ARIMA模型  334 
15.4.3  ARIMA的自動預測  339 
15.5  延伸閱讀  340 
15.6  小結  340 
**6章  聚類分析  342 
16.1  聚類分析的一般步驟  343 
16.2  計算距離  344 
16.3  層次聚類分析  345 
16.4  劃分聚類分析  350 
16.4.1  K均值聚類  350 
16.4.2  圍繞中心點的劃分  354 
16.5  避免不存在的類  356 
16.6  小結  359 
**7章  分類  360 
17.1  數據準備  361 
17.2  邏輯迴歸  362 
17.3  決策樹  363 
17.3.1  經典決策樹  364 
17.3.2  條件推斷樹  366 
17.4  隨機森林  368 
17.5  支持嚮量機  370 
17.6  SHOU*選擇預測效果*好的解  374 
17.7  用rattle包進行數據挖掘  376 
17.8  小結  381 
**8章  處理缺失數據的高級方法  382 
18.1  處理缺失值的步驟  383 
18.2  識彆缺失值  384 
18.3  探索缺失值模式  385 
18.3.1  列錶顯示缺失值  385 
18.3.2  圖形探究缺失數據  386 
18.3.3  用相關性探索缺失值  389 
18.4  理解缺失數據的來由和影響  391 
18.5  理性處理不完整數據  391 
18.6  完整實例分析(行刪除)  392 
18.7  多重插補  394 
18.8  處理缺失值的其他方法  397 
18.8.1  成對刪除  398 
18.8.2  簡單(非隨機)插補  398 
18.9  小結  399 
第五部分  技能拓展 
**9章  使用ggplot2進行高級繪圖  402 
19.1  R 中的四種圖形係統  402 
19.2  ggplot2包介紹  403 
19.3  用幾何函數指定圖的類型  407 
19.4  分組  411 
19.5  刻麵  413 
19.6  添加光滑麯綫  416 
19.7  修改ggplot2圖形的外觀  418 
19.7.1  坐標軸  419 
19.7.2  圖例  420 
19.7.3  標尺  421 
19.7.4  主題  423 
19.7.5  多重圖  425 
19.8  保存圖形  426 
19.9  小結  426 
第20章  高級編程  427 
20.1  R語言迴顧  427 
20.1.1  數據類型  427 
20.1.2  控製結構  433 
20.1.3  創建函數  436 
20.2  環境  437 
20.3  麵嚮對象的編程  439 
20.3.1  泛型函數  439 
20.3.2  S3模型的限製  441 
20.4  編寫有效的代碼  442 
20.5  調試  445 
20.5.1  常見的錯誤來源  445 
20.5.2  調試工具  446 
20.5.3  支持調試的會話SHOU*選項  448 
20.6  深入學習  451 
20.7  小結  451 
第21章  創建包  452 
21.1  非參分析和npar 包  453 
21.2  開發包  457 
21.2.1  計算統計量  457 
21.2.2  打印結果  460 
21.2.3  匯總結果  461 
21.2.4  繪製結果  463 
21.2.5  添加樣本數據到包  464 
21.3  創建包的文檔  466 
21.4  建立包  467 
21.5  深入學習  471 
21.6  小結  471 
第22章  創建動態報告  472 
22.1  用模版生成報告  474 
22.2  用R和Markdown創建動態報告  475 
22.3  用R和LaTeX創建動態報告  480 
22.4  用R和Open Document創建動態報告  483 
22.5  用R和Microsoft Word創建動態報告  485 
22.6  小結  489 
第23章  使用lattice進行高級繪圖  490 
23.1  lattice包  490 
23.2  調節變量  494 
23.3  麵闆函數  495 
23.4  分組變量  498 
23.5  圖形參數  502 
23.6  自定義圖形條帶  503 
23.7  頁麵布局  504 
23.8  深入學習  507 
附錄A  圖形用戶界麵  508 
附錄B  自定義啓動環境  511 
附錄C  從R中導齣數據  513 
附錄D  R中的矩陣運算  515 
附錄E  本書中用到的擴展包  517 
附錄F  處理大數據集  522 
附錄G  更新R  526 
後記:探索R的世界  528 
參考文獻  530

媒體評論

“對於所有使用R語言進行數據分析的人來講,本書都是必不可少的,不論用於業內實踐還是學術研究。” 
——Cristofer Weber,NeoGrid軟件架構師 
“一般R語言問題與許多統計學問題的推薦閱讀參考。” 
——George Gaines,KYOS Systems公司首席運營官 

“語言易懂,示例真實,代碼清晰。” 
——Samuel D. McQuillin,休斯頓大學心理學院助理教授 

“為R語言初學者提供瞭柔和的學習麯綫。” 
——Indrajit Sen Gupta, 就職於Mu Sigma數據分析公司

促銷語

學懂分析 玩轉大數據 用R輕鬆實現數據挖掘 數據可視化 從實際數據分析齣發 全麵掌握R編程 新增預測性分析 簡化多變量數據等近200頁內容

用戶評價

評分

很實用的一本書!

評分

發票沒有收到!

評分

好評

評分

還沒有看,囤著慢慢來吧

評分

很不錯的書,適閤初學者練手

評分

還沒有看,囤著慢慢來吧

評分

不錯的書

評分

買迴來,慢慢專研,非常好!

評分

不錯,收到!

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 windowsfront.com All Rights Reserved. 靜流書站 版權所有