內容簡介
本書通過大量例子,用簡單明瞭的語言介紹瞭傳統統計學的所有基本概念及方法。 書中還專門用一章的內容來介紹非常重要而實用的機器學習的迴歸分及類方法。本書采用的計算機語言是多年來在國際上使用排名頭名的免費開源軟件—R。讀者在學完本書之後,能夠準確理解統計重要的基本概念,並能用計算機處理各種數據。
作者簡介
吳喜之,北京大學數學力學係學士,美國北卡羅來納大學教堂山分校(UNC-Chapel Hill)統計係博士。中國人民大學統計學院教授,博士生導師。曾在美國加利福尼亞大學戴維斯分校(UC-Davis)、北卡羅來納大學教堂山分校(UNC-Chapel Hill)、北卡羅來納大學夏洛特分校(UNC-Charlotte)、加利福尼亞大學伯剋利分校(UC-Berkeley)、南開大學、中國人民大學、北京大學、中山大學、四川大學等十餘所著名學府執教。
目錄
第 1 章 通過來學統計很容易
1.1統計是什麼? 學統計需要什麼?
1.2R 不僅是一款軟件, 而且是一種文化
習 題
第 2 章 數據及其模式
2.1數據形式、變量
2.2用圖形描述變量的分布
2.3用數字描述變量的分布
2.4密度麯綫和正態分布
習 題
第 3 章 從數據中發現關係
3.1使用散點圖探索數據
3.2相 關
3.3簡單綫性最小二乘迴歸
3.4關於相關和迴歸的注意點
3.5二維列聯錶的初等分析
習 題
第 4 章 通過實驗及抽樣獲得數據
4.1關於數據
4.2實驗設計
4.3抽樣設計及推斷
習 題
第 5 章 概率: 隨機性的度量
5.1隨機性及概率模型
5.2隨機變量
5.3基本概率計算
習 題
第 6 章 抽樣分布
6.1頻數和頻率
6.2 樣本均值
習 題
第 7 章 統計推斷: 估計
7.1正態總體均值的置信區間估計
7.2比例的置信區間
7.3對置信區間的常見誤解
習 題
第 8 章 統計推斷: 顯著性檢驗
8.1正態總體均值的顯著性檢驗
8.2對總體比例的顯著性檢驗
8.3關於中位數的非參數檢驗
8.4閤理使用還是濫用檢驗
8.5檢驗的勢和決策
習 題
第 9 章 二維列聯錶和擬閤優度的卡方檢驗
9.1二維列聯錶推斷
9.2擬閤優度檢驗
習 題
第 10 章 對簡單綫性迴歸的推斷
10.1簡單綫性模型
10.2簡單綫性模型參數的推斷
習 題
第 11 章 經典多元綫性迴歸
11.1模型和擬閤
11.2變換及逐步迴歸
11.3自變量包括分類變量的迴歸
11.4關於經典迴歸的一些說明
11.5logistic 迴歸和probit 迴歸
習 題
第 12 章 機器學習方法的分類及迴歸
12.1機器學習方法簡介
12.2分 類
12.3迴 歸
習 題
附錄 練習: 熟練使用 R 軟件
參考文獻
精彩書摘
無論在國內還是國外, 很多學生, 特彆是非統計專業的學生,都認為學習統計是很枯燥、 煩瑣、 令人頭疼的事情.能不能有一本統計教材讓人覺得統計不那麼可怕、 不那麼令人反感?能不能有一本統計教材能夠對學生有吸引力,甚至讓學生從中得到樂趣?
每個人從小時候起就不斷地學習: 學走路學吃飯、 學說話、 學玩耍、學和同伴交往, 等等. 這些沒有一個是在學校裏學的, 都是在沒有任何老師或傢長督促的情況下自然學到的, 而且學得非常愉快. 在學習課堂知識,特彆是像統計這樣貌似睏難的課程時, 是否也能夠像兒時玩耍那樣輕鬆呢?筆者認為完全可以. 如果教授統計學的老師不覺得統計那麼嚴肅,而覺得統計很有趣, 那就更有助於增加學生學習的幸福感瞭.
筆者在本科階段完全沒有學過概率和統計,在學校裏也從來沒有學過英語和計算機, 但現在統計、英語和計算機很自然地成瞭生活不可或缺的一部分. 為什麼會這樣呢?這是把學習當成兒時的玩耍充滿興趣地投入精力的結果.感興趣的東西自然學得快, 而且掌握得也牢固. 隻要是齣於興趣,而不是為瞭應付考試,相信人們都能夠在獲得大量有用知識和能力的同時享受生活.
學好統計學這門課程的標準是什麼? 絕對不是考試得高分,而是會動手分析實際數據. 不會用計算機處理數據,即使你對標準的統計學試捲答得很好, 這門課也等於白學.統計學是數據科學, 不會分析數據就等於不會統計.
聽老師乾巴巴地講數學概念和公式推導是最摺磨人的, 不僅摺磨學生,也摺磨老師. 本書不鼓勵學生死記硬背, 但鼓勵學生動手,在分析數據中學到本領、 得到樂趣. 不僅要動手,而且要不停地懷疑和質疑書本上的現成知識, 隻有充滿瞭懷疑和好奇,纔會有興趣去關注最新的發展, 纔有可能超越前人.如果一個人失去瞭好奇心, 那麼無論其實際年齡為多少歲,都說明他的心態已經進入瞭老年.
本書力圖把所有概念都通過例子講齣來, 而不是先定義概念再講例子.本書采用國際流行的免費編程軟件R來實現所有的目標, 並且提供所有例子的代碼.
在內容安排上,筆者有意把一些概念或術語在正式給齣數學定義之前就多次提及,以加深印象, 同時避免隔斷本來就交織在一起的知識. 比如,密度麯綫和正態分布的概念在正式定義隨機變量之前就引入;綫性迴歸在區間估計和假設檢驗之前就予以初步介紹;雖然很早就提及兩結果的獨立隨機試驗,但是二項分布卻在抽樣分布中纔引入.
在內容取捨上, 凡是本書沒有用到的理論或概念就盡量不講或少講,以避免分散讀者的精力.
此外, 除瞭經典統計的基本內容之外,本書還用一章介紹瞭機器學習的分類和迴歸方法.這一章用不著前麵各章的任何知識.
一本教材, 應該好教、 易學、 坦誠、 透明,不應該有任何不可告人或者故作神秘的懸念.我們應該讓讀者喜歡而不是敬畏統計這門科學.
前言/序言
統計學:基於R的應用/教育部經濟管理類核心課程教材 下載 mobi epub pdf txt 電子書