編輯推薦
現實工作中,人們常常需要用數據說話。可是,數據自己不會說話,需要人對它進行分析和挖掘纔能找到有價值的信息。概率統計是數據分析的通用語言,是大數據時代預測未來的根基。如果你有編程背景,就能以概率和統計學為工具,將數據轉化為有用的信息和知識,讓數據說話。本書介紹瞭如何藉助計算而非數學方法,使用Python語言對數據進行統計分析。
通過書中有趣的案例,你可以學到探索性數據分析的整個過程,從數據收集和生成統計量,到發現模式和檢驗假設。你還將探索概率分布、概率法則、可視化技術,以及其他許多工具和概念。
這一版內容較第1版有很多改動,並且新增瞭迴歸、時間序列分析、生存分析和分析方法章節,以豐富你的知識。
通過學習本書,你將能夠:
編寫測試代碼深入理解概率論和統計學;
運行實驗檢驗統計行為特徵,如生成服從各種分布的樣本;
通過模擬理解數學上艱澀的概念;
學習貝葉斯估計等實用內容;
用Python從大部分數據源導入數據,不依賴由統計工具清洗的格式化數據;
用統計推理解讀現實世界中的數據。
內容簡介
《統計思維:程序員數學之概率統計(第2版)》是一本以全新視角講解概率統計的入門圖書。拋開經典的數學分析,Downey手把手教你用編程理解統計學。
具體說來,《統計思維:程序員數學之概率統計(第2版)》通過一個案例研究,介紹探索性數據分析的全過程:從收集數據、生成統計信息,到發現模式、驗證假設。同時研究分布、概率規則、可視化和其他多種工具及概念。此外,第2版新增瞭迴歸、時間序列分析、生存分析和分析方法等章節。
作者簡介
Allen B. Downey是富蘭剋林歐林工程學院計算機科學教授,曾執教於韋爾斯利學院、科爾比學院和加州大學伯剋利分校。在加州大學伯剋利分校獲得計算機科學博士學位。Downey已齣版十餘本技術書,包括Think Python、Think Bayes、Think Complexity等。
內頁插圖
目錄
前言 xi
第1 章 探索性數據分析 1
1.1 統計學方法 2
1.2 全國傢庭增長調查 2
1.3 數據導入 3
1.4 DataFrame 4
1.5 變量 6
1.6 數據變換 6
1.7 數據驗證 8
1.8 解釋數據 9
1.9 練習 10
1.10 術語 11
第2 章 分布 13
2.1 錶示直方圖 14
2.2 繪製直方圖 14
2.3 全國傢庭增長調查中的變量 15
2.4 離群值 18
2.5 第一胎 18
2.6 分布概述 20
2.7 方差 21
2.8 效應量 21
2.9 報告結果 22
2.10 練習 23
2.11 術語 23
第3 章 概率質量函數 25
3.1 概率質量函數 25
3.2 繪製PMF 26
3.3 繪製PMF 的其他方法 28
3.4 課堂規模悖論 29
3.5 使用DataFrame 進行索引 31
3.6 練習 33
3.7 術語 34
第4 章 纍積分布函數 35
4.1 PMF 的局限 35
4.2 百分位數 36
4.3 CDF 37
4.4 錶示CDF 38
4.5 比較CDF 39
4.6 基於百分位數的統計量 40
4.7 隨機數 41
4.8 比較百分位秩 42
4.9 練習 43
4.10 術語 44
第5 章 分布建模 45
5.1 指數分布 45
5.2 正態分布 48
5.3 正態概率圖 49
5.4 對數正態分布 51
5.5 Pareto 分布 53
5.6 隨機數生成 56
5.7 為什麼使用模型 56
5.8 練習 57
5.9 術語 59
第6 章 概率密度函數 61
6.1 PDF 61
6.2 核密度估計 63
6.3 分布框架 65
6.4 Hist 實現 65
6.5 Pmf 實現 66
6.6 Cdf 實現 67
6.7 矩 68
6.8 偏度 69
6.9 練習 72
6.10 術語 73
第7 章 變量之間的關係 75
7.1 散點圖 75
7.2 描述關係特徵 78
7.3 相關性 79
7.4 協方差 80
7.5 Pearson 相關性 81
7.6 非綫性關係 82
7.7 Spearman 秩相關 82
7.8 相關性和因果關係 83
7.9 練習 84
7.10 術語 85
第8 章 估計 87
8.1 估計遊戲 87
8.2 猜測方差 89
8.3 抽樣分布 90
8.4 抽樣偏倚 93
8.5 指數分布 93
8.6 練習 95
8.7 術語 95
第9 章 假設檢驗 97
9.1 經典假設檢驗 97
9.2 假設檢驗 98
9.3 檢驗均值差 100
9.4 其他檢驗統計量 101
9.5 檢驗相關性 102
9.6 檢驗比例 103
9.7 卡方檢驗 104
9.8 再談第一胎 105
9.9 誤差 106
9.10 功效 107
9.11 復現 108
9.12 練習 109
9.13 術語 109
第10 章 綫性最小二乘法 111
10.1 最小二乘法擬閤 111
10.2 實現 112
10.3 殘差 113
10.4 估計 114
10.5 擬閤優度 116
10.6 檢驗綫性模型 118
10.7 加權重抽樣 119
10.8 練習 121
10.9 術語 121
第11 章 迴歸 123
11.1 StatsModels 124
11.2 多重迴歸 125
11.3 非綫性關係 127
11.4 數據挖掘 128
11.5 預測 129
11.6 Logistic 迴歸 131
11.7 估計參數 132
11.8 實現 133
11.9 準確度 134
11.10 練習 135
11.11 術語 136
第12 章 時間序列分析 139
12.1 導入和清洗數據 139
12.2 繪製圖形 141
12.3 綫性迴歸 143
12.4 移動平均值 144
12.5 缺失值 146
12.6 序列相關 148
12.7 自相關 149
12.8 預測 150
12.9 參考書目 154
12.10 練習 154
12.11 術語 155
第13 章 生存分析 157
13.1 生存麯綫 157
13.2 危險函數 159
13.3 估計生存麯綫 160
13.4 Kaplan-Meier 估計 161
13.5 婚姻麯綫 162
13.6 估計生存函數 163
13.7 置信區間 164
13.8 群組效應 166
13.9 外推 168
13.10 預期剩餘生存期 169
13.11 練習 171
13.12 術語 172
第14 章 分析方法 173
14.1 正態分布 173
14.2 抽樣分布 174
14.3 錶示正態分布 175
14.4 中心極限定理 176
14.5 檢驗CLT 177
14.6 應用CLT 180
14.7 相關檢驗 181
14.8 卡方檢驗 183
14.9 討論 184
14.10 練習 184
作者介紹 186
封麵介紹 186
前言/序言
統計思維:程序員數學之概率統計(第2版) 下載 mobi epub pdf txt 電子書
評分
☆☆☆☆☆
放傢裏,一直沒看,最近看瞭下,感覺不錯
評分
☆☆☆☆☆
不錯,很薄,讓人看起來感覺到希望。不像一些統計學書,拿到就感到絕望
評分
☆☆☆☆☆
很好的讀物,日類的書圖片比較多,感覺這樣的書比較能詳細理解內容。
評分
☆☆☆☆☆
很好的書,不是很厚,看看再說
評分
☆☆☆☆☆
從我看瞭兩小時的情況看,的確是淺顯易懂,又內涵深刻。
評分
☆☆☆☆☆
學習中,學習中,學習中…清晰,質量不錯
評分
☆☆☆☆☆
Python語言描述的概率統計,實用性很突齣
評分
☆☆☆☆☆
數據科學專業指導書,理論聯係實際
評分
☆☆☆☆☆
放傢裏,一直沒看,最近看瞭下,感覺不錯