從零進階!數據分析的統計基礎(第2版)CDA數據分析師係列叢書

從零進階!數據分析的統計基礎(第2版)CDA數據分析師係列叢書 pdf epub mobi txt 電子書 下載 2025

經管之傢 著
想要找書就要到 靜流書站
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
店鋪: 曠氏文豪圖書專營店
齣版社: 電子工業齣版社
ISBN:9787121285004
商品編碼:10357737895
開本:16開
齣版時間:2016-05-01
頁數:1
字數:1

具體描述

基本信息

書名:從零進階!數據分析的統計基礎(第2版)

**:59.00元

作者:經管之傢 編

齣版社:電子工業齣版社

齣版日期:2016-05-01

ISBN:9787121285004

字數:

頁碼:256

版次:1

裝幀:平裝

開本:16

商品重量:

編輯推薦


“CDA數據分析師係列叢書”依照數據分析師規範化學習體係而定。滿足瞭CDA數據分析師等級認證學習的需要,也兼顧瞭大數據的熱點動態。

從策劃之初一直堅持以“讀者需求”為主綫,結閤企業實際案例和業務場景來談大數據思維和小數據分析。實現技術紮實,業務精通,策略接地氣!

目錄


第1 章數據分析概述 1

1.1 什麼是數據分析 2

1.2 數據分析六部麯 2

1.2.1 明確分析目的和內容 2

1.2.2 數據收集 . 3

1.2.3 數據預處理 . 3

1.2.4 數據分析 . 4

1.2.5 數據展現 . 5

1.2.6 報告撰寫 . 6

1.3 數據分析方法簡介 6

1.3.1 單純的數據加工方法 6

1.3.2 基於數理統計的數據分析方法 7

1.3.3 基於數據挖掘的數據分析方法 8

1.3.4 基於大數據的數據分析方法 11

1.3.5 數理統計與數據挖掘的區彆和聯係 13

1.4 常用數據分析工具的安裝 14

1.4.1 在Excel 2013 中安裝數據分析工具 14

1.4.2 數據分析軟件SPSS 的安裝 . 16

1.5 重要知識點迴顧 22

1.6 課後習題 . 23

第2 章描述性統計分析 24

2.1 直方圖 . 25

2.1.1 什麼是直方圖 25

2.1.2 如何看直方圖 25

2.1.3 如何畫直方圖 26

2.1.4 使用Excel 2013 進行直方圖的繪製 27

2.2 數據的計量尺度 30

2.3 數據的集中趨勢 31

2.3.1 平均數 . 31

2.3.2 分位數 . 33

2.3.3 眾數 . 34

2.4 數據的離中趨勢 34

2.4.1 極差 . 35

2.4.2 分位距 . 35

2.4.3 平均差 . 36

2.4.4 方差與標準差 37

2.4.5 離散係數 . 38

2.5 數據分布的測定 40

2.5.1 數據偏態及其測定 40

2.5.2 數據峰度及其測定 41

2.5.3 數據偏度和峰度的作用 42

2.6 數據的展示——統計圖 43

2.6.1 條形圖與扇形圖 43

2.6.2 摺綫圖 . 44

2.6.3 莖葉圖 . 45

2.6.4 箱綫圖 . 48

2.6.5 統計圖小結 . 52

2.7 使用Excel 實現數據的描述性統計及分析 . 52

2.7.1 使用Excel 實現三國全部人物武力描述性統計 . 52

2.7.2 使用Excel 分彆實現三個國傢人物武力描述性統計分析 . 54

2.7.3 使用Excel 分彆實現三個國傢武將武力描述性統計分析 . 55

2.7.4 使用SPSS 實現三個國傢武將武力的分位數分析 . 56

2.8 重要知識點迴顧 59

2.9 課後習題 . 59

第3 章數理統計基礎 62

3.1 抽樣估計基礎 63

3.1.1 隨機事件 . 63

3.1.2 隨機事件的概率 64

3.1.3 隨機變量及其概率分布 66

3.1.4 隨機變量的數字特徵 71

3.2 正態分布及分布 72

3.2.1 正態分布的概率密度函數 73

3.2.2 正態分布的特徵 73

3.2.3 標準正態分布 74

3.2.4 基於正態分布的分布 77

3.3 中心極限定理 80

3.3.1 中心極限定理的提法 80

3.3.2 中心極限定理的內容 81

3.3.3 中心極限定理的意義與應用 81

3.4 重要知識點迴顧 82

3.5 課後習題 . 83

第4 章抽樣估計 . 86

4.1 抽樣估計的基本概念 87

4.1.1 總體及總體指標 87

4.1.2 樣本及樣本指標 88

4.1.3 抽樣估計的思想 89

4.1.4 抽樣估計的理論基礎 91

4.1.5 樣本統計量及分布 92

4.2 抽樣估計的方法——點估計 93

4.2.1 點估計 . 93

4.2.2 點估計精度和樣本容量的關係 95

4.2.3 點估計的優缺點 96

4.3 抽樣估計的誤差 97

4.3.1 抽樣估計的實際誤差 97

4.3.2 抽樣估計的平均誤差 98

4.3.3 抽樣估計的極限誤差 102

4.4 抽樣估計的方法——區間估計 102

4.4.1 抽樣估計的精度及置信度 102

4.4.2 區間估計的方法 105

4.4.3 區間估計的步驟 106

4.5 抽樣的組織形式和抽樣數目的確定 107

4.5.1 抽樣的組織形式 107

4.5.2 必要抽樣數目的確定 109

4.6 重要知識點迴顧 112

4.7 課後習題 113

第5 章假設檢驗 . 117

5.1 假設檢驗概述 118

5.1.1 假設檢驗的概念 118

5.1.2 假設檢驗的基本思想 118

5.1.3 假設檢驗在數據分析中的作用 119

5.2 假設檢驗的分析方法 119

5.2.1 假設檢驗的基本步驟 119

5.2.2 假設檢驗與區間估計的聯係 122

5.2.3 假設檢驗中的兩類錯誤 123

5.2.4 利用P 值進行決策 124

5.2.5 應用假設檢驗需要注意的問題 125

5.3 常見的檢驗統計量 126

5.3.1 z 檢驗統計量 126

5.3.2 t 檢驗統計量 128

5.3.3 ?2 檢驗統計量 129

5.3.4 F 檢驗統計量 . 129

5.4 SPSS 中常用的幾種t 檢驗實例 . 130

5.4.1 單樣本t 檢驗 . 130

5.4.2 兩獨立樣本t 檢驗 . 133

5.4.3 配對樣本t 檢驗 . 139

5.5 重要知識點迴顧 143

5.6 課後習題 143

第6 章方差分析 . 147

6.1 方差分析 148

6.1.1 方差分析的概述 148

6.1.2 方差分析的幾個概念 148

6.1.3 單因素方差分析中的基本假定 149

6.2 單因素方差分析 149

6.2.1 單因素方差分析的原理 149

6.2.2 單因素方差分析的原假設 150

6.2.3 單因素方差分析的統計量 151

6.2.4 單因素方差分析的基本步驟 152

6.3 使用SPSS 實現三國武將武力差異分析 . 152

6.3.1 檢驗不同國傢武將數據是否符閤正態分布 153

6.3.2 單因素方差分析操作步驟及必要說明 155

6.3.3 對三國武將武力單因素方差分析結果的分析 160

6.4 使用SPSS 實現三國文官智力差異分析 . 163

6.4.1 檢驗不同國傢文官數據是否符閤正態分布 163

6.4.2 單因素方差分析操作步驟及必要說明 165

6.4.3 對三國文官智力單因素方差分析結果的分析 167

6.5 數說漢室衰微與三足鼎立現象 169

6.6 重要知識點迴顧 171

6.7 課後習題 171

第7 章相關與迴歸分析 175

7.1 變量間的關係 176

7.1.1 函數關係及特點 176

7.1.2 相關關係及特點 176

7.2 相關分析 177

7.2.1 相關分析及步驟 177

7.2.2 散點圖的繪製 177

7.2.3 相關係數的計算 178

7.2.4 相關係數的顯著性檢驗 182

7.3 使用SPSS 實現相關分析 . 182

7.3.1 在SPSS 中繪製散點圖 . 182

7.3.2 在SPSS 中進行正態性檢驗 . 185

7.3.3 相關係數的計算和檢驗 187

7.4 一元綫性迴歸分析 189

7.4.1 一元迴歸模型及相關假定 190

7.4.2 一元綫性迴歸方程及求法 190

7.4.3 迴歸模型的檢驗 191

7.4.4 迴歸直綫的擬閤優度 194

7.5 使用SPSS 實現一元綫性迴歸分析 . 195

7.5.1 畫散點圖和趨勢綫 195

7.5.2 簡單相關分析 198

7.5.3 一元綫性迴歸分析的操作步驟 199

7.5.4 一元綫性迴歸分析的結果解讀 205

7.6 重要知識點迴顧 207

7.7 課後習題 208

附錄A 三國人物數據 . 213

附錄B CDA 數據分析師緻力於的數據分析人纔建設 . 226

附錄C 參考答案 . 230

內容提要


《從零進階!數據分析的統計基礎(第2 版)》共7 章,分彆講解瞭數據分析的步驟和方法、描述性統計分析、數理統計基礎、抽樣估計、假設檢驗、方差分析、相關與迴歸分析。本書使用簡單的語言介紹瞭這些數據分析基本方法的核心思想和涉及的統計學、概率論等方麵的理論內容,並使用圖示的方法詳細介紹瞭使用Excel 2013 進行簡單的描述性統計分析和使用SPSS 進行相關的數據分析的過程與結果分析。

《從零進階!數據分析的統計基礎(第2 版)》適閤需要提升自身數據分析理論和實踐能力的職場新人;在市場營銷、金融、財務、人力資源管理中需要數據分析的人士,從事谘詢、研究、分析等的**人士。也可以作為數據分析師職業培訓的教材,普通高等院校統計**數據分析的選修教材。

文摘


單純的數據加工方法

這種數據分析方法側重於數據的加工和預處理,使用的工具一般是SQL 和Excel,這是現在市場上大部分企業所使用的數據分析工具,有的公乾脆就僅使用Excel。該種方法一般是從企業的管理信息數據庫係統或數據倉庫中,對相關數據進行提取、加工、衍生處理和生成各種業務報錶。在經濟生活中,經常看到關於同比發展速度、環比發展速度、今年比去年淨增加瞭多少等新聞報道,這些統計數據計算起來比較簡單,理論難度很低。這種方法典型的代錶就是描述性統計分析和相關分析。

1.描述性統計分析

描述性統計分析是通過圖錶或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變量之間的關係進行估計和描述的方法。通俗地講,描述性統計就是當數據分析師需要分析一個數時,他僅需要用八個數就把這一個數說清楚瞭,這樣進行決策管理時纔不用再看一個數,而隻看這八個數就能解決問題。描述性數據分析的關鍵就是要看明白這八個數,能解釋清楚其背後的含義。描述性統計分析分為集中趨勢分析、離中趨勢分析和數據分布分析部分。

集中趨勢分析主要靠平均數、中數、眾數等統計指標來錶示數據的集中趨勢,例如測試班級的平均成績是多少。離中趨勢分析主要靠全距、四分位距、方差、標準差等統計指標來研究數據的離中趨勢。例如,當我們想知道兩個教學班的語文成績哪個班級的成績分布更分散時,就可以用兩個班級的方差來比較。數據分布分析是指和正態分布相比,所得數據的直方圖從形態上看是左偏的還是右偏的,從峰度上看是尖峰的還是扁平的,這些內容會在第2 章詳細介紹。

2.相關分析

相關分析是研究現象之間是否存在某種依存關係,並對具體有依存關係的現象進行相關方嚮及相關程度的研究。這種關係既括兩個數據之間的單一相關關係一一例如年齡與個人領域空間之間的關係,也括多個數據之間的多重相關關係一一例如年齡、抑鬱癥發生率和個人領域空間之間的關係;既可以是A 大B 就大(小),A 小B 就小(大)的直綫相關關係,也可以是復雜相關關係;既可以是A、B 變量同時增大的正相關關係,也可以是A 變量增大時B 變量減小的負相關關係,還括兩變量共同變化的緊密程度一一相關係數。

基於數理統計的數據分析方法

數理統計的理論基礎比較復雜,也就是概率論和高等數學中的微積分。當然這裏的微積分隻是簡單的一元函數積分,即根據概率論和微積分引齣數據的分布,從數據的分布齣發,進行數據的抽樣推斷和假設檢驗,由此引齣方差分析、迴歸分析、因子分析等基於數理統計的數據分析方法。此種分析方法一般使用SPSS Statistics、SAS EG 等分析工具就可以實現。

1.方差分析

方差分析(Analysis of Variance, ANOVA)又稱“變異數分析”、“F 檢驗”,它是R.A.Fisher 發明的分析方法,用於兩個及兩個以上樣本均數差彆的顯著性檢驗。由於受各種因素的影響,方差分析研究所得的數據呈現波動狀。造成波動的因素可分成兩類,一類是不可控的隨機因素,另一類是研究中施加的對結果形成影響的可控因素。方差分析是從觀測變量的方差入手,研究諸多控製變量中哪些變量是對觀測變量有顯著影響的變量。

2.迴歸分析

迴歸分析(Regression)是確定兩個或兩個以上變量之間相互依賴的定量關係的一種統計分析方法,它主要研究一個隨機變量Y 對另一個變量(X)或一組(X1,X2,…,Xk)變量的相依關係,迴歸分析按照涉及的自變量的數量,可分為一元迴歸分析和多元迴歸分析。按照自變量和因變量之間的關係類型,可分為綫性迴歸分析和綫性迴歸分析。此處所講的迴歸分析是指一元綫性迴歸,區彆於數據挖掘方法裏的多元綫性迴歸和邏輯斯蒂迴歸。

3.因子分析

因子分析(Factor Analysis)是指研究從變量群中提取共性因子的統計技術。因子分析就是從大量的數據中尋找內在的聯係,減輕決策睏難的分析方法。因子分析的方法有十多種,例如重心法、影像分析法、似然解法、小平方法、阿爾法抽因法、拉奧典型抽因法等。這些方法在本質上大都屬於近似方法,是以相關係數矩陣為基礎的,所不同的是相關係數矩陣對角綫上的值,采用不同的共同性估值。在社會經濟統計研究中,因子分析常以主成分分析為基礎。


作者介紹


經管之傢(www.jg.com.cn):原人大經濟論壇,於2003年成立,緻力於推動經管學科的進步,傳播教育資源,目前已經發展成為國內的經濟、管理、金融、統計類的在綫教育和谘詢網站,也是國內活躍和具影響力的經管類網絡社區。

經管之傢從2006年起在國內開展數據分析培訓,纍計培訓學員數人。在大數據的趨勢背景下,創新“CDA數據分析師”品牌,緻力於為社會各界數據分析愛好者提供**、科學、係統的數據分析教育。截至2016年3月已成功舉辦40多期係統培訓,培訓學員達3餘名;CDA認證考試已成功舉辦三屆,報考人數上人;中國數據分析師俱樂部(CDA CLUB),每周綫下**沙龍活動,已舉力40多期,纍積會員2餘名;中國數據分析師行業峰會(CDA Summit),一年兩屆,參會人數皆達2餘名,在大數據領域影響力**前。“CDA數據分析師”隊伍在業界不斷壯大,對數據分析人纔産業起到瞭巨大的推動作用。

曹正鳳,統計學博士,經管之傢(原人大經濟論壇)大數據中心總工程師,經管之傢(原人大經濟論壇)CDA大數據分析師培訓負責人,北京博宇通達科技有限公技術總監。緻力於大數據分析前沿領域研究,主持人大經濟論壇基於Hadoop架構的論壇主題推薦係統項目,參與國傢社科基金項目《基於大數據整閤的空氣質量測度方法研究》,發錶多篇論文,且發錶的EI核心收錄論文受到多次檢索。


用戶評價

評分

評分

評分

評分

評分

評分

評分

評分

評分

相關圖書

本站所有內容均為互聯網搜尋引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

© 2025 windowsfront.com All Rights Reserved. 靜流書站 版權所有