发表于2024-11-24
人人都会数据分析:从生活实例学统计 pdf epub mobi txt 电子书 下载
深入浅出的统计理论基础
63个鲜活的生活实例
帮助读者建立统计理论知识框架,形成数据分析思维逻辑,学会数据分析方法
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的zui有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。
本书系统地介绍了数据分析的统计理论基础内容,共5章。第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径;第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据;第3章介绍了推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征;第4章是关于预测分析的,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息;第5章介绍了数据结果可视化的内容,包括各种统计图形的功能及使用场景。
本书以数据分析的统计理论基础为主题,大多数知识点都列举了生活中的实用案例,适合高等院校学生、公司职员、个体商户和企业管理者学习参考。《游戏数据分析实战》的特色是以详细案例为主,通过SPSS、Excel等工具逐步展示实施步骤。通过手把手的方式让读者快速掌握游戏数据分析方法。
谢运恩
微信公众号“SPSS生活统计学”创建者,资深数据分析师,拥有多年的统计教育和数据分析咨询经验,尤其擅长数据分析技术在传统行业的落地实施。
李安富
微信公众号“SPSS生活统计学”创建者,国内知名大学统计学专业教师,资深数据分析师,擅长将枯燥无味的统计公式用诙谐幽默的方式教授给学生。
第1章
生活在数据时代
1.1 数据分析无处不在
1.1.1 常用的国家统计指标
1.1.2 制造业的数据分析应用
1.1.3 营销领域的数据分析应用
1.1.4 医疗行业的数据分析应用
1.2 人人都能成为数据分析师
1.2.1 数据分析过程
1.2.2 数据分析工具
1.2.3 数据分析师的成长之路
第2章
耳熟能详的数据你真的了解吗
2.1 数据的类型
2.1.1 数据的结构属性分类
2.1.2 数据的连续性特征分类
2.1.3 数据的测量尺度分类
2.2 数据描述的三个维度
2.3 数据的集中趋势描述
2.3.1 算术平均值
生活案例:使用算术平均值了解公司的待遇水平
2.3.2 几何平均值
生活案例:使用几何平均数识别生产线上的隐形损耗
2.3.3 众数
生活案例:使用众数制订服装企业的生产计划
2.3.4 中位数
生活案例:使用中位数识破招聘启事的工资陷阱
2.4 数据的离散程度描述
2.4.1 极差
生活案例:使用极差描述气温的变化幅度
2.4.2 平均偏差
生活案例:使用平均偏差评价生产线的稳定性
2.4.3 方差和标准差
生活案例:使用标准差(方差)提高巧克力生产线的工艺水平
2.4.4 变异系数
生活案例:使用变异系数客观评定员工绩效
2.4.5 四分位极差
2.5 数据的分布形态描述
2.5.1 概率
生活案例:概率是赌场老板制定游戏规则的法宝
2.5.2 概率分布
2.5.3 离散型概率分布:二项分布
生活案例:产品抽检的二项分布应用
2.5.4 离散型概率分布:多项分布
生活案例:预测足球比赛结果的多项分布应用
2.5.5 离散型概率分布:超几何分布
生活案例:超市抽奖活动的超几何分布概率
2.5.6 离散型概率分布:泊松分布
生活案例:使用泊松分布进行杂货店的库存管理
生活案例:使用二项分布和泊松分布分析准备的试卷数量是否足够
2.5.7 连续型概率分布:指数分布
生活案例:指数分布告诉你,为什么电子产品只保修三年
2.5.8 连续型概率分布:均匀分布
生活案例:使用均匀分布分析家具物流的送货时间
2.5.9 连续型概率分布:正态分布
生活案例:使用正态分布分析研究生毕业论文的完成时间
生活案例:使用峰度与偏度检验政府精准扶贫效果
2.5.10 正态分布作为二项分布近似
生活案例:使用正态分布和二项分布分析足球比赛的猜边概率
2.5.11 正态分布作为泊松分布近似
生活案例:使用正态分布和泊松分布分析民营电缆厂的良品率
第3章
数据分析的“内核”:推断分析
3.1 见微知著的抽样
3.1.1 抽样的意义
3.1.2 抽样方法
3.1.3 样本推断的理论基础
3.2 数据的处理
3.2.1 数据处理的不良案例
3.2.2 正确的数据存储形式
3.3 样本到总体的桥梁:抽样分布
3.3.1 抽样分布的定义
3.3.2 Z分布
3.3.3 T分布
3.3.4 切比雪夫定理
3.3.5 卡方分布
3.3.6 F分布
3.4 数据分析的第一板“斧”:参数估计
3.4.1 参数估计的类型
3.4.2 Z分布与总体均值的区间估计
生活案例:估算西部儿童看电视时间的置信区间
生活案例:估算大学生每日体育锻炼时间的置信区间
生活案例:购买保险公司产品的消费者年龄置信区间
3.4.3 T分布与总体均值的区间估计
生活案例:酱料厂罐装产品重量的置信区间
3.4.4 切比雪夫定理与总体均值的区间估计
生活案例:心脏搭桥手术后,患者住院时间的置信区间
3.4.5 卡方分布与总体方差的区间估计
生活案例:使用T分布和Z分布分析食品包装上的营养成分表
3.4.6 F分布与两个总体方差比的区间估计
生活案例:比较不同超市的电子秤精度
3.4.7 两个总体均值差的区间估计
生活案例:比较水稻新品种在不同地区的产量
生活案例:比较不同睡眠时间对记忆力的影响
生活案例:研究新药对睡眠质量的影响
生活案例:比较两家航空公司的起飞延误时间
生活案例:蒲公英的降脂作用
3.4.8 总体比率的区间估计
生活案例:移动支付的普及程度调查
3.4.9 样本容量的确定
生活案例:管理制药厂的供应商
生活案例:出口苹果的重量控制
生活案例:电视节目的收视率调查
3.5 数据分析的第二板“斧”:假设检验
3.5.1 假设检验的理论基础
3.5.2 单样本的假设检验
生活案例:使用单样本Z检验分析笔记本电池的续航能力改进效果
生活案例:使用单样本T检验分析新型麻醉剂的麻醉效果
生活案例:使用卡方检验管理饮料工厂的产品质量
3.5.3 两样本的假设检验
生活案例:机场对不同航空公司航班的起飞时间管理
生活案例:新药的临床实验
生活案例:新药的副作用研究
生活案例:自动化生产线的工艺调整
3.5.4 多样本的假设检验与方差分析
生活案例:使用单因素方差分析研究新水稻品种的性状
生活案例:使用无交互两因素方差分析研究员工的绩效管理方式
生活案例:使用有交互两因素方差分析研究员工绩效的管理方式
3.6 数据分析的第三板“斧”:非参数检验
3.6.1 非参数检验
3.6.2 卡方检验
生活案例:使用卡方检验分析讲座的到场人数是否存在异常波动
生活案例:使用卡方检验分析不同年龄人群对汽车颜色的喜好
3.6.3 Wilcoxon符号秩检验
生活案例:使用Wilcoxon符号秩检验分析职业影评人的打分差异
第4章
数据分析的终极目的:“为我所用”
4.1 “相关”是继续分析的前提
4.1.1 相关关系
4.1.2 相关分析
生活案例:使用相关分析理解“总理指数”
生活案例:使用偏相关分析研究上网时间是否真的影响学习成绩
生活案例:使用距离相关分析研究汽车的性价比
4.2 “回归”是相关分析的归宿
4.2.1 回归分析综述
4.2.2 简单线性回归分析
生活案例:简单线性回归分析用于货运总量预测国内生产总值
生活案例:货运总量预测国内生产总值的置信区间
生活案例:货运总量与国内生产总值回归模型的效果检验
4.2.3 多元线性回归分析
生活案例:使用多元线性回归分析优化快递业务员的路线
4.3 发现事物随时间变化的规律
4.3.1 时间序列分析综述
4.3.2 长期趋势分析
生活案例:使用移动平均法预测玩具公司的销售量
生活案例:使用加权移动平均法预测玩具公司的销售量
生活案例:使用指数平滑法预测玩具公司的销售量
生活案例:使用指数平滑法预测玩具公司的销售量
生活案例:使用回归方程法预测创业公司的销售额
4.3.3 季节变动趋势分析
生活案例:创业公司销售额的季节变动趋势分析
4.3.4 循环变动和不规则变动
生活案例:公司销售量的循环变动分析
4.3.5 时间序列分析应用
第5章
给数据披上靓丽“外衣”:数据可视化
5.1 数据的可视化
5.1.1 数据可视化工具
5.1.2 常用的统计图
5.2 条形图、直方图和饼图
5.2.1 条形图
5.2.2 直方图
5.2.3 饼图
5.3 线图与面积图
5.3.1 线图
5.3.2 面积图
5.4 散点图
5.5 高低图与箱线图
5.5.1 高低图
5.5.2 箱线图
5.6 时间序列图
5.7 帕累托图
5.8 P-P概率图和Q-Q概率图
5.8.1 P-P概率图
5.8.2 Q-Q概率图
人人都应该会数据分析
数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。很多人认为数据分析能力就是对数据进行描述和做出漂亮的统计图形的能力,这是狭隘的理解。数据分析能力的基础在于数据分析的逻辑思维能力,而逻辑思维能力的培养必须建立在统计理论基础之上。
统计学是数据分析的基础
在移动互联网时代,信息的获取成本越来越低,这也导致拿来主义和实用主义盛行。数据分析科学是一门需要紧密联系生活实际的科学。数据分析方法非常多,这是因为不同的数据分析环境需要选择不同的数据分析方法来处理。因此,在数据和数据分析方法之间,天然地存在鸿沟,拿来主义和实用主义经常行不通,而磨平鸿沟的方法就是学习统计理论基础。
笔者接触过很多希望学习数据分析或正在学习数据分析的朋友,发现他们身上都有一个通病,就是将学习各种分析软件作为学习重点,觉得学习数据分析就是学习分析软件操作。他们在进行具体的数据分析时,通常的做法是套用别人的数据分析逻辑和方法,如果分析结果与参考结果一致,那么没有问题,但是通常的情况是不一致的,这时他们就需要浪费大量的时间和精力查找原因。而不一致的原因通常是数据情况不符合导致的,解决的办法是根据实际的数据分析环境进行数据调整或选择其他合适的数据分析方法,而要做到这些,归根结底需要的还是扎实的统计理论基础。
学习数据分析应该以统计理论基础为主线,分析软件仅仅是各种分析方法的实现工具。因此,在开始学习时,应该辅以一到两种操作简便的分析软件,例如SPSS。这样就能够比较快速地建立统计理论框架,并掌握一款分析软件。当你的统计理论基础夯实以后,会发现学习各种分析软件都能够游刃有余,甚至像R和Python这种编程语言也能在比较短的时间内掌握。
从生活实例中开始学统计学
标准版的统计教材往往偏重于理论推导,描述语言专业严谨,这不可避免地带来了晦涩难懂的问题。本书的写作初衷就是为了解决没有任何统计基础的各行各业的数据分析学习者,他们学习和构建自己统计理论基础的需求,大部分知识点都列举了生活中的应用案例,能够帮助学习者更好地理解和掌握各个知识点的分析逻辑,并内化为自己的统计理论基础的知识框架。
除此之外,本书在章节设计上做了精心的安排,共包括5章内容。
第1章阐述了数据分析在当今生活中的重要性,以及人们成为各自领域的数据分析师的必要性和学习路径。
第2章从数据描述的三个维度展开,详细介绍了如何从集中趋势、离散程度和分布形态对数据进行描述,从而使分析者充分了解自己手头的数据。
第3章为推断性数据统计分析的内容,介绍了如何通过样本数据特性推断出总体数据特征。
第4章为预测分析内容,介绍了变量之间的相关分析,以及如何使用容易获取的数据信息预测难以获取的数据信息,用过去的历史数据信息预测未来可能出现的数据信息。
第5章是数据结果可视化的内容,包括各种统计图形的功能及使用场景。
“不积跬步,无以至千里”,夯实基础的过程总是比较乏味的,希望本书通俗的描述语言和鲜活的生活应用案例能够帮助数据分析学习者顺利建立统计理论的知识框架,形成数据分析思维逻辑,成为各自领域的佼佼者。
作 者
打算转行 入门必备啊 数据分析 每天两小时动起来 纸张还好 就是快递物流太慢了
评分挺好的,效果不错,以后还会买
评分不错不错,买的值,可以的推荐啊。
评分挺不错的,写的很好,值得推荐
评分京东物流一如既往的赞,快递师傅人超级好!
评分还可以慢慢看看吧
评分对初学者来说,不错的一本书
评分送货速度快。收到打开发现边角有些压损,无碍阅读。
评分此用户未填写评价内容
人人都会数据分析:从生活实例学统计 pdf epub mobi txt 电子书 下载