内容简介
《概率论与数理统计(第4版)》是普通高等教育“十一五”国家级规划教材,在2001年出版的概率论与数理统计(第三版)的基础上增订而成。本次修订新增的内容有:在数理统计中应用Excel,bootstrap方法,P值检验法,箱线图等;同时吸收了国内外优秀教材的优点对习题的类型和数量进行了渊整和充实。《概率论与数理统计(第4版)》主要内容包括概率论、数理统计、随机过程三部分,每章附有习题;同时涵盖了全国硕士研究生入学统一考试数学考试大纲的所有知识点。《概率论与数理统计(第4版)》可作为高等学校工科、理科(非数学专业)各专业的教材和研究生入学考试的参考书,也可供工程技术人员、科技工作者参考。
内页插图
目录
第四版前言
第三版前言
第二版前言
第一章 概率论的基本概念
1 随机试验
2 样本空间、随机事件
3 频率与概率
4 等可能概型(古典概型)
5 条件概率
6 独立性
小结
习题
第二章 随机变量及其分布
1 随机变量
2 离散型随机变量及其分布律
3 随机变量的分布函数
4 连续型随机变量及其概率密度
5 随机变量的函数的分布
小结
习题
第三章 多维随机变量及其分布
1 二维随机变量
2 边缘分布
3 条件分布
4 相互独立的随机变量
5 两个随机变量的函数的分布
小结
习题
第四章 随机变量的数字特征
1 数学期望
2 方差
3 协方差及相关系数
4 矩、协方差矩阵
小结
习题
第五章 大数定律及中心极限定理
1 大数定律
2 中心极限定理
小结
习题
第六章 样本及抽样分布
1 随机样本
2 直方图和箱线图
3 抽样分布
小结
附录
习题
第七章 参数估计
1 点估计
2 基于截尾样本的最大似然估计
3 估计量的评选标准
4 区间估计
5 正态总体均值与方差的区间估计
6 (0-1)分布参数的区间估计
7 单侧置信区间
小结
习题
第八章 假设检验
1 假设检验
2 正态总体均值的假设检验
3 正态总体方差的假设检验
4 置信区间与假设检验之间的关系
5 样本容量的选取
6 分布拟合检验
7 秩和检验
8 假设检验问题的p值法
小结
习题
第九章 方差分析及回归分析
1 单因素试验的方差分析
2 双因素试验的方差分析
3 一元线性回归
4 多元线性回归
小结
附录
习题
第十章 bootstrap方法
1 非参数bootstrap方法
2 参数bootstrap方法
小结
第十一章 在数理统计中应用Excel软件
1 概述
2 箱线图
3 假设检验
4 方差分析
5 一元线性回归
6 bootstrap方法、宏、VBA
本章参考文献
第十二章 随机过程及其统计描述
1 随机过程的概念
2 随机过程的统计描述
3 泊松过程及维纳过程
小结
习题
第十三章 马尔可夫链
1 马尔可夫过程及其概率分布
2 多步转移概率的确定
3 遍历性
小结
习题
第十四章 平稳随机过程
1 平稳随机过程的概念
2 各态历经性
3 相关函数的性质
4 平稳随机过程的功率谱密度
小结
习题
选做习题
参读材料随机变量样本值的产生
附表
附表1 几种常用的概率分布表
附表2 标准正态分布表
附表3 泊松分布表
附表4 t分布表
附表5 X2分布表
附表6 F分布表
附表7 均值的t检验的样本容量
附表8 均值差的t检验的样本容量
附表9 秩和临界值表
习题答案
前言/序言
本书自1979年3月初版至今,已发行近三十年。历经多年教学实践的检验,得到了国内广大院校和任课教师的认可,发行量为国内同类教材中最多的。
第四版是普通高等教育“十一五”国家级规划教材,在第三版的基础上修订编写而成。在编写之前,高等教育出版社在全国有关高校作过相当广泛的调查,本版的编写吸取了相关的意见。
教材应该力求与时俱进。本版新增加了以下内容:
(1)介绍了bootstrap方法的基本思想和方法,介绍了用bootstrap方法求参数点估计和区间估计的具体做法。bootstrap方法是近代统计中的一种用于数据处理的重要的实用方法。
(2)新增了在数理统计中应用Excel软件一章。介绍了Excel软件及其在数理统计中的应用,举例介绍了应用VBA语言编写“宏”求解具体的数理统计闸题。
(3)新增了假设检验问题的p值检验法。新增了箱线图,箱线图能大致描述随机变量分布的一些重要性质,还能检测疑似异常点。
(4)对第三版原有的例题和习题作了一些调整,增加了有关加强基本概念、基本运算的习题,在例题和习题的选择上扩大了涉及的范围,例如,农业、保险业、医学、商业、管理学、体育、等等。
选用本教材的院校类别较为广泛。专业不一,学生程度不一。我们认为,教材内容要比教学大纲多一些,要比教师在课堂讲授的多一些,这样能照顾到各类学校各个专业的需要,能满足不同程度的学生的学习需要。
我们在目录中打上了一些*号,在学时限制下,有*号的内容可以不学。这些内容是相对独立的,删去不学不影响全书的讲授。在概率论与数理统计部分中打*号的内容有:基于截尾样本的最大似然估计;置信区间与假设检验之间的关系;样本容量的选取;秩和检验。此外还有偏度、峰度检验,以及这一版新增的部分或全部内容。随机过程部分视教学计划中有无这一门课决定取舍。
本次修订也包括配套辅导书,它们将与教材同时出版。
本书中新增的有关在数理统计中应用Excel软件的内容由浙江大学于渤教授编写。本书由浙江大学范大茵教授审阅,对此我们表示衷心的感谢。
高等教育出版社蒋青、李蕊、兰莹莹同志为本版教材做了很多认真、细致的工作,对此,我们表示诚挚的感谢。
诚恳地希望读者批评、指正。
盛骤 谢式千 潘承毅
2008年4月
探索现代金融与工程的基石:数据驱动决策的理论与实践 图书名称:数据驱动决策的理论与实践 内容简介 本书旨在为读者提供一个全面、深入的理论框架和实用的技术工具,以应对当代复杂系统中的不确定性挑战。它聚焦于如何利用严谨的数学工具和先进的统计方法,从海量数据中提取洞察、量化风险,并最终支持高效、可靠的决策制定过程。全书内容结构紧凑,逻辑清晰,不仅覆盖了理论基础,更强调了方法论在实际应用中的有效性。 本书的读者群体广泛,包括但不限于工程技术人员、经济金融分析师、数据科学家、计算机科学专业学生以及任何需要依赖数据进行定量分析和预测的专业人士。我们假设读者具备一定的微积分和线性代数基础,但对高深概率论的先验知识要求不高,所有必要的数学工具将在必要时进行回顾或引入。 全书共分为六大部分,共计二十章,层层递进,构建起一个完整的知识体系: 第一部分:不确定性量化与随机过程基础(第1-4章) 本部分是全书的理论基石,重点在于建立对随机现象的精确数学描述能力。 第1章:随机变量的拓扑与测度基础 本章从集合论与测度论的视角重访概率空间的概念。我们探讨了$sigma$-代数、测度、概率测度及其基本性质,为后续的积分和期望的严格定义打下基础。着重介绍实轴上的Borel $sigma$-代数及其重要性。 第2章:随机变量的分类与函数 详细讨论了离散型、连续型和混合型随机变量的定义、分布函数与密度函数。深入分析了随机变量的函数的分布,特别是如何利用雅可比变换等技术处理复杂函数的分布问题。引入了特征函数和矩生成函数作为分析分布特性的有力工具。 第3章:多维随机向量的分析 本章扩展到多维空间。详细阐述联合分布、边际分布和条件分布的计算方法。重点分析了随机向量的协方差矩阵及其在度量随机变量间线性依赖关系中的作用。引入了正态分布族在二维及高维空间中的特性,包括其特征函数和独立性判据。 第4章:随机过程的初步概念 本部分引入时间维度上的随机性——随机过程。首先定义了随机过程的基本要素,如指标集和状态空间。重点介绍了马尔可夫链(Markov Chains)的基础结构,包括一步转移概率矩阵和状态空间分类(常返性、吸收性)。为后续更复杂的动态系统分析做好铺垫。 第二部分:大数定律、中心极限定理与收敛性(第5-7章) 本部分关注随机变量序列的渐进行为,这是统计推断和模型收敛性的核心理论支撑。 第5章:随机变量序列的收敛性 系统地比较和区分了依概率收敛、依分布收敛、几乎必然收敛和平方平均收敛这四种主要的收敛概念。通过具体的例子展示了它们之间的逻辑关系和相互推导。 第6章:大数定律的深化 详细探讨了切比雪夫不等式在收敛证明中的应用。重点阐述了独立同分布随机变量序列的弱大数定律(WLLN)和强大数定律(SLLN)的证明思想与适用条件。讨论了依概率收敛与依分布收敛的关系。 第7章:中心极限定理及其变体 中心极限定理(CLT)是统计学的心脏。本章不仅证明了标准形式的CLT,还拓展至更一般的、非独立同分布(NID)情形下的林德伯格-费勒中心极限定理。探讨了极限定理在金融资产收益率建模中的初步应用。 第三部分:统计推断的理论基础(第8-12章) 本部分从数据中学习和推理的核心方法论。 第8章:统计推断的基本框架 定义了充分统计量、完备性、无偏性、有效性等核心统计性质。引入费舍尔信息量和克拉美-劳下界(Cramér-Rao Lower Bound),用以评估估计量的精度极限。 第9章:参数估计方法 详细讲解了矩估计法(Method of Moments, MoM)和最大似然估计法(Maximum Likelihood Estimation, MLE)的构造步骤和性质。特别分析了MLE在大样本下的渐近正态性和一致性。同时引入了贝叶斯估计的基本思想和计算方法。 第10章:假设检验的理论基础 阐述了零假设、备择假设、第一类错误($alpha$)和第二类错误($eta$)的概念。深入解析了Neyman-Pearson引理,用于构造最优(UMP)检验。引入了似然比检验(Likelihood Ratio Tests)作为通用检验方法。 第11章:常用分布的参数估计与检验 针对泊松分布、指数分布、二项分布和正态分布等常用模型,具体推导了MLE和MoM估计量,并进行了假设检验的实际案例分析,如双样本均值比较的Z检验和T检验。 第12章:回归分析导论 本章引入了线性模型的基础。重点讨论简单线性回归模型,推导普通最小二乘法(OLS)估计量的性质,包括其无偏性和有效性(基于Gauss-Markov定理)。讨论了残差分析和模型诊断的基本步骤。 第四部分:进阶随机过程与时间序列分析(第13-16章) 本部分将概率论的应用拓展到动态系统和时间序列数据处理。 第13章:连续时间马尔可夫链与泊松过程 研究连续时间下的随机演化。定义了无穷小生成元和科尔莫戈洛夫前向/后向方程。全面分析了泊松过程,包括其增量独立、平稳性和内存无关性,并探讨了复合泊松过程。 第14章:鞅与最优停止问题 鞅论是现代金融数学和优化理论的强大工具。本章严格定义了上鞅、下鞅和鞅。讨论了Doob不等式和鞅收敛定理。引入最优停止时间的概念,并展示如何利用鞅的性质解决随机资源分配和交易策略问题。 第15章:平稳过程与时间序列模型 将随机过程的概念应用于时间序列分析。定义了广义平稳性(WSS)和严格平稳性。重点分析了自回归(AR)、移动平均(MA)和自回归移动平均(ARMA)模型的结构、平稳性和可逆性条件。 第16章:谱密度与谱分析 从频域角度分析平稳过程。定义了随机过程的自协方差函数的傅里叶变换,即谱密度函数。讲解如何利用谱分析来识别时间序列中的周期性成分和长期依赖性。 第五部分:高维数据与非参数方法(第17-18章) 面对维度灾难和模型假设的局限性,本部分介绍更灵活的统计工具。 第17章:多元统计分析基础 本章扩展到多元回归和多元方差分析(MANOVA)的初步概念。重点讨论了多元正态分布的特征,包括其协方差矩阵的结构和性质。介绍了主成分分析(PCA)的统计学解释,即基于特征值分解的降维技术。 第18章:非参数估计与检验 讨论在不预设具体分布形态下的统计推断。介绍了核密度估计(KDE)的方法及其选择带宽(bandwidth)的准则。讨论了非参数检验,如秩检验(如Wilcoxon秩和检验)的基本原理。 第六部分:应用案例与计算实现(第19-20章) 第19章:模拟方法与蒙特卡洛技术 由于许多复杂模型的解析解难以获得,本章侧重于计算方法。详细介绍了伪随机数的生成、均匀性和指数分布的采样技术。重点讲解了拒绝采样(Acceptance-Rejection Sampling)和马尔可夫链蒙特卡洛(MCMC)方法,特别是Metropolis-Hastings算法的构造与收敛诊断。 第20章:现代统计计算工具箱 本章指导读者如何将所学理论转化为实际的计算能力。通过案例演示如何使用主流的统计编程语言(如R或Python的SciPy/Statsmodels库)实现最大似然估计、卡方检验、以及简单的模拟过程。强调计算验证和结果的可视化。 全书特色: 1. 理论的严谨性与应用的平衡: 每一核心定理的阐述都伴随着清晰的证明思路或直观的几何解释,同时辅以丰富的、源自实际工程和量化分析的例子。 2. 强调工具的使用: 不仅教授“是什么”,更强调“如何做”,使读者能够熟练运用现代统计软件解决复杂问题。 3. 动态系统的深入探讨: 引入了鞅论和时间序列分析,使得本书超越了传统概率论教材的静态视角,更贴近金融、通信和可靠性工程中的动态建模需求。