内容简介
《回归模型/中国人民大学统计与精算系列教材》主要介绍了在实际数据分析中最常使用的线性回归模型和广义线性回归模型,以及它们的推广模型,如零膨胀回归模型和多分类因变量的回归模型等。本书不仅介绍了回归模型的基本原理,而且结合R软件和实际数据,详细介绍了具体的建模过程,讨论了各类回归模型的特点和性质,内容新颖,操作性强,适合统计学、经济学、金融学、保险学、精算学等相关专业的学生使用。
作者简介
孟生旺,中国人民大学统计学院副院长、教授、博士生导师,中国人民大学应用统计科学研究中心研究员,主要研究领域包括应用统计、风险管理与非寿险精算。已经出版的著作有《金融数学》、《非寿险精算学》、《回归模型》、《非寿险定价》、《汽车保险的精算统计模型》和《保险定价:经验估费系统研究》等。
目录
第1章 线性回归模型
1.1 模型结构和假设
1.2 解释变量
1.3 参数估计
1.4 异方差与加权最小二乘估计
1.5 假设检验
1.6 模型诊断和改进
1.7 模型的评价与比较
1.8 应用示例
练习题
第2章 广义线性模型
2.1 模型结构
2.2 参数估计
2.3 模型比较与诊断
练习题
第3章 连续型因变量
3.1 正态回归模型
3.2 伽马回归模型
3.3 逆高斯回归模型
3.4 基于R的应用
3.5 模型推广
练习题
第4章 计数型因变量
4.1 泊松回归模型
4.2 负二项回归模型
4.3 模型扩展
练习题
第5章 二分类因变量
5.1 贝努利分布假设下的Logistic回归
5.2 二项分布假设下的Logistic回归
5.3 比例型数据的logistic回归
5.4 Logistic回归系数的解释
5.5 logistic回归模型的拟合优度
5.6 其他连接函数
5.7 过离散问题
练习题
第6章 多分类因变量
6.1 多项logistic回归模型
6.2 定序logistic 回归模型
练习题
第7章 Tweedie回归
7.1 Tweedie分布
7.2 Tweedie回归
7.3 Tweedie回归模型的推广
7.4 零调整逆高斯回归
练习题
第8章 贝叶斯回归模型
8.1 基本概念
8.2 先验分布的选取
8.3 MCMC方法
8.4 贝叶斯广义线性模型
8.5 应用Rstan估计贝叶斯模型
练习题
第9章 应用案例
9.1 数据介绍
9.2 探索性数据分析
9.3 索赔发生概率的回归模型
9.4 索赔频率模型
9.5 索赔强度模型
9.6 对索赔强度进行对数变换之后建模
9.7 纯保费模型
练习题
参考文献
精彩书摘
回归模型是应用最为广泛的数据分析方法之一,它的核心思想是建立若干个解释变量与一个因变量的函数关系,并通过这个函数关系对因变量的变化规律进行解释和预测。
回归模型包括线性回归模型、广义线性模型、广义可加模型、线性混合模型、广义线性混合模型以及它们的各种扩展模型。本书以线性回归模型和广义线性模型为主,介绍回归模型的基本原理和应用技巧。
线性回归模型主要建立在因变量服从正态分布等一系列重要假设之上,所以不能完全满足解决某些特定问题的实际需求。譬如,损失次数是非负的整数,损失金额是大于零的实数,都不符合线性回归模型关于因变量服从正态分布假设的前提条件。在广义线性模型中,因变量可以服从指数分布族中的任意分布,如正态分布、二项分布、泊松分布、伽马分布、逆高斯分布和Tweedie分布等。这些分布非常适合描述保险损失数据,如损失次数可以用二项分布、泊松分布或负二项分布进行描述,损失金额可以用伽马分布或逆高斯分布进行描述。事实上,几乎所有分布假设下的广义线性模型都可以在保险损失数据的分析中找到用武之地,也很难找到另一个数据分析需要用到所有的广义线性模型的实际领域。有鉴于此,本书主要使用汽车保险的损失数据来说明广义线性模型的建模原理,但读者可以毫无困难地将其应用到其他领域的数据分析中。
由于实际数据结构的复杂性,广义线性模型还在不断发展。譬如,在广义线性模型的线性预测项中引入平滑函数,就可以建立广义可加模型;在线性预测项中增加随机效应,就得到了广义线性混合效应模型;如果不仅对分布的均值参数建立回归模型,同时对其他参数建立回归模型,就可以将广义线性模型推广到关于位置参数、尺度参数和形状参数的广义可加模型(GAMLSS)。
本书将以线性回归模型和广义线性模型为主,介绍回归模型的基本原理和建模技术。书中虽然有一定的理论介绍,但更加侧重于回归模型的实际应用。第1章介绍线性回归模型的基本原理,并通过模拟数据介绍线性回归模型的建模技术。第2章介绍广义线性模型的统计理论,为后面各章的实际应用奠定基础。第3~7章根据因变量的不同类型,分别介绍基于二分类因变量、计数型因变量、连续型因变量和混合型因变量建立回归模型的基本方法,包括参数估计、统计推断、残差分析和模型检验等内容。此外,作为对广义线性模型的进一步拓展,还介绍了基于多分类因变量的回归模型、有限混合回归模型、零膨胀回归模型、零调整逆高斯回归模型和广义可加模型。第8章简要介绍贝叶斯视角下回归模型的参数估计方法。第9章应用我国一家财产保险公司的车损险数据,讨论如何建立索赔发生概率、索赔频率、索赔强度和纯保费的回归模型。
本书在建模过程中使用了两种类型的数据,一类是模拟数据;另一类是实际数据。基于模拟数据的建模过程可以清晰地展示数据的生成机理和回归模型的误差,而基于实际数据的建模过程可以揭示回归模型在应用中可能遇到的问题和解决方法。
常用的统计软件都包含建立回归模型的模块,如R,SAS和STATA等。本书主要使用了R软件中的lm函数,glm函数和glm�眓b函数,以及gamlss,tweedie,cplm,car,rstan,penalized,data�眛able,ggplot2,knitr等程序包。在此谨向这些程序包的开发者表示感谢。
……
前言/序言
回归模型/中国人民大学统计与精算系列教材 电子书 下载 mobi epub pdf txt