内容简介
《北京大学光华管理学院教材:应用商务统计分析》是以实际案例驱动的应用统计学教材,包括线性回归、方差分析、协方差分析、0-1变量回归、定序回归、泊松回归、生存模型和自回归等内容。本书同其他统计学教材的主要区别是强调统计方法在实际案例中的应用,而且所选案例更加真实、复杂。具体而言,本书每章选用一个案例,并为每个案例提供完整的分析报告和R程序,以方便读者了解数据分析的整个过程。案例的范围涉及上市公司盈利预测、房地产价格分析、企事业单位绩效评估、上市公司ST预测、消费者市场调研、客户关系管理、医学临床实验和宏观经济学。因此,读者在学习统计学知识的同时,还可以分享作者在以上各个领域实际应用的经验与心得。
作者简介
王汉生,美国威斯康星大学统计学博士毕业,现为北京大学光华管理学院商务统计与经济计量系副教授。研究领域包括模型选择、回归收缩与选择、不完全数据插值、稳健统计方法。同时,王教授还是国际统计协会、英国皇家统计协会、美国统计协会、美国数理统计协会、泛华国际统计协会会员,在Journal of theAmerican Statistical Assciation、Journal of the Royal Statistical Society:Series B、Journal of Buaiaess & Eeoaonucs Statistics、Statistics in Medicine、《经济研究》、《营销科学学报》、《数理统计与管理》、《审计研究》等期刊上发表论文30余篇。
内页插图
目录
第一章 线性回归
第一节 案例介绍
第二节 模型定义
第三节 描述性分析
第四节 参数估计
第五节 假设检验
第六节 模型诊断
第七节 变量选择
第八节 模型预测
第九节 简单分析报告
附录 程序及注释
第二章 方差分析
第一节 案例介绍
第二节 描述性分析
第三节 单因素方差分析
第四节 多重比较
第五节 双因素简单可加模型
第六节 双因素交互作用模型
第七节 多因素方差分析
第八节 简单分析报告
附录 程序及注释
第三章 协方差分析
第一节 案例介绍
第二节 描述性分析
第三节 单因素可加模型
第四节 单因素交互作用模型
第五节 多因素协方差分析
第六节 模型选择与预测
第七节 更科学的绩效评估
第八节 简单分析报告
附录 程序及注释
第四章 0—1变量的回归模型
第一节 案例介绍
第二节 基本描述
第三节 单变量逻辑回归
第四节 参数估计与统计推断
第五节 多变量逻辑回归
第六节 模型选择
第七节 预测与评估
第八节 简单分析报告
附录 程序及注释
第五章 定序回归
第六章 泊松回归
第七章 生存分析模型
第八章 自回归
参考文献
精彩书摘
〔教学目的〕
本章60主要教学目的是通过一个盈利预测的实际案例,详细介绍线性回归这种最重要的统计回归模型。它主要处理的是因变量和解释性变量都是连续型数据的情形。通过对本章60学习,我们希望读者能够了解:(1)什么情况下使用普通线性模型;(2)线性模型60基本统计学理论;(3)相关理论在统计学软件R中的应用;(4)相应的统计分析报告的撰写。本章初次涉及的重要统计学概念如下:因变量、解释性变量、普通线性模型、最小二乘估计、F检验、t检验、模型诊断、异常值、Cook距离、模型选择(AIC、BIC),还有外样本的预测检验等。第一节案例介绍
线性回归模型是实际工作中用得最多、最广的统计模型。它不仅为我们提供了一套系统而有效的分析预测方法,而且为我们提供了一套完整的方法论。对线性模型的理解与掌握将极大地有助于以后章节的学习。具体地说,本章将以一个实际应用为例,详细讲解并演示线性模型的各个方面。
我们考虑的具体问题是:如何利用上市公司当年的公开财务指标对其来年的盈利状况予以预测。合理回答该问题对于指导投资者了解企业的盈利模式、风险大小,以及正确投资帮助甚大。类似的问题早已在北美和欧洲的金融市场上被广泛研究,而本章将对中国股市的类似数据予以简略分析。具体地说,我们的目标是如何有效利用上市公司的历史财务数据,对其来年的净资产收益率(return。Ilcqllity,ROE)予以大概的估计。我们考虑的财务指标有:公司当年的净资产收益率(ROEt)、资产周转率(ATO)、债务资本比率(LEV)、市倍率(PB)、应收账款/主营业务收入(ARR)、主营业务利润/主营业务收入(PM)、主营业务收入增长率(GROWTH)、存货/资产总计(INV)以及对数变换后的资产总计(ASSET),以后简称为资产总计。
对于这些财务指标的经济意义的详细解释可以在任何一本会计教科书中找到。我们只对以上财务指标的经济意义简述如下。首先,当年表现好的公司,由于惯性效应,其下年度的表现也趋向于较好。所以,很自然地,我们应该考虑公司当年的净资产收益率(ROEt)。其次,债务资本比率(LEV)反映了公司的基本债务状况,市倍率(PB)与主营业务收入增长率(GROWTH)分别反映了公司预期的未来成长率以及公司已经实现了的当年增长率,应收账款/主营业务收入(ARR)以及主营业务利润率(PM)分别反映了公司的收入质量以及利润状况。最后,存货周转率(INV)用来度量公司的存货状况,而资产总计(ASSET)被用来控制公司规模的影响。以上所考虑的变量都是过去欧美国家同类研究中发现的、非常典型的能够影响公司盈利能力的指标。因此,检验这些指标在我国股票市场上的有效性就变得非常有意义。为方便演示,我们随机抽取了深市和沪市2002、2003年度的各500个样本。其中,分析主要是基于2002年的样本,而2003年的数据主要用来检验模型的预测精度。值得注意的是,考虑到数据的商业性与保密性,以及教学演示的方便,本案例的数据是随机模拟生成的。第二节模型定义
根据前一节中的讨论可以看到,我们有一个清晰的目的,那就是利用所给的财务数据(accountingvariables)预测下一年度的净资产收益率(ROE)。还可以看到,我们所考虑的这些指标所扮演的角色是不一样的。其中,下年度的净资产收益率(ROE)是可预测的指标。之所以它可预测,是因为它的大小在一定程度上是由其他几个财务指标所决定的。因此,我们称其为因变量(depend tvariable)。也就是说,下一年度的净资产收益率会因为其他几个财务指标的改变而改变,或者说下一年度的净资产收益率在一定程度上是可以被其他的财务指标所解释的。一旦我们明白了这一点,就不难理解为什么人们会称其他几个财务指标(如ROEt、LEV、ATO等)为自变量(independentvariable)或者解释性变量(predictor,predictivevariable),亦称协变量(covariate)。
而回归分析的根本目的就是要探寻因变量(下年度的净资产收益率)同自变量(其他财务指标)之间的数量关系。为了达到此目的,我们不可避免地需要假设y。和。.之间的数量关系满足某种函数形式,而最简单也是最常用的函数形式就是线性函数。这对应了下面这个含有P个自变量的一般线性模型:其中为常数项为第了个解释性变量“U的回归系数,它意味着,若,变化一单位,我们可以预期因变量Y。会变化多少个单位。例如,在我们的案例中,如果:真;代表了公司当年的净资产收益率,那么卢.意味着该公司当年净资产收益率若增加一单位,则来年净资产收益率变化的期望值(平均值)为卢,个单位。
当然,这样的预测是不可能完全准确的。这是因为除了我们所考虑的财务指标以外,还有太多其他的因素(如经济周期、公司高管变化)也可能对公司卜一年度的盈利产生影响。而且这样的影响是无法用我们所考虑的财务指标来反映的,也是不能预测的。这种影响就构成了我们的残差项残差项对因变量丫,影响力的大小,直接反映了自变量x.对因变量的预测能力。比方说,如果(5,,对公司下一年度的影响力很大,那么我们就会发现,很难利用现有的财务数据准确预测公司下年度的盈利。否则,我们就会获得一个有效的预测模型。那么,统计上应该怎样度量残差项影响的大小呢?我们将在后面的章节中详细讨论。最后值得一提的是,对于此普通线性模型,技术上我们一般作如下假定。
独立性:这包含两个方面。一方面,不同的观测之间是互相独立的;另一方面,残差项同解释性变量之间是互相独立的。在我们的案例中,这首先意味着不同公司之间是互相独立的,A公司盈利的好坏不会影响到B公司。由此可见,此假设在一定程度上是合理的,符合常识的。但是,我们为什么要说是“一定程度上’’呢?这是因为此假设在一定程度上也是不合理的。例如,如果我们的数据跨越多个年份,那么来自同一年份的数据,受当年整个宏观经济的影响,将会表现出一定程度上的相似性。进一步讲,如果我们的数据中有的公司之间是有关联的(如母公司与子公司、主要竞争对手),那么一个公司的盈利状况必然影响另外一个公司。再进一步讲,如果我们的数据中有多个观测来自于!司一个公司,那么这些数据之间是高度相关的。那么,这是否意味着线性模型将无法应用?也不是的。在现实生活中,几乎没有任何一个数据能够完美地满足所有的理论假设,因此我们需要一个主观的、经验的判断一一这个数据是否极大程度地满足了我们的理论要求,它与理论要求的偏差是否并不会显著地影响我们的结论?如果答案是肯定的,那么我们还是可以继续利用线性模型获得信息。
……
前言/序言
在过去的20年中,中国的商学院教育(本科生、普通硕士、MBA、EMBA以及管理学博士)经历了巨大的变化与发展。伴随其中的是统计学在各个项目中广泛深入的应用。一方面,统计学在商学院教学科研工作中的重要作用得到了一致的认可。大量的经济学、金融学以及营销学模型需要通过统计学的方法子以实现;大量的心理学、社会学以及行为学的实验需要运用统计学的分析方法进行研究。但另一方面,商学院的统计学教育却面临着前所未有的挑战。传统的以数学推导为主的教学方式给人们留下了统计学非常有用,但是又非常晦涩难懂的印象。因此,我们必须对传统的统计学教学方法进行合理的改进,否则无法满足商学院的教学及科研需要。笔者认为,商务统计学的教学绩效,从小处看影响学生的学习效果,从大处看则关系着统计学在商学院教育中的地位以及未来发展。
统计学在商学院的教学中会遇到哪些挑战呢?第一,学生背景复杂。传统的统计系面对的是大量具有非常良好数理背景的理科学生。因此,大量复杂的数学推导不成问题。而如今的商学院面对的学生背景极其复杂。虽然其中不乏有数理功底很强的学生,但是更多的还是其他非数理背景的学生,特别是MBA学员。而要让并不具备数理背景的同学也欣赏统计学并不是一件容易的事情。第二,教学目的不同。传统的统计系往往希望能够培养出优秀的统计学专业人才。这里的专业人才指的是不仅可以分析典型数据,而且还具备一定的方法创新能力的人才。但是,商学院对统计学的教学要求是不同的,商学院要培养的是具备良好的经济管理知识和出色的数据分析能力的经济管理人才。对于这类人才,能否创造出新的统计学方法并不是核心要求。而其核心要求是能够通过标准的统计学模型以及软件解决实际的经济管理问题。
上述商学院对统计教学的特殊要求决定了商务统计教学要有自己的特点。具体地说.就是要淡化数学公式的推导,着重讲授统计学思想,并强化其在实际案例中的应用。而要实现该目标,一个重要的前提就是要有一本合适的商务统计学教材。但是,目前市场上却缺乏一种符合以上所有教学特点和需要的教材。目前市场上的教材大致可以分为两类:第一类是传统的数理统计学教材。此类教材以数学推导为主,主要满足具有较强数理统计背景的学生的需要。第二类是影印或者翻译的国外MBA统计学教材。此类教材可以作为相关专业的统计学入门教材,但是它们对标准的回归模型涉足甚浅,因而不能满足更高层次的学习及研究需要。笔者以自己在北京大学光华管理学院多年的商务统计学的教学经验为基础,并结合商学院的统计学教学特点及需要编写了这本教材。本教材有以下几个特色:第一,全部以实际案例背景驱动;第二,没有任何复杂的数学推导;第三,每个案例还配备了完整的分析报告;第四,附有详细的只程序以及注释。出于对商业版权的考虑,本教材所采用的全部数据都是随机模拟生成的,但是案例背景是真实可靠的。还特别值得一提的是,本教材所使用的及软件是公开、免费的统计分析软件,可以在网上轻松获得。本书融合了以上这些特色,目的是希望能够使读者学习得更加轻松、有趣。
本教材从开始编写到最终定稿历时近两年,其间得到了我的多位教学助理的大力支持,其中要特别感谢罗荣华和赵羿两位同学。是罗荣华同学的帮助,本书才有了完整的分析报告,以及带有注释的及程序;是赵羿同学的仔细校对及润色。才使得本书的文字大有改进。笔者还要感谢北京大学光华管理学院的涂平老师,他为本书提出了许多建设性的建议。笔者还要感谢北京大学出版社的朱启兵老师还有张静波老师,没有他们的帮助,本书不可能得以如此迅速地出版。由于笔者的能力有限,书中难免有疏漏之处,请多指正。最后,我想将此书献给我的太太还有刚刚来到世间的儿子,希望他们永远幸福健康!
王汉生
北京大学光华管理学院
2008年1月1日
北京大学光华管理学院教材:应用商务统计分析 电子书 下载 mobi epub pdf txt