发表于2024-11-08
合并时间序列分析 pdf epub mobi txt 电子书 下载
什么是合并时间序列?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。
洛伊斯·塞耶斯(Lois W. Sayrs),爱荷华大学政治学助理教授。她从西北大学获得政治学博士学位。她现在的研究兴趣包括国际冲突过程的离散选择模型以及国际政治经济学。
温方琪,纽约大学社会学系博士研究生。她先后于中山大学和香港科技大学获得学士与硕士学位。她的主要研究领域包括社会人口学、社会分层与不平等以及量化研究方法。她尤其感兴趣的是对社会现象进行因果识别并探究其背后的机制。
本书讨论使用同时包含横截面与时间序列的数据的回归分析。一个时间序列是一组数列,就一组变量X_t与X_(t+1)而言,观测值之间的距离是恒定且固定的(Ostrom, 1978)。一个横截面则是一个分析单位在特定时间点上所存在的一组变量(X_i … X_n)的全部观测值。当变量在一定时间跨度内在一定数量的不同横截面上被反复观测到时,我们可将这样产生的数据矩阵称为一个合并时间序列(pooled time series)。
归纳合并时间序列矩阵的特征有许多种方法。标准的方法是首先归纳横截面上的特征,然后再归纳时间序列上的特征。矩阵的形式被设定,这对于一个横截面内部随时间发生的变化较不同横截面之间产生的变化而言是次要的。
将横截面与时间序列用这样的方式组合在一起的主要好处是可以捕捉到不同单位在空间上的变化以及同一单位随时间产生的变化。因此,我们可以对结果以及产生结果的过程进行描述、分析以及假设检验。当时间序列的长度被缩减且/或横截面的样本量较小时,合并数据是应用性研究中一个特别有用的方法。通常来说,单变量时间序列对于常规时间序列技术而言显得太短了。许多时间序列方法要求至少30个时间点,而其它的一些方法要求更多。
本书的主要目的是向已具备有关线性模型、回归方法和单变量时间序列估计基本知识的读者介绍合并时间序列设计。首先,我们会检验合并时间序列的回归模型,然后再检验各种不同的回归估计技术。本书会穿插对合并时间序列设计进行应用的不同例子,这些例子来自社会科学和行为科学。本书的叙述形式将结合对合并时间序列问题的理论展示与具体应用。为了方便阅读与课堂教学,所有的章节将用大写字母(A、B、C)来表明困难程度。
……
什么是合并时间序列(pooled time series)?正如字面上所表达的,时间序列(在一个分析单位下规律出现的具有时间性的观测值)由横截面数据(cross-sections)(在单独时间点上一个分析单位下的观测值)组成的一个数据集。这些分析单位可以是学校、健康组织、商业交易、城市、国家等。为什么需要进行“合并分析”呢?其中一个原因在于,当下研究者可以获得越来越多的相关横截面数据与时间序列数据。另外一个原因在于,将时间序列数据与横截面数据合并可以显著地扩大样本量,这使之前显得棘手的分析问题变为可能。
举一个简单的例子。布鲁姆(Broom)教授希望使用一个包含20个美国城市的数据来解释财产犯罪率的变化情况。她提出下面的模型:
C = α + b_1 U+ b_2 L+ b_3 R+e
其中C = 城市财产犯罪率,U=失业率,R=区域位置,所有的变量都包含15年中每一年的观测值。假设经典回归的假设都被满足,那么布鲁姆可对以上等式进行15次最小二乘(OLS)估计(每一年的横截面数据一次)。然后,她可以再运用20次OLS(每一个城市的时间序列一次)。或者,假设所有的参数(α、b_1、b_2和b_3)都在时间与空间上恒定,她便可以简单地将所有观测值合并进而仅仅只计算一个回归。这个简洁的步骤可以将样本量N增加至300,同时也可以在很大程度上提高估计的统计有效性。
这种对OLS的应用与塞耶斯(Sayrs)博士所命名的合并分析的恒定系数模型(constant coefficients model)是一致的。此处最大的困难在于恒定参数的假设难以被满足。假设较易满足的一个模型是最小二乘虚拟变量模型(least squares dummy variable model)[有时它也被称作协方差模型(covariance model)]。该模型允许截距随时间以及横截面变化。同样地,这里的虚拟变量不具备实质性意义,它们极大地减少了自由度以及与此对应的统计解释力。一个可能的替代是误差成分模型(error components model)[塞耶斯教授也将其称为随机系数模型(random coefficient model)]。这个模型明确地将横截面上的与时间序列上的误差都考虑了进去。然而,在滞后因变量(lagged dependent variable)在等式右侧或者是等式嵌套在一个更大的联立方程组(simultaneous-equation system)的情况下,不可以这里所需要的加权最小二乘类型的估计(weighted least squares type-estimation)。此外,当严重的时间序列相关存在时,误差假设往往被极大地削弱。为了超越误差成分模型的局限性,塞耶斯教授提出了一个结构方程模型(structural equation model)。她以对合并时间序列分析下的估计函数稳健性的评论总结全书。
迈克尔·S.刘易斯-贝克
合并时间序列分析 pdf epub mobi txt 电子书 下载