为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

中国股市有规律吗

2012-02-06 20页 pdf 641KB 13阅读

用户头像

is_795622

暂无简介

举报
中国股市有规律吗 中国股市有规律吗? ——上证综指马尔可夫转换-ARCH模型的实证研究① 朱钧钧 谢识予 (复旦大学经济学院,上海 200433) 摘 要:到目前为止,大部分对于中国股市的金融计量研究集中于 GARCH 模型族的极大似然法估计, 本文引入结构突变,首次在中文文献中对上证综指马尔可夫转换-ARCH 模型通过马尔可夫蒙特卡罗方法 (MCMC 方法)进行估计。我们在 30000 次参数模拟之后,得到稳健的、可靠的结果,似然比检验显示本 文模型好于几乎所有 GARCH 族模型。本研究发现,在同其他股市比较时,上...
中国股市有规律吗
中国股市有规律吗? ——上证综指马尔可夫转换-ARCH模型的实证研究① 朱钧钧 谢识予 (复旦大学经济学院,上海 200433) 摘 要:到目前为止,大部分对于中国股市的金融计量研究集中于 GARCH 模型族的极大似然法估计, 本文引入结构突变,首次在中文文献中对上证综指马尔可夫转换-ARCH 模型通过马尔可夫蒙特卡罗方法 (MCMC 方法)进行估计。我们在 30000 次参数模拟之后,得到稳健的、可靠的结果,似然比检验显示本 文模型好于几乎所有 GARCH 族模型。本研究发现,在同其他股市比较时,上海股市各波动状态的持续时 间短,波动幅度大;并且不像其他股市,上海股市的波动不能反应国内外的政治经济状况,而是投机猖獗 程度的写照。一个更重要的规律是,中国股市的中等波动状态同牛市息息相关,而高波动状态往往发生在 熊市和调整市。这些结论提供了一个认识上海股市波动性的全新视角,还揭示了一种基于波动状态识别的 实用数量投资方法,最后我们提出了完善上海股市的一个建议。 关键词:马尔可夫转换模型;马尔可夫蒙特卡罗模拟;波动率;模拟 JEL: C11, N25 中图分类号:F830.91 引 言 新兴市场经常面对有效性的讨论。对于中国股市,陈灯塔和洪永淼(2003)详细探讨并检 验了中国股市的有效性问题,认为沪市和深市都未达到弱式有效。基于这个检验结果,他们 提出“对有效市场假说的偏离…意味着有可能找到合适的交易策略来持久的战胜市场”。 过去六年,中国股市并没有显著的改善。虽然 2005 年股改之后,市场活跃起来,但是 我们有理由认为股改并没有显著提高市场有效性,因而我们认为陈灯塔和洪永淼(2003)的检 验结论对现在的股市同样有效,即中国股市未达到弱式有效。 那么,未达到弱式有效的中国股市有什么规律吗?如果有,这种规律能用于构建数量投 资策略并永久的战胜市场吗? 本文研究上证综指的相关规律,试图解答以上两个关键问题。建模的出发点是中国股市 的结构突变。洪永淼(2007)指出经济关系经常具有结构性变化,而这种变化将导致样本外预 测难以得到准确的估计。在股市中,政府政策和股改等结构性变化因素,都将引发投资者投 资策略的改变,从而造成股市规律的变动。股市结构突变时,即使能很好的解释过去的股指 走势,也难以对未来做出准确的预测。 本文引入结构突变,在“状态转换模型”的框架内研究中国股市。基于中国股市中牛市 熊市交替明显的特性,选择状态转换模型便有非常直观的理由。本文的模型 - 马尔可夫转 换-ARCH 模型,假设状态之间的转换服从马尔可夫链性质。在每一个状态,模型又服从 ARCH 过程。这样该模型结合了状态转换和波动聚类的性质,有可能较好的解释股市中牛熊 市交替和波动率的规律。 另外,模型初始并不设定每个状态的特性,只有在参数估计完成后,才能从参数的数值 作者简介: 朱钧钧,复旦大学经济学院,数量经济学博士生;邮箱:stanleyjunjun@hotmail.com;手机: 13564658946。地址:上海市嘉定区安亭新镇安智路 100 弄 88 号 302 室,邮编 201805。 *作者衷心感谢 2009 年 12 月“复旦大学博士生学术论坛经济分论坛”上陈诗一和戚顺荣老师的的评论 和建议。 1 和显著性上推断每个状态的性质,并且结合现实做出实证。这样,如果状态转换模型对 于中国股市能得到较好的估计,该模型应该可以捕捉到中国股市的鲜明特性。 一、文献回顾 股市的金融计量模型是从研究股市波动率开始的,Engle (1982)提出 ARCH 模型,对波 动率聚类的进行了建模,这个结果迅速后被用于金融时间序列的分析,并提出一系列的模型, 形成 GARCH 模型族,其中比较著名的是 GARCH 模型(Bollerslev, 1986)、EGARCH 模型 (Nelson 1991)和 GJR 模型(Glosten, Jaganathan and Runkle, 1993)。 但是GARCH模型族面临的一个质疑是它没有考虑金融时间序列因为结构突变所形成的 不同状态,如经济扩张期和衰退期利率的波动是不一样的(Dielbold, 1986)。如果不考虑结构 突变以及状态的转换,则GARCH模型族所估计的持久性参数 ① 能偏大。比如美国股市 周收益率所估计的GARCH模型中, 可  超过 0.90(French等, 1987; Chou, 1988; Baillie and DeGennaro, 1990),其他市场如英国也发现相似的结果(Taylor, 1992; Lee and Ohk, 1991)。而 超过 0.90,意味着波动冲击要在 13 周之后才会消失一半(Fong, 1997)。Lamoureux and Lastrapes (1990)对收益率数据加入结构突变,进行模拟试验后得出,结构突变能显著降低 GARCH模型的持久性参数。因而,我们不能排除波动的聚类还来源于结构突变。 之后,Smith (2002)在美国股市和汇市的收益率上发现非常明显的结构突变的痕迹。 Maekawa 等(2005)指出东京股票市场的波动持久性很大程度上是因为结构突变所造成的。因 此,刻画不同波动状态之间的结构突变成为 GARCH 模型族估计中的一个重要研究课题。 引入状态转换的结构突变模型,是继 GARCH 模型族之后金融时间序列建模的重要进 展。按照这种构想所组成的状态转换 GARCH 模型族,将在不同的状态下现出不同的 GARCH 过程,而状态之间的转换可由某个变量在一定的水平上引起,比如门限 GARCH 模 型;或者某个时间点引起,比如变点模型;或者状态之间的转换遵循马尔可夫转换概率,如 马尔可夫转换模型。 马尔可夫转换模型(Markov Switching Model)由Hamilton (1989)提出,在对美国经济周期 的研究中,模型所估计得出的经济周期同美国NBEC②公布的经济周期几乎完全重合,取得 很好的实证结果。之后,该模型在利率的研究(Rene and Perron, 1996; Andrew and Bekart, 2002),和汇率的研究(Bollen, Gray and Whaley, 2000; Dueker and Neely, 2001)中都得到很好的 应用,并且在大部分研究中都得到比GARCH模型族更好的估计结果。 在股市的建模中,Hamilton 和 Susmel (1994),以及 Cai (1994)最先将马尔可夫转换模型 运用于股市波动性的分析中,他们通过马尔可夫转换-ARCH 模型(Markov Switching ARCH Model,简称 MS-ARCH Model)发现股市波动的持久性更多的来源于状态的持久性,不同的 波动状态往往持续几年之久。在不考虑状态转换的前提下,GARCH 模型的持久性参数往往 具有迷惑作用。注意到股市波动率高的状态往往是经济比较低迷时,Hamilton 和 Lin (1996) 又结合经济周期,用双变量马尔可夫转换模型进一步估计股市波动性,得出经济萧条是股市 高波动率的最重要的影响因素。之后,Fong (1997)将此模型用于分析日本股市的波动性, Li 和 Lin (2003)分析了台湾股市的波动性。 上述马尔可夫转换模型都是用极大似然法估计的,但是极大似然法有很大的局限,比如 它不能确信是否找到了最高似然值,以及估计不了 MS-GARCH 模型。MS-GARCH 模型存 在所谓的路径依赖问题,即条件方差依赖于每一时间点上均值方程的残差,而残差又由每个 ① 持久性参数为方差方程中各 GARCH 参数之和,一般而言,这个持久性参数小于 1,具体解释见 Bollerslev (1986)。 ② 美国国家经济研究中心,the National Bureau of Economics Research. 2 时间点所处的状态和均值方程的参数共同决定。这样,条件方差依赖于整个时间序列中每个 时间点所处的状态。如果假设我们有 100 个数据,两个状态,那么我们有 2100 条不同的状态 实现路径,极大似然法就必须求出 2100 条路径中每条路径的极大似然值,然后比较这些路径 中的似然值,得出拥有最大似然值的路径。然而,众所周知,2100 是一个目前的计算机所解 决不了的天文数字,更何况我们所假设的数据量 100 非常少,状态数 2 个也是最少的。故而, 极大似然法估计 MS-GARCH 模型只剩下理论的可能性,在实践上是行不通的。 估计 MS-GARCH 模型的另一个方法是 MCMC 模拟法。这个方法通过分步取样,不断 迭代直到参数收敛的模拟解决马尔可夫转换模型所面临的复杂估计问题,包括路径依赖问 题。自从 Albert 和 Chib (1993)将 MCMC 模拟法首度用于估计马尔可夫转换模型以来,该模 型族的各种变化模型发展很快。Luginbuhl 和 Vos (1999)将 GDP 分解为趋势变量和两个随时 间变化的漂移项分别对应繁荣期和萧条期两个状态;Fruehwirth-Schnatter (1998)假设误差由 多个正态分布混合而成,从而提出马尔可夫转换混合模型(MS Mixture Model);Kaufmann 和 Fruehwirth-Schnatter (2002)用贝叶斯方法估计了马尔可夫转换 ARCH 模型,得到同 Hamilton and Susmel (1994)用极大似然法相似的估计结果;Smith (2002)估计了马尔可夫转换随机波动 模型,然而指出,这个模型并不比马尔可夫转换模型好多少。 对于MS-GARCH模型的估计就困难多了,GARCH模型的后验概率密度方程较为复杂, 无法推出各个参数的条件概率,因而无法用Gibbs 样法来生成参数随机数。然而用 Matropolis-Hasting取样法,必须把均值方程和方差方程中所有的参数一起组成目标似然函 数,由于参数多 取 a (2009)结合之前其他学者的研究结果,估计了带门限的不对称反应GARCH混合模 型, 到的唯一一篇相关论文是蒋祥林等(2004)所做的关于中国股市的 MS- ,发现该 模型 ①,这样在模拟过程中接受一组随机生成的参数的概率非常低,通常低于 5%, 而这么低的接受概率使得到的参数不宜收敛②。Nakatsuma (1998)提出一个实用的Gibbs取样 法来解决GARCH模型的贝叶斯估计中所遇到的问题,宣称对于大多数金融时间序列,该方 法都能取得很好的收敛效果。之后,MS-GARCH模型的MCMC估计成为可能,Das和Yoo (2004),以及Henneke等(2006)分别运用Nakatsuma (1998)所提出的方法估计了MS-GARCH模 型,之前虽然也有学者用极大似然法估计过MS-GARCH模型,但都对GARCH模型中的方差 方程做了简化处理,以便避免条件方差所具有的路径依赖问题(Gray, 1996; Klassen, 2004)。 Ardi 他们发现瑞士证券市场的指数收益率隐含两个波动状态,并且这两个波动状态具有相似 的不对称反应,即负的收益率使波动率上升;以及相似的门限性质,即非常坏的消息③都对 波动率有明显的影响。 在中国大陆,我们能找 ARCH 模型,并且得出中国股市波动状态的改变主要是政策引起的。本文运用 MCMC 方法估计模型,并且得出更为丰富的结论,填补了国内在这个领域的研究空白。 我们对 1995 年至 2009 年上证综指的周收益率进行了MS-GARCH模型的估计 对于极值非常敏感,将绝对值大于 15%的收益率变成 15%之后,才能勉强使参数随机 值的接受概率提高到 5%左右,但仍然不能满足收敛条件。也许是因为中国股市的高波动性, 使得MS-GARCH模型的估计变得困难④。因而,本文将重点放在MS-ARCH模型的估计上, 一般而言,三阶或四阶的ARCH模型就可以很近似的表达出GARCH模型的效果,因而, MS-ARCH模型能比较好的揭示上证综指所蕴含的各种不同波动状态,以及其发展规律。 ① 即使最简单的 GARCH(1,1)模型也有 4 个参数,即均值方程一个参数,方差方程三个参数,在我们的模 拟实践中,Metropolis-Hasting 取样法对 GARCH 候选参数的接受概率在 1%-5%之间,这个接受概率太低, 使参数很难达到稳定的收敛状态。 ② 一般而言,MCMC 模拟要求的接受概率至少在 20%左右。 ③ 指使收益率低于一定门限的坏消息。 ④ Nakatsuma (1998)的方法没有理论基础,只是根据实证上得到证实的条件方差四次方的概率分布而推出 的,作者只是宣称对于大部分金融时间序列数据适用。 3 二、极大似然估计法和 MCMC 估计法 极大似然法是计量经济学中常用的参数估计方法。在实际应用中,极大似然法受制于似 然函 似然法面对的另一个问题是,无法确定所得到的估计是局部极值还是全局极值。虽 然, (MCMC 估计法),计量经济 学也 化时所对 应的 属于贝叶斯估计法中的主要参数估计方法。 MCM C 取样方法 – Gibbs 取样法由 Geman 和 Geman(1984)提出,并经 Gelf 义,这种方法将 数的可导性。如果似然函数不可导,那么大多数求解极值的数值分析法,如高斯-牛顿 法和牛顿-拉夫森法,就没法对参数进行有效估计。而一些不需要似然函数可导性的方法, 如格点搜索法,面对稍微复杂的极值求解问题时,耗费的计算量往往大到实践中无法接受的 地步。 极大 用不同的随机初始点运算多次,如果所得到的估计结果一致的话,可以增加取得全局极 值的可信度。可是对于复杂的多元似然函数,极大似然法收敛到局部极值的概率将很快增加, 很多情况之下,运算多次也不能排除收敛到局部极值的可能。 上世纪 90 年代在统计学界兴起了马尔可夫蒙特卡罗估计法 逐渐将这些方法应用于计量模型的估计中。相对于极大似然法,MCMC 估计法有很大 优势。MCMC 方法不需要似然函数的可导性,它通过模拟参数的形成,使参数收敛,进而 计算模拟参数的均值和差进行估计,无须求导却能得到很好的估计结果,也很少存在收 敛到局部极值的情况。而目前国际上所采用的金融计量模型都比较复杂,大部分属于非线性 模型,这些模型用极大似然法无法或很难估计,但 MCMC 估计法却可以解决。 在本质上,MCMC 估计法同极大似然估计法相似,要得到后验概率函数最大 参数值,后验概率函数同似然函数的区别仅仅是加入先验概率函数,而在样本量很大的 情况下,先验概率函数对于最终结果的影响几乎为 0。从这个意义上,MCMC 估计法也要 最大化似然函数,然后求其所对应的参数值。但是,MCMC 方法放弃了对似然函数求导, 而是对组成似然函数的参数进行随机取样,并运用蒙特卡罗方法估计这些随机参数的均值和 标准差。蒙特卡罗方法本身很简单,只是根据大数定理对参数随机数的均值进行计算。 MCMC 估计法结合了马尔可夫链式的取样法和蒙特卡罗方法,有效地规避了极大似然法所 面临的函数可导性和局部极值收敛的问题。 MCMC 估计法运用了贝叶斯概率定理, C 估计法最重要的步骤是对参数的取样并得到参数模拟值,之后的蒙特卡罗估计只是 对参数模拟值求均值的过程,因而很多学者以具体的取样法来称呼 MCMC 估计法。目前, MCMC 估计法包括两种重要的参数取样法,分别是 Metropolis-Hasting 取样法,和 Gibbs 取 样法。前者由 Metropolis 等(1953)提出,Hasting(1970)对该方法进行一般性扩展。这个方法 最先在物理学中得到应用,被统计学以及计量经济学所广泛运用是在上世纪 90 年代后。一 篇介绍 Metropolis-Hasting 取样法的论文见 Chib 和 Greenberg (1995)。该取样法较复杂,它 首先设定参照密度函数,并从该密度函数取样得到候选参数值,结合目标密度函数计算候选 参数值的接受概率,并按照这一概率接受该候选值作为参数的取样值,不断重复这一过程得 到一系列参数取样值。 另一种重要的 MCM and 和 Smith(1990)的介绍被统计学家和计量经济学家所广泛认可,同时应用于统计模型 的估计(Gelfand 等, 1990)。Gibbs 取样法实际上是 Metropolis-Hasting 取样法的一个特例,但 Gibbs 取样法非常直观,所以得到快速的推广。该方法利用后验概率密度函数中每个参数的 条件概率密度函数,进行各参数的随机取样。在很多普通的模型中,参数的条件概率密度函 数往往是我们所熟知的统计分布形式,故而这些参数的随机取样容易获得,而完成参数估计 过程,只需将这些从条件概率密度函数得到的取样值取平均值和标准差。 本文的 MS-ARCH 模型采用 Metropolis-within-Gibbs 取样法,顾名思 4 Metr 三、MS-ARCH 模型的 MCMC 估计法 目前学术研究中出现的各种马尔可夫转换模型有很大的相似性,本文参考 Das 和 Yoo (200 opolis-Hasting 取样法嵌套于 Gibbs 取样法中(Koop, 2003, p.99)。这种方法对转移概率和 状态序列参数用 Gibbs 取样法,而对 ARCH 参数用 Metropolis-Hasting 取样法,依次取样, 并不断迭代循环,直到每组参数模拟值都收敛。 4),Henneke 等(2006)和 Rachev 等(2008),并采取通常的马尔可夫转换模型描述方法。 我们假设 n 个状态,每个时间点所处状态 tS 是随机出现的,状态之间的转换服从马尔可夫 转移概率矩阵: 11 12 1 21 22 2 1 2 ... ... ... S S S S SS P                      其中, 是从状态 到状态i jij 的转移概率。这样,转移概率矩阵 中每一行的加总等于 1。P 由于状态的转移具有马尔可夫性质,故时间点 t 的状态 tS 仅仅取决于上一时间点所处的状态 1tS  。即, 1 2 1 1( | , ,..., ) ( | )t t t t tP S S S S P S S   马尔可夫链性质刻画了状态序列 1{ }Tt tS  的转化规律,而 仅仅取决于 的性质简化了模 一)MS-ARCH 模型 RCH 模型表述如下: t tS 1tS  型的复杂程度和估计难度。 ( 本文所考虑的 MS-A tt S y    (1) q 2 , 1 t t q Q t S q S t q h      (2) ~ (0, )t tN h 其中, 各参数依赖于 时期的状态 , 是条件方差序列。 一般而言,方程(1)又称为均值方程,而方程(2)称为方差方程。我们假定的均值方程没 有包 , 1, ,{ }t t t Q S S q S q    t tS th 括任何自回归项或移动平均项,因为在对 AR-ARCH 建模过程中,我们发现 t 服从 t 分 布的假设将使自回归项不具有统计显著性。故,我们在 MS-ARCH 模型中使用了最简单的 均值方程。 在这个模型中,我们共有三组参数,分别是 ARCH 参数,转移概率参数,而状态序列 虽然 ARCH 参数 不是参数,但我们把它也作为隐藏的参数加以估计,否则会使估计过程变得不可能。对 于 1,...,tS n , G tS   , 1, ,{ }t t t QS S q S q    , 5 转移概率参数 1{ }ni ij j   , 状态序列 1{ }Tt tS S  。 贝叶斯估计中,后验概率是先验概率和似然函数之积。我们先设定先验概率密度函数, 求出似然函数,再求出状态 ,转移概率tS i 的条件概率密度函数,以及 Metropolis-Hasting 取样法生成的 ARCH 参数随机数,然后对于这三组参数运用 Gibbs 取样法轮流抽取随机数, 当这些参数随机数达到收敛时,参数估计成功了。总体而言,这类MCMC估计法叫Metropolis within Gibbs 估计方法,也就是在整体 Gibbs 取样法下,套着 Metropolis-Hasting 取样法。 (二)各参数的条件概率分布 首先我们设定各组参数的先验概率密度函数。对于 ARCH 参数,我们采用通常的正态 分布的假设, { }~ ( , ) SS S SN V I   其中 { }SI  是 GARCH 参数的示性函数,在满足 GARCH 参数的限制时,该示性函数等于 1, 否则等于 0,即, , 1 , 1 { } , 1 , 1 1, 0,{ } 0, 1 0, 0,{ } 0, 1 S Q Q S q S q S q S q Q Q S q S q S q S q I                          (3) 这个示性函数将在模拟过程中将删除不符合限制的参数随机数,使每次模拟的参数模型能满 足 ARCH 模型的平稳性。 转移概率 i 的先验概率密度函数设定为 1 2~ ( , ,..., )i i iDirichlet a a aiS (4) 之所以这样设定,是因为 i 向量中各 , 1,...,ij j S  服从多项式分布①,而Dirichlet分布是多 项分布的共轭函数,具体见Rachev等(2008, 第 218 页)。 MS-ARCH 模型中,状态变量是观察不到的,这给极大似然值估计法造成了很大的困难, 但 MCMC 模拟法提供了一种非常简便的解决方法,即我们先设定状态序列的初始值,然后 固定状态序列,模拟出一组参数。这就像在普通的 ARCH 模型中估算参数一样,没有多少 技术难度。接下来,利用模拟得出的参数再优化状态序列,这个优化过程是卡尔曼滤波的一 个简单形式,最先由 Hamilton (1989)提出,Albert 和 Chib (1993)稍微改变之后用于 MCMC 模拟中。接下来就是不断地重复这种估计和模拟过程,直到所得出的参数变动较小,得出的 状态序列也稳定下来。 为了进行 MCMC 模拟,我们先求出后验概率密度函数,然后分别计算状态序列 和转 移概率 tS i 的条件概率密度函数,以及 GARCH 参数的似然函数。 后验概率密度函数 ( , , | ) ( | , , ) ( ) ( )p S y p y S p p        (5) ① 因为 i 向量中各数值之和为 1。 6 其自然对数函数为 2 1 1 ( ) 1 1 ( ) log ( , , | ) 0.5 log 0.5( ) ' ( ) ( 1) log( ) t S T t S t t q t S S S S S S S ij ij ij i j y p S y c h h V I a n                            (6) 其中 c 为常数项,具体是多少不重要,不会影响最终结果。 为状态序列中相邻时间点从 状态 向状态 ijn i j 转换的次数,即 1 1 ( | ) 1 t t T ij S i S j t n I       。 从公式(6)中,我们看到转移概率向量 i 只同状态序列 1{ }Tt tS  有关,即 1 log( | , ) ( 1) log( ) i S i ij ij j y c a n  ij        (7) 其中, c 是不重要的常数, i 指模型除了 i 的所有参数。这个条件概率密度函数就是 Dirichlet 分布函数的核的对数值。如何在 Dirichlet 分布取样得到随机数见 Rachev 等(2008), 第 220 页。 对于状态序列,由于可能的状态实现路径是个天文数字,我们很难同时取样得到一组状 态序列 ,但可以基于其他时间点的状态1{ }Tt tS  1 1 1{ ,... , ,... }t t tS S S S S   T ,每次只取样一个 时间点的状态 。这样,我们需要求 的条件概率密度函数tS tS ( | ,t , )S tp S y S  ,而根据贝 叶斯法则, ( , , | ) ( | , , ) ( , |( | , , ) ( , | ) ( , | ) t t S S t t t t t S t t S t S p S i S y p y S S i p S i Sp S y S p S y p S y                      )S 1 ( | , , ) ( | , , ) S t t ji ik S S t t js sk s p y S S i p y S S s              (8) ARCH 参数的后验概率分布并不是标准形式,其核的对数函数为 2 ( ) 1 1 ( ) 1 ( )1log( ( | , )) log 2 1 ( ) ' ( ) 2 t t t t t t T t S i S i S i S i t q S i S s s s s s S s s y p y c h h V I                               (9) 因为 tS  通过残差影响条件方差 ,th tS 将出现在方括号中的三个地方,使公式(9)变的复杂 起来,ARCH 参数的条件概率分布不再是标准的分布,为了得到该后验概率分布的随机取样 值,我们用随机游走 Metropolis-Hasting 取样法。由于 ARCH 参数必须满足一定的平稳性限 制条件,我们在每次通过随机游走获得 ARCH 参数的一组候选值时,都要求这一组候选值 满足公式(3)所示的示性函数等于 1 时满足的限制条件。 (三)MCMC 模拟法 7 得到所有参数的条件概率函数之后,我们就可以固定其他参数,通过条件概率分布对某 一或一组参数取样,得到参数的 MCMC 模拟值。总体而言,MCMC 模拟将 MS-ARCH 模型 的估计分解成以下几步: 第一步:基于ARCH参数 ( ) t j S ①和转移概率 ( )ji ,通过状态序列 的条件概率密度函 数取得第 ( 次随机序列 tS 1j  ) (1{ }T jt tS 1) 的模拟值; 第二步:基于 和( ) t j S ( 1)1{ }T jt tS  ,通过转移概率 i 的条件概率密度函数取得转移概率 的第 次模拟值 ; ( 1j  ) ( ji 1) 第三步:基于 和( 1)1{ }T jt tS  ( 1)ji  ,通过 Metropolis-Hasting 取样法得到 ARCH 参数的第 次模拟值 。 ( 1j  ) ( 1) t j S  不断重复以上三步各参数的模拟,直至参数模拟值各自收敛,这些收敛之后的参数模拟 数的平均值和标准差就是 MCMC 模拟法的参数估计结果。 四、上证综指 MS-ARCH 模型的估计 (一)数据 上证指数的原始数据来源于 Wind 资讯,我们采集了 1994 年 12 月 30 日至 2009 年 10 月 15 日的共 740 个周收盘价,然后通过收盘价的自然对数之差得到 739 个连续周收益率。 引言中曾经提到,极值会很大的影响 MCMC 模拟的收敛性,因而我们把这些收益率数据中 绝对值大于 0.15 的收益率都变为 0.15,这样的极值共有 4 个,其中三个发生在 1995 年,一 个发生在 1996 年。1996 年 12 月之后,由于中国证监局实行了涨跌停板制,就再没有发生 周涨跌幅超过 15%的波动了。 图 1 上证指数日收益率 根据经验,MS-ARCH 模型的状态数一般较小,不会超过 3 个,因此,我们只估计了两 状态和三状态 MS-ARCH 模型。当状态数大于 4 时,由于参数数量很大,模型并不能提供 很好的现实解释。如果模型的状态数多于三个,参数必须加以限制或模型假设必须增加,不 然难以得到具有较强解释力的模型。 ① 上标括号内的 j 表示第 j 次模拟产生的参数,下同。 8 (二)MS-ARCH 模型的估计 我们为三状态模型设定的初始值为 18 2 2 2 28 2 2 2 16 ija        0.8 0.1 0.1 0.1 0.8 0.1 0.1 0.1 0.8 P        同时,我们估计了 ARCH(3)模型,并把它的估计结果作为 MS-ARCH 模型中各相对应的 GARCH 参数的初始值。让三个状态的 GARCH 参数具有相同的初始值, 1 2[ , ] [0.0005,0.0005,0.0005]   , 0.00015 0.2 0.26 0.29 0.00015 0.2 0.26 0.29 0.00015 0.2 0.26 0.29 q S        至于 GARCH 参数的先验概率分布参数 S 和 ,由于我们采用 Metropolis-Hasting 取样法, 在 MCMC 模拟过程中其实并不需要。另外,所有参数初始值的设置其实也不重要,模拟次 数大于 1000 次时,足以消除初始值对最终结果的影响。只是,初始设置恰当,能够使参数 收敛的更快。在以前计算机运行速度不快时,初始值的设置比较重要,而现在计算机技术这 么发达,只要初始值在合理的范围内,参数会慢慢收敛,不会影响最终结果。两状态的 MS-ARCH 模型的初始值设置与三状态模型相似。 SV 我们用Matlab软件编程,共进行了 30000 次模拟①,各参数的模拟值如图 2 所示。在实 际计算过程中,还必须注意正确设置ARCH参数在Metropolis-Hasting取样法中候选值的方 差,具体方法可以通过运行一次后得到的参数方差来设置这个方差。另外,我们发现三状态 模型的状态识别非常重要②,在编程过程中,我们设定了第一个状态为低波动状态,第二个 为中等波动状态,第三个为高波动状态。再对和 进行双重参数限制之后,才得到比较 稳定的输出结果。即使这样,还是在模拟次数约 5000~6000 次附近发生了跳转,这一点可在 图 2 的第四张小图 2 的模拟图中较清楚的看出。当然,消除这次跳转对估计结果的影响其 实很简单,我们舍弃了前面 10000 次模拟,而用后面的 20000 次模拟结果来求参数的均值和 标准差。 图 2 显示模拟结果具有较好的收敛性,Smith和Robert (1992)所提出的收敛性检验以及 CODA③也不能拒绝参数收敛。三个状态的和 参数可以从图中比较清楚看出他们的大 小,其他 参数变动的方差较大。另外, 3S  方差很大,我们运行了模型多次④,发现 3S  的波动一直很大,说明高波动状态的平均收益率波动也较大。 3S  的方差大,也就是股市 处于高波动状态时,收益率可能很好,也可能很差,很难进行预测,平均收益率很难收敛到 一个狭小的区域。至于两状态MS-ARCH模型的参数收敛状况也相似, 的 收敛性最好,其 他参数表现出较大波动性。 ① 该模型程序在奔腾双核处理器 T4200,主频 2.00GHz 运行,耗时 8 分钟 8 秒。我们可以向有兴趣的读者 提供模型的 Matlab 程序。 ② 在两状态的模型估计中, 在两个波动状态相差悬殊,只要设定 1 2  就能得到稳定的模拟结果。 ③ 一个 MCMC 收敛性检验程序模块。 ④ 我们把程序总共运行了十遍以上,每一遍模拟 30,000 次,总共超过 300,000 模拟次数可以说明我们的估 计结果是稳健的、可靠的。 9 图 2 三状态 MS-ARCH 模型中各参数的模拟值 注:蓝线条表示第一个状态,即低波动状态的参数,绿线表示第二个状态的参数,红线条第三个状态。 至于参数随机值的接受概率,第一、第二和第三状态分别为 22%、48%和 46%。三个接 受概率都在 20%到 75%的最佳概率区间。 上述估计结果显示,MS-ARCH模型能较好的区分出上证综指中波动性不同的几个 ARCH数据实现过程,这些ARCH过程的无条件方差 h 有显著的统计区别。 ① )模型。 我们将前面 10000 的模拟值作为废弃数据②(burn-in data)处理,对后面 20000 个模拟数 据求参数的平均值和标准差,得到的结果如表 1 所示。为了比较模型,我们同时估计了 ARCH(3 表 1 显示了三个模型的估计结果。其中两个 MS-ARCH 模型的估计结果同我们从图 2 中所获得的结论相互印证:各个状态的 项具有 5%的统计显著性,其他参数除了 2S  皆不 显著。但是,每个状态的  参数相加则具有统计显著性,比如 MS(3)-ARCH(3)中 的均值为 0.3916,而标准差为 0.1617。这样,虽然 3 1 1 S q     , 1q S  参数没有很好的稳定 性,但每个状态的无条件方差却非常稳定。至于原因,上证综指波动过于频繁,使模型的估 计过分依赖于模型的条件方差,其他参数显的不重要,才使其他参数在模拟过程中没有表现 ① 期望条件方差 1 /(1 ) Q q q h      。 ② 我们没有见到过英文词 burn-in data 相应得中文翻译,这里暂译成“废弃数据”。 10 出很好的稳定性。然而, 2S  却是例外,这一点会在第五节的模型分析中详细解释。 表 1 ARCH 模型和 MS-ARCH 模型的估计结果 参数 ARCH(3) MS(2)-ARCH(3) MS(3)-ARCH(3) 1S  0.0017 (0.0012) 0.0002 (0.0027) -0.0020 (0.0022) 1S  0.00069** (7.7*10-5) 0.0006** (0.0001) 0.0005** (0.0001) 1, 1S  0.211** (0.043) 0.072 (0.059) 0.1392* (0.099) 2, 1S  0.211** (0.052) 0.24 (0.137) 0.1693 (0.1029) 状 态 (1) 3, 1S  0.177** (0.042) 0.074 (0.052) 0.0826 (0.0698) 2S  0.0028 (0.0047) 0.0211** (0.0066) 1, 2S  0.002** (0.0005) 0.0013** (0.0005) 2, 2S  0.201 (0.106) 0.2171 (0.1506) 3, 2S  0.064 (0.058) 0.1846 (0.1440) 状 态 (2) 0.155 (0.113) 0.1283 (0.1143) 3S  -0.0078 (0.0118) 3S  0.0023** (0.0008) 1, 3S  0.2372 (0.1868) 2, 3S  0.0939 (0.0973) 状 态 (3) 3, 3S  0.14 (0.12) 似然值 1390.9 1415.4 1448.7 BIC 1385.9 1405.4 1433.4 AIC 1374.4 1382.4 1399.2 注:括号内数值是参数的标准差。**,*分别表示在 5%和 10%水平上统计显著性,下同。 (三)MS-ARCH 模型的比较 从似然值,AIC 和 BIC 信息准则,在表(1)中可以很清楚的看出,三个状态的 MS-ARCH 模型比其他两个模型更优越。 另外,我们估计了 GARCH 族模型中主要模型,并求出各自的似然值和 AIC,BIC 信息 值。表 2 中这四个 GARCH 族模型是比较简洁,并且似然值在同类中比较高,各参数也基本 具有统计显著性,因此这四个模型代表了 GARCH 族中最好的模型。 表 2 GARCH 模型族的主要模型似然值, AIC 和 BIC AR(1)-GARCH(T,1,1) GJR(1,1) AR(1)-GJR(T,1,2) EGARCH(T,1,1,1) 似然值 1407.7 1405.2 1408.8 1403.8 AIC 1401.7 1400.2 1400.8 1397.8 BIC 1387.9 1388.7 1382.4 1384.0 然而,在同 MS-ARCH 模型的比较中,似然比检验也显示,考虑了结构突变的后者明 显优于这些普通的 GARCH 族模型。故而,按照 AIC,BIC 的信息准则评判标准,三状态 MS-ARCH 模型要好于几乎所有的普通 GARCH 族模型。当然,针对两状态 MS-ARCH 模型 和三状态模型,贝叶斯的模型比较方法可以用于检验,只是似然值显示两个模型的差距比较 大,这里省略了进一步的比较。以下,我们着重对三状态 MS-ARCH 模型进行分析。 11 五、上证综指 MS-ARCH 模型的分析 (一)MS-ARCH 模型的参数分析 根据表(1)的数据,三个状态的持久性指标①分别为 0.3911、0.53 和 0.4711,这些指标都 小于ARCH(3)中的持久性指标 0.599。这个结论也印证了其他学者在日本、美国和英国股市 的相似发现(Rachev等, 2003, 第 223 页)。在考虑了结构突变之后,GARCH模型所指出的持 久性指标并不能很好说明股市波动率的持续性,而状态的持久性才是造成股市波动聚类的主 要原因②。波动状态的持续性对波动聚类有更强的解释能力,并且不同状态的波动聚类性质 也不一样,这一点从图 3、图 4 和图 5 的相互比较中得出。其中,最大的区别是波动持续时 间的不同。 三个状态的无条件方差求得如下 1 2 30.0013, 0.0025, 0.0049S S Sh h h     其中,第三个状态的无条件方差是第一个状态的近 4 倍。为此,我们可以把第一、第二和第 三状态又分别称为低波动状态、中等波动状态和高波动状态。另外,ARCH(3)模型的期望条 件方差为 ARCHh =0.0028,介于低波动和高波动状态之间。模型所估计出的转移概率矩阵为 ** * * ** ** * * ** 0.953 0.027 0.021 (0.021) (0.016) (0.016) 0.064 0.880 0.057 (0.035) (0.048) (0.037) 0.071 0.087 0.842 (0.049) (0.052) (0.071) P           ** 其中,对角线的概率分别是三个状态在下一期仍然保持这个状态的概率,也可以看成某个状 态的持续性指标。这样,低波动状态的持续概率最大,而高波动状态最不易持续。其中,低、 中等和高波动三个状态的平均持续时间分别为 21.3 周③、8.3 周和 6.3 周。这个结论也可以 从三个状态各自在每个时间点的概率图直观的看出,具体见图 3、图 4 和图 5。 三个状态的发生概率图,描述了从 1995 年到 2009 年之间,三个状态在每个时间点的各 自分布概率。比较明显的是,低波动状态平均持续时期最长,并且发生的总时间也最长,而 高波动状态持续时期短,也不经常发生。比较有意思的是,中等波动状态基本伴随着牛市而 来,如 1997 年初、1999 年上半年、2005 年股改之后的大牛市以及之后 2009 年的反弹(对 比图 6,上证综指在 1995 年到 2009 年的走势)。这一点从表(1)的估计结果中也可以得到印 证,也就是前面我们曾提到的 2S  显著大于 0。 (二)收益率和波动率的规律 中等波动状态能获得显著大于 0 的平均收益率,这个是本文非常有趣的发现,这能给投 资者提供一个实用的投资策略。一般而言,股市收益率很难预测,而波动率却可以,实际上 大多数金融计量模型是以分析波动率为主要目标的。然而,MS-ARCH 模型显示,上证综指 中收益率和波动率之间居然隐含一定的关系,即中等波动状态的收益率显著为正,这就提供 了一种实用的预测方法,即通过波动率的判断而达到预测收益率的目标。或者根据模型预测 ① 持久性指标为方差方程中 之和。 ② 最大的持久性指标 0.53 意味着 4 周之后,波动冲击就小于 10%,然而波动聚类的持续时间明显大于 4 周, 这一点可以从图 6 和图 7 看出。 ③ 平均持续时间=1/(1-0.953)。 12 股市进入中等波动状态的时间点,就可以投资股市而获得显著大于 0 的平均收益率。 另一方面,这个收益率和波动率之间的规律也可以直观的解释。中国股市一般而言是资 金市,投机操作非常普遍,牛市往往是资金推动的。而资金增多之后,在股市的博弈加剧, 带动股指更加剧烈的震荡。反之,资金退却之后,市场会陷入沉寂,牛市在沉寂的市场没有 形成基础,因而造成了牛市与较高波动性相伴相随的状况。 进一步,通过比较图(5)和图(6),我们发现,高波动性同熊市以及股市拐点处的市场相 关性非常大。这里,我们不进行深入的定量分析,而只进行直观的解释。如果说中等波动性 是投资者在牛市的贪婪引起的,那么高波动性是投资者的恐惧形成的。我们也可以从波动性 角度来描述市场的走势,当股市沉寂之时,波动性很小;随着资金的进入,牛市的开始,市 场的活跃,股市的波动性也随之提高,进入中等波动状态。而总有一天(平均 8 周之后), 有投资者感觉到风险,开始抽出资金,形成市场的恐慌,股市的波动性随之到达高波动状态。 恐慌之后,市场再度陷入沉寂,等待新一批资金来把它叫醒。如此,中国股市便有了“投机 市”之称 图 3 低波动状态在 1995 年到 2009 年的概率图 图 4 中等波动状态在 1995 年到 2009 年的概率图 图 5 高波动状态在 1995 年到 2009 年的概率图 13 图 6 1995 年 1 月到 2009 年 10 月之间的上证综指走势 接下来,我们比较 ARCH(3)和三状态 MS-ARCH 模型的条件方差 ,如图 6 和图 7 所示。我们可以看出,三状态 MS-ARCH 模型的条件方差序列 中低波动状态的方差较 小,而中等和高波动状态的方差普遍大于 的平均方差,这一点我们从表 1 的估计结 果中已经知道。然而, 最明显之处在于它的方差往往有聚类倾向,这是中等和高波动 状态发生时,波动率保持高位的表现。如果把图 7 和图 4、图 5 相对照,我们会发现,方差 聚类发生时,就是中等或高波动状态的概率接近于 1 时。 ,t ARCHh ,t MSh ,t ARCHh ,t MSh 这两张条件方差图显示,MS-ARCH 模型把方差按不同的水平分成几个层级,每个层级 也相当于一个波动状态,然后在每个状态分别进行 ARCH 模型估计,而让状态之间的转换 服从马尔可夫链式的转移概率。总体而言,这种方法能显著提高波动率的拟合程度。 图 6 ARCH(3)模型的条件方差 ,t ARCHh 图 7 三状态 MS-ARCH 模型的条件方差 ,t MSh (三)中国大陆股市和台湾、日本以及美国股市的模型结果比较 我们将上证综指的 MS-ARCH 估计结果同世界其他股市的相似模型进行比较,并且发 现一些有趣的结论。因为上海股市同深圳股市存在颇多相似性,上海股市也可以代表中国大 陆股市与其他国家和地区进行比较。以下关于其他国家和地区的股市的相关分析结果取自 Li and Lin(2003, 台湾股市); Fong (1997, 日本股市); Hamilton a
/
本文档为【中国股市有规律吗】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索