求4阶矩阵主不同阶对角矩阵元素为0其余为1的逆矩阵,

? 不可或缺的风险模型:协方差矩阵应用领域介绍

组合的波动是度量组合风险的重要指标而组合成分股收益率的协方差矩阵便是估计组合波动的重要工具。

股票收益率嘚协方差矩阵在组合绝对风险估计、组合相对风险控制、组合优化和因子组合构建以及多因子合成四个部分都有着十分广泛的应用

? 协方差矩阵的估计方法

市场上主流的协方差矩阵估计方法包括样本协方差矩阵、因子模型估计的协方差矩阵、压缩矩阵估计和其他基于时变模型的估计方法。

样本协方差虽然是真实协方差的无偏估计但待估参数过多、估计误差较大,且当股票(资产)数量大于样本数量时樣本协方差矩阵将不可逆。

因子模型通过设定一定的结构来减少待估参数从而降低估计误差,但是可能存在模型设定偏误传统多因子模型的构建较为复杂,因子选取和构成具有一定争议;统计多因子模型构建简单但缺乏增量信息。

压缩估计的出发点是想综合考虑估计誤差与估计偏误经典的LW线性压缩基于Frobenius形式的二次损失函数给出了线性压缩的计算方式。

? 协方差矩阵估计效果评价方法

协方差矩阵估计效果的评价方法主要分为两大类一种需要真实协方差矩阵,一种不需要真实协方差矩阵

需要真实协方差矩阵的评价方法有MAD/RMSE指标法、组匼风险度量法、基于特征距离等,不需要真实协方差矩阵的评价方法可以通过观察实际波动与预测波动相关性、GMV组合及MVO组合的样本外表现來进行评价

从组合的风险预测来看,经过多步调整的多因子模型效果显著更好GMV组合的实际风险均显著小于基准组合,说明协方差矩阵嘚估计起到良好的效果多因子模型在指数增强型产品的构建中能够精确控制跟踪误差。

综合以上结论表明多因子模型的协方差矩阵估計的效果最佳,财通金工可以定期提供A股协方差矩阵数据有需要的投资者可与我们联系获取。当然如果从模型构造的简便性出发,基於压缩矩阵估计的方法也能够取得不错的效果

本报告统计数据基于历史数据,过去数据不代表未来市场风格变化可能导致模型失效。

?更多交流欢迎联系财通金工张宇联系方式: (请注明机构+姓名)

欢迎在Wind中搜索“星火“和”拾穗”多因子系列,下载阅读我们的专题報告

随着A股市场有效性的不断加强,市场风格出现切换挖掘持续有效的Alpha因子难度正在不断加大。“从风险模型入手”是财通金工多因孓研究的一大特色特别在经历了2017年的市场大小盘风格切换之后,我们对于风险模型的深入研究受到了市场的广泛关注通常来讲,组合嘚波动是度量组合风险的重要指标而组合成分股收益率的协方差矩阵便是估计组合波动的重要工具。在财通金工的前述研究中我们主偠从多因子模型的角度对股票协方差矩阵进行了稳健估计,然而基于多因子模型的风险估计构建方式复杂、调整步数较多、后续维护成本較高与此同时,市场上也出现了很多基于个股收益率进行结构化估计的方法作为对多因子风险模型的补充,本文主要对各类协方差矩陣的估计方法进行详细介绍并从组合绝对风险估计、组合相对风险控制以及最小风险组合构建等多个维度比较各类协方差矩阵估计方法嘚优劣,以供投资者参考

1.不可或缺的风险模型:协方差矩阵应用领域介绍

股票收益率的协方差矩阵在各个方面均有非常重要的应用,本蔀分我们将从组合绝对风险估计、组合相对风险控制、组合优化及因子组合构建和多因子合成四个部分对协方差矩阵的主要应用范围进行介绍

1.1 组合绝对风险估计 组合绝对风险估计是指给定一个投资组合的权重向量后,根据个股协方差矩阵对其未来一段时间的绝对波动水平進行估计具体来讲:

其中,w表示投资组合的个股权重向量(N×1维)V表示个股收益率的协方差矩阵(N×N维)。当协方差矩阵表示未来一個月的个股收益率协方差时估计得到的组合绝对风险即为该组合未来一个月收益率的方差。如图2所示财通金工在每周发布的多因子跟蹤周报中,对市场主要指数未来一个月的波动水平进行了估计以供投资者参考。

1.2 组合相对风险估计

在实际应用中我们发现对于组合绝對风险水平的估计往往并不准确。最典型的对于期权投资者而言,50ETF波动率的走势是其最为关心的问题然而财通金工研究表明,在横截媔上基于多因子模型或是压缩矩阵模型对上证50指数的波动率走势进行预测的准确度往往不如在时间序列上采用历史波动率、EWMA或是GARCH模型的波動率拟合效果相比之下,在横截面上进行协方差矩阵估计在控制组合与基准之间相对波动水平方面却能够起到非常好的效果

特别地,隨着近几年来市场对指数增强型产品的不断热捧如何精确地控制组合与基准之间的跟踪误差便是该类产品构建过程中需要重点关注的内嫆。表1列出了部分指数增强型基金的跟踪误差阈值可以看到综合考虑到收益和风险之后,绝大多数的增强型基金的年化跟踪误差设定都限制在7.75%以内

事实上,协方差矩阵的引入正是帮助投资者进行更为精确的跟踪误差限制在指数增强型研究产品的构建中,通常采用组合優化的方法构建投资组合简单来讲:

其中,w表示组合权重(N×1向量)w_B表示基准组合权重(N×1向量),α表示个股期望收益或因子值。上述优化的主要目的是在给定个股权重上下限以及满足组合相对基准在行业和风格上的偏离后,尽可能最大化组合在Alpha因子上的暴露同时控淛其相对基准的跟踪误差在7.75%以内。

与指数增强型组合的控制类似因子组合的构建通常也需要用到股票的协方差矩阵。其中纯因子组合嘚构建可以参考财通金工“星火”专题(三)《Barra模型深化:纯因子组合构建》,最小波动因子组合的构建可以参考“星火”专题(七)《借因子组合之力优化Alpha因子合成》。以最小波动因子组合为例其是所有在目标因子上有单位暴露的组合中,预期风险最小的组合:

通过拉格朗日乘数法即可求得最小波动组合权重的显式解:

可以看到,最小波动因子组合是在目标因子上存在单位暴露的组合中预期信息比率最大的组合在不附加任何做空限制的条件下,其可以借助因子暴露与个股协方差矩阵进行显式求解

将单因子合成为多因子的过程中,协方差矩阵的估计同样能够发挥其用武之地在前述研究中,我们介绍了Qian(2007)提出的最大化ICIR方法来进行多个因子的合成与个股收益率協方差矩阵估计不同,此处估计的是单个因子IC或者RankIC的协方差矩阵它将一个因子视为一个股票,因子的IC或者RankIC即为这只股票的收益率将单個因子的期望IC值用其均值表示(IC) ?(K×1),因子IC之间的协方差矩阵用Σ_IC (K×K)表示那么,我们即可求解出一个最优组合权重使得整个组合的预期收益与预期波动的比值(即预期信息比率)最大。具体来讲:

将目标函数对权重求一阶导即可得到最优解:

其中δ为任意正数,可用于对权重进行归一化。由此可见,在单因子合成过程中,也需要用到因子IC的协方差矩阵的逆。

2.协方差矩阵的估计方法

由上一部分可知协方差矩阵的估计能够在多个领域发挥重要作用。然而协方差矩阵的估计方式多种多样,各类估计方法都有着各自不同的优点及缺陷图3中我們对目前市场上采用的比较主流的估计方法进行了总结,主要包括样本协方差矩阵估计、采用因子模型的结构化估计、压缩矩阵估计以及基于时间序列上的多元GARCH估计等

2.1 样本协方差矩阵估计

样本协方差是协方差矩阵估计方式中最为简单的方式,其计算方法方式完全根据个股茬样本内的收益率计算得到具体来讲:

其中,S_ij表示协方差矩阵第i行第j列的元素x_it表示股票i在第t期的收益率,x ?_i是股票i收益率的平均值采用矩阵方式即可表示为:

其中,X表示个股收益率数据(N×T维)I是单位矩阵(N×N为),1^'是单位向量(N×1维)

样本协方差矩阵的计算方式简单易懂,是真实协方差矩阵的无偏估计当T趋近于无穷大时,样本协方差矩阵将收敛至真实协方差矩阵然而样本协方差估计误差较夶且当个股数量大于回测区间时该协方差矩阵并不可逆等问题成为其实际应用中大打折扣的主要原因。具体来看:

首先当样本中的个股數量较多时,协方差矩阵中待估计的元素个数将会呈平方级增长从而引入较大的估计误差。那些被高估或者低估的极端元素将在“均值方差优化器(MVO)”中被进一步放大这一现象被Michaud (1989)称为“Error-Maximization”。此外Shepard(2009)指出,在正态性和平稳性的假设下由于估计误差的存在,采用样夲协方差矩阵得到的最优投资组合的风险通常会被低估其模型估计值与真实风险之间的关系满足:

当采用100个交易日数据来估计50只股票收益率的协方差矩阵时,最优投资组合的估计风险仅为真实的1/2这一推到亦可参见财通金工“拾穗”(11)《多因子风险预测:从怎么做到为什么》。

其次当个股数量N远远大于回测长度T时,样本协方差矩阵将是不满秩矩阵从而也不可逆。从样本协方差矩阵S的计算公式中可以看出其秩不超过T-1。而当N≥T时S总是不满秩的,也就是说总能找到一组权重向量w使得计算出的组合方差w^' Sw等于0,这显然与直观并不符合矩阵不满秩的另一结果是无法直接求得其逆矩阵。然而从上一小节可知协方差矩阵的逆通常在因子组合构建及因子合成过程中发挥十分偅要的作用。

最后尽管样本协方差矩阵是真实协方差的无偏估计量,但其逆矩阵却并不是真实协方差矩阵的逆的无偏估计量当T>N时,样夲协方差矩阵S的逆矩阵与真实协方差Σ的逆矩阵满足如下关系(在收益率满足正态分布的假设下):

这意味着虽然S是Σ的无偏估计,但S^(-1)却昰Σ^(-1)的有偏估计且当N越来越大时,二者之间的偏差将越来越大Fan(2008)认为,在估计协方差矩阵的逆时多因子模型比样本协方差具有明显的優势,而在估计组合的方差时(不需要求逆)多因子模型的优势会削弱。

需要强调的是当股票(资产)数量不多时,样本协方差矩阵確实是一个非常好的估计量例如在估计几个大类资产之间的协方差矩阵时,样本协方差矩阵的表现是比较稳定的然而一旦涉及到大量嘚股票的协方差矩阵估计时,样本量的限制导致其表现大打折扣因此实际应用中基于因子模型和压缩矩阵估计的方法才得到其用武之地。

与样本协方差矩阵不同因子模型假定股票收益率可由某些共同因子驱动,共同因子不能解释的部分为股票的特质收益率在这种模型假定下,股票收益率的协方差矩阵将由股票在因子上的暴露、因子收益协方差矩阵、个股特质收益率的方差共同决定由于因子数量往往遠小于股票数量,因此使用因子模型时需要估计的参数较少引入的估计误差也较小。本小节我们将就单因子模型、多因子模型和统计因孓模型三类方法的构建进行介绍

2.2.1 市场指数模型(单因子模型)

在单因子模型中,最为常用的属于市场指数模型它是根据CAPM模型演化而来。Sharpe (1963)认为股票收益来源于其对系统性风险承担的回报个股对于市场风险的承担大小可用β值进行衡量:

其中,x_it表示个股收益x_mt表示市场收益,ε_it为无法被市场风险解释的个股收益由单因子模型估计出来的股票协方差矩阵即可表示为:

σ_m^2是市场收益的方差,β是由个股β_i值構成的列向量(N×1维)Δ是由个股残差收益ε_it的方差构成的不同阶对角矩阵阵。在上述模型中个股的β值一般可由时间序列回归直接得箌。然而个股的β值并不是维持不变的,我们还可以采用不同的方法对其未来β值进行估计,常用的方法有Blume(1971)调整和Vasicek(1973)调整等对于个股Beta因子嘚估计我们将在后续的专题报告中进行介绍。

事实上单因子模型是多因子模型的一个特例。随着研究的不断深入越来越多的研究者发現个股的回报不仅与其承担的市场风险相关,个股在其他特征维度上承担的风险也与其预期收益存在密切的关系多因子模型将因子数量增加到了K个,该模型假设股票的收益率可以由K个共同因子和个股特质收益率决定:

其中r表示股票的收益率向量(N×1维),X表示股票在K个洇子上的暴露度(N×K维)f表示因子收益率向量(K×1维),u表示股票特质收益率向量(N×1维)在多因子模型假设下,个股收益率的协方差矩阵即可表示为:

其中F是因子收益的协方差矩阵,Δ是特质收益率的方差构成的不同阶对角矩阵阵。有关多因子模型的风险预测方法,财通金工在“星火”系列(二)《Barra模型进阶:多因子风险预测》和“拾穗”系列(11)《多因子模型风险预测:从怎么做到为什么》均有著十分深入的介绍此处不做过多赘述。

在前面提到的基于多因子模型的协方差矩阵构建中研究者首先需要根据市场的风格特征寻找到對资产定价存在显著关系的因子。然而业界对这些因子的选取并不存在统一的结论即便是应用最为广泛的Barra模型,对于其因子的选取、构建及配权问题也同样存在诸多非议本节我们介绍一种统计因子模型,其因子选取不再是来源于个股的基本面或技术面特征也无需根据研究者的主观判断进行选择,而是直接从个股收益率序列数据中提取得到

统计因子模型和传统的多因子模型有着十分类似的形式,其最夶区别在于因子的确定方式不同:统计因子模型中的隐藏因子可以采用主成分分析PCA(或极大似然MLE)来提取从而使得构造的统计因子之间存在相互正交的关系,进而使得因子收益率的协方差矩阵中非不同阶对角矩阵元素为0大大简化了计算量。

其中P表示根据个股的收益率矩阵R(T×N维)提取出的主成分矩阵(N×P维),其形式与多因子模型完全一致

统计因子可能不具有实际含义,缺乏解释度但胜在不需要潒传统多因子模型一样去主观地选取因子,近几年来学术界和业界也不断有新的成果关注统计因子模型需要注意的是,统计因子模型构建过程中的一个重要问题即是确定隐藏因子的个数目前,学术界已经提出了很多种不同的选取方法本文采用一种比较直观的方法:方差解释度大于90%的最少因子数,且不超过N/2不低于5。

由以上分析可知采用因子模型构建协方差矩阵的优点在于“降维”。通过设置一定的結构将原本需要对N只股票的协方差估计转化为对K个因子的协方差估计(其中N>>K),从而减少了待估参数的个数降低估计误差。然而多因孓模型也可能带来一定的模型设定偏误:多因子模型中因子选取和构造的方式并无统一结论且构建方式繁琐、维护成本较高;统计因子模型的构建虽然更为简单,但最优因子个数的选取会影响估计结果且缺乏外部增量信息。基于此Ledoit&Wolf提出的一系列关于压缩矩阵估计的方法,综合考虑了样本协防差矩阵的无偏性和因子模型的结构性给我们提供了另一种协方差矩阵估计思路。

2.3 压缩矩阵估计(LW估计法)

到目湔为止我们对样本协方差矩阵和因子模型协方差矩阵估计进行了介绍:一方面尽管样本协方差矩阵是真实协方差矩阵的无偏估计但因为其待估参数过多而导致其估计误差较大。另一方面尽管因子模型的待估参数较少,但其存在一定的设定偏误从而导致估计出来的协方差矩阵是真实协方差的有偏估计这两种方法各有优劣,一个很自然的想法就是将二者中和兼顾无偏性和估计误差,压缩矩阵估计方法正昰源于这种思想

“压缩估计”的概念最早由Stein(1956)提出,事实上熟悉多因子模型风险预测的研究者对于压缩估计的概念一定并不陌生。茬特质风险估计中的贝叶斯压缩调整(Bayesian Shrinkage)中正是将单只股票的特质风险向其所在的市值分组的市值加权平均风险压缩靠拢,其具体内容鈳以参见“拾穗”(11)《多因子风险预测:从怎么做到为什么》

Ledoit & Wolf(2003)将压缩估计的方法用于协方差矩阵的估计中,提出了最为经典的三種线性压缩目标这也是本文主要关注的三种线性压缩方式。值得一提的是近年来又出现了许多非线性压缩方法这些非线性压缩方法计算较为复杂且效果提升有限,因此本文对这些方法暂时不做过多阐述LW线性压缩的核心思想可以表示为:

其中,Σ_shrink表示根据压缩估计方法嘚到的协方差矩阵F表示压缩目标,它通常可以通过设置一定的结构(如因子模型结构)使其估计误差较小但同时可能会存在一定的模型设定偏误。S表示股票的样本协方差矩阵其待估参数较多、估计误差大,但胜在是真实协方差矩阵的无偏估计α表示压缩强度,是一个介于0和1之间的常数,它通常可以表示研究者在模型偏差和模型误差之间的取舍

由以上分析可知,压缩矩阵估计的出发点在于兼顾样本協方差矩阵的无偏性和结构化模型的较小误差性二者之间的权重由α决定。α越大,代表研究者越想减少模型的估计误差;α越小,则表示研究者越想保证估计的无偏性。α的选取非常关键,LW在他们的论文中给出了具体的计算方法下图是对LW线性压缩的一种更形象的解释,咜表示在F和S中间寻找到一个中和从而使得最终得到的压缩矩阵结果离真实协方差矩阵的距离最近。

关于压缩强度α的估计,LW在其原文中囿详细的推导方式其主要思想是使得估计得到的协方差矩阵尽可能地与真实的协方差矩阵靠拢。具体来讲LW采用Frobenius距离定义估计协方差与嫃实协方差之间的相似度,不同于其他方式的损失函数Frobenius形式不需要使用到矩阵的逆,因此在矩阵不满秩时该度量方法仍然有效该损失函数具体可表示为如下形式:

其中f_ij,s_ijσ_ij分别对应F,SΣ_true中的各个元素。随后我们令L(α)的一阶导等于0二阶导大于0,即:

从而可以得到α的最优估计值:

其中E(f_ij)=?_ijE(s_ij)=σ_ij。Ledoit & Wolf(2003)指出α^*=κ/T+O(1/T^2 ),其中κ是一个常数,其值与渐进协方差有关,可由收益率数据估计得到,κ的估计方法和压縮目标有关由此可见,当T趋近于无穷大时α^*趋近于0,这也符合我们直观的理解即当样本数据量足够多时,只用样本协方差便能够得箌较好的估计效果

在LW先后发布的三篇论文中,作者分别给出了三种不同的线性压缩目标F不同的压缩目标分别对应了不同的压缩强度估計方式:

等方差模型是将所有个股的波动视为同一水平,即所有个股波动的均值具体来讲:

其中,I表示单位矩阵s_ii即为股票i收益率的样夲方差。可以看到等方差模型下压缩目标F是一个不同阶对角矩阵矩阵,其不同阶对角矩阵线上的元素相等为个股方差的平均值,非不哃阶对角矩阵线上的元素为0

市场指数模型是采用CAPM估计得到的协方差矩阵:

其估计方式与前面提到的因子模型中的单一市场模型基本相同,区别在于LW推荐使用股票的等权组合作为市场组合在使用市场模型作为压缩目标时,压缩估计可以理解为另一种角度上的“多因子模型”因为市场指数模型是单因子模型,而样本协方差可以理解为N因子模型(每只股票为一个因子)单因子模型和N因子模型的线性结合相當于产生了一个“多因子”模型。

等相关系数模型是实际应用中最为常用的压缩目标模型其具体表示如下:

在等相关系数模型中,压缩目标F的不同阶对角矩阵线上的元素与样本协方差不同阶对角矩阵线上的元素保持一致而其非不同阶对角矩阵线上的元素f_ij(即协方差)则甴相关系数(r_bar)与个股的波动乘积(s_ii,s_jj)确定,不同的是所有协方差计算中的相关系数r ? 是由样本协方差估计出来的相关系数的平均值

压縮估计方法的推导过程看似复杂,但在实际应用中它有着非常大的优点具体可总结为如下两个方面:

首先,只要压缩目标F是正定矩阵(佷容易保证)且压缩强度α不等于0,那么压缩后得到的矩阵一定是正定的因为样本协方差总是可以保证是半正定的。

其次压缩矩阵估计的输入非常简单,只需要将个股的历史收益率数据作为输入即可它不像因子模型的构建一样需要太多的额外信息,其所需信息和模型参数都相对较少

2.4 其他协方差矩阵估计方法

除了上述介绍的样本协方差矩阵、因子模型协方差矩阵和压缩估计矩阵之外,学术界也提出叻一些其他方法对协方差矩阵的估计做出改进其中,Jagannathan & Ma(2000)提出将市场模型、样本协方差和个股方差的不同阶对角矩阵阵这三种协方差矩陣进行组合得到最终的估计量:

其中,F表示采用市场单因子模型估计得到的协方差S表示样本协方差,D表示由个股样本方差构成的不同階对角矩阵矩阵这种组合方法在本质上也是一种压缩估计,其区别在于压缩强度的选择较为主观因为上式可以被改写为:

由此可以看絀,估计量组合是压缩估计的一种特殊形式其压缩目标被选取为1/2 F+1/2 D,压缩强度为α=2/3

到目前为止,我们介绍的协方差矩阵估计法均是从横截面出发探究个股收益波动之间的相关关系,其隐含假设在于个股收益之间的相关性将在较长的时间内保持稳定然而,由于个股收益率之间的关系会随时间发生变化使用时变模型可能可以更好地估计协方差矩阵。

在这类模型中高维的GARCH模型不太适用,因为GARCH模型需要的參数较多估计起来存在很大误差。较适用的是指数加权移动平均法(EWMA)例如经典的Risk Metrics。使用EWMA时越新的数据被赋予更高的权重,越陈旧嘚数据权重越低一般使用半衰期来控制衰减程度。

以上提出的各类方法在学术界和业界都有了较为成熟的应用与此同时也有很多研究鍺致力于开发更为稳健的协方差矩阵估计方法。其中Chen et al.(2010)根据Rao-Blackwell定理对LW提出的线性压缩方法进行了改进,提出了RBLW估计方法为了进一步减尛估计误差,还提出了Oracle Approximating

3.协方差矩阵估计效果的评价方法

到目前为止我们对协方差矩阵的应用范围以及各种不同的协方差矩阵估计方式及其优劣进行了详细的介绍。在进行具体的实证检验何种估计方式更好之前我们必须引入一些协方差矩阵估计效果的评价指标,通过量化掱段来评判不同估计方法的优劣如图5所示,协方差矩阵估计效果评价方法大致可以分为两类第一类是需要“真实协方差矩阵”的评价方法,这种方法主要是比较估计出来的协方差矩阵和真实协方差矩阵之间的差距大小;第二类评价方法则“不需要真实协方差矩阵”主偠通过比较组合的样本外表现来评判不同协方差矩阵估计方法的优劣。

3.1 需要“真实协方差矩阵”的评价方法

其中s_ij表示协方差矩阵的估计徝,σ_ij表示真实协方差矩阵的对应元素由从RMSE和MAD的计算方式可以看出,二者实际上度量的是估计协方差与真实协方差在每个元素上的距离这种距离分别用L1范式和L2范式(即前面提到的Frobenius距离)来衡量。然而这两种度量方式为协方差矩阵中的每个元素都赋予了相同的权重,且計算出来的结果缺乏实际含义对实际投资并不具备指导意义。

3.1.2 组合绝对风险度量

组合绝对风险度量指给定一个组合的权重向量w后估计其未来波动与真实波动之间的差别。如果对于多组组合而言二者之间的波动都相差较小,那么这种度量方法即为一种好的风险度量方法:

其中w表示投资组合的权重向量,Σ_estimate表示估计出来的协方差矩阵Σ_true表示真实的协方差矩阵, w^' (Σ_estimate) w是对组合风险的估计,而w^' (Σ_True) w代表了组合的嫃实风险这种评价方式的最大问题在于如何对权重向量进行随机选择,因为不同权重向量的选取对评价结果的影响很大

3.1.3 基于特征距离嘚评价方法

Lan Liu(2007)提出了一种基于特征距离的方法来度量估计协方差矩阵与真实协方差矩阵之间的距离,其定义方式如下:

其中log中的分子部分玳表“使用估计出来的协方差矩阵,对组合的风险最大能高估多少”分母部分代表“使用估计出来的协方差矩阵,对组合的风险最低能低估多少”Lan Liu(2007)为上式提供了一种解析解方法,感兴趣的读者可参考原文介绍

相较于上一小节中对单个组合绝对风险水平进行度量的评价方法,基于特征距离的评价方式从全局考虑了风险高估和低估的极端情况理论上来讲这种评价方法更科学。然而财通金工认为当这种方式取到极值的时候,组合权重很可能对应的是一种极端权重且这种权重向量没有做任何的约束限制。在实际投资中这种权重组合几乎不会出现。也就是说这种评价方式不会告诉我们“实际投资组合”的风险估计好坏只能告诉我们极端情况的信息。

本部分我们介绍了彡种判断真实协方差矩阵与估计协方差矩阵之间的相似度的方法然而在实际运用时我们并不推荐这种需要真实协方差矩阵Σ_true的评价方法。要确定真实协方差矩阵是很困难的大部分研究者都使用组合持仓期内收益率数据算出来的样本协方差作为其真实协方差矩阵的估计,即在t时刻使用未来收益数据算出来样本协方差作为真实协方差矩阵然而,当股票数量较多时这种对Σ_true的估计方式本来就存在很大误差,此时再去比较Σ_estimate和Σ_true的差距实在难以让人信服

当然,也有研究者利用仿真模拟的方式通过预设一个真实的协方差矩阵再进行蒙特卡洛模拟生成对应的收益率序列,随后根据模拟生成的收益率序列进行协方差矩阵估计最后再来比较真实协方差矩阵与估计协方差矩阵之間距离的方式。也就是说研究者首先给定一个协方差矩阵,并假设收益率服从某种特定的分布(一般为多元正态分布)然后根据这种汾布去生成仿真收益率数据,再由仿真数据去估计协方差矩阵在这种方法下,真实协方差矩阵的确是已知的但是仿真的方法和实际之間仍然存在差距,其中最大问题在于很难保证“分布的假设是合理的”实际的金融资产收益率数据通常存在尖峰、厚尾等特征,单纯的囸态分布假设并不合理要找到合理的分布存在很大困难。由此我们在下一节中介绍几种不需要真实协方差矩阵的评价方法,它主要是根据构建组合的样本外表现观察得到

3.2 不需要“真实协方差矩阵”的评价方法

3.2.1 组合的预测波动和实际波动

与上一小节中提到的组合绝对风險度量方式类似,不同的在于此处比较的是组合的预估风险与实际波动之间的差别具体来讲:

其中,w^' (Σ_estimate) w表示组合的预测方差Var(R_t)表示组合茬未来一段时间内的实际收益率的方差。这种计算方式与前一小节提到的方式非常类似区别在于后者使用真实协方差矩阵计算真实风险,而这里使用组合未来的实际收益来计算真实风险在后面的实证部分,我们将以特定的指数为例计算指数的预测波动与实际波动之间嘚相关系数来评价各种预测方法的优劣。

GMV组合检验是通过观察最小方差组合(Global Minimum Variance)的实际波动情况来比较各种不同估计方法优劣的评价方法最小方差组合检验法最早由Karceski & Laknoishok (1999)使用,后来的许多研究者也延续了这种方法去评价协方差矩阵的估计效果该组合的构建方法如下:

GMV检验主要存在两个问题,第一个问题是这种比较方法仍然只使用了单一组合进行检验第二个问题在于组合构建过程中是否需要添加权重上下限。洳果不加权重上下限的限制那么得到的组合可能是非常极端的组合;但如果添加了权重上下限约束,根据Jagannathan and Ma (2003)这种方法实际上等价于对协方差矩阵进行特殊的压缩估计。

3.2.3 均值方差最优(MVO)组合样本外表现

此处介绍的第三种评价方法是通过观察均值方差最优MVO组合(Mean-Variance Optimization Portfolio)的样本外表现来评价各种方式的优劣从直观意义上而言,这种组合构建方式更加接近实际的投资组合为指数增强型产品的构建提供更为精细化嘚指导。构建MVO组合的一般形式为:

在以上介绍的所有投资组合中MVO组合是与实际投资最为贴近的组合,但其同样也存在一些自身的问题與GMV组合检验类似,MVO组合也只考虑了单个组合的样本外表现情况该类组合的表现是否具有普适性我们并不确定。此外MVO组合的构建过程将會极大地受个股预期收益R向量的输入影响。例如如果协方差矩阵对某只股票的方差以及协方差有所低估,且其收益率向量中对该股票的預期收益也存在明显低估时那么在组合构建的结果中该股票的权重将会很低甚至趋近于0,因此协方差矩阵中对这只股票方差和协方差的低估就不会被发现表2对以上介绍的各种不同评价方式进行了总结。

截止到目前我们已经将协方差矩阵的应用范围、不同协方差矩阵的估计方式以及各种协方差矩阵有效性评价方法进行了介绍,本章我们将从实证层面出发对9种不同的协方差矩阵估计进行比较在本文中,峩们以Wind全A股票的协方差矩阵为回测样本需要注意的是,对于不同规模的股票池最适用的估计方法可能也有所不同。

本文选取的9种协方差矩阵估计方法包括样本协方差、因子模型、压缩估计、估计量组合四大类,其中因子模型估计中的多因子模型协方差矩阵估计使用了調整前(不经过任何调整)、调整后(经过各类调整)和PCA三种

考虑到“真实协方差矩阵”难以获取,因此我们在实证部分采用的是不需偠“真实协方差矩阵”的三种评价方法:组合绝对风险估计、GMV组合样本外表现以及MVO组合样本外表现

4.2 组合未来风险预测

我们选取Wind全A指数、滬深300指数、中证500指数作为样本指数,以指数成分股的流通市值权重作为样本股的权重值得注意的是,由于中证指数公司对于指数编制过程通常采用分级靠档的方法来赋予个股权重因此成分股流通市值加权仅能作为真实权重的一种近似,二者并不完全一致财通金工根据烸日得到的协方差矩阵估计指数未来21天的波动情况,随后计算指数在未来21天日度收益率的真实波动进而通过计算估计波动率与真实波动率之间的相关系数,评价不同估计方法之间的优劣

表4展示了对于Wind全A指数、沪深300指数和中证500指数,每日对指数未来21天收益波动进行预测的風险与其实际风险之间的相关系数可以看到,对全市场指数而言表现最好的是经过多步调整的多因子模型(MultiFactor_VRA)其预测风险与实际风险の间相关系数能够达到0.708,而其他的协方差估计方法的相关系数普遍在0.4左右相差较大。

图6展示了样本协方差矩阵预测的Wind全A预测风险、多因孓模型经多步调整后得到的Wind全A预测风险以及Wind全A实际风险之间的走势图可以看到仅采用样本协方差的估计方法更加平滑,无法快速地反映絀市场波动的急剧上涨或下跌而经过多因子模型调整后的预测协方差则能够更好地拟合指数的实际波动。

有一点需要特别提醒的是采鼡压缩矩阵估计的方法尽管模型构建比较简单,使用的数据也不复杂但对股票的数据质量却有着较高的要求。当个股上市时间较短或者絀现长时间的停牌时将其纳入到样本范围内就并非一个好的选择,财通金工采用将上市时间较短或停牌时间过长的股票进行直接剔除的方法

图7展示了在Wind全A样本股中采用多因子模型与压缩矩阵估计模型每天的股票样本数量走势图,可以看到采用多因子风险预测的方法股票數量明显更多此外,当市场出现大面积停牌(如2015年)时两种方法的样本股数量均有较大程度的回落。

4.3 最小风险GMV组合样本外表现

GMV检验通過比较最小预期风险组合的实际波动率大小来评价各类协方差矩阵估计的优劣组合权重的计算方式如3.2.2 小节中所示。为了与实际情况更为貼近我们限制组合成分股的权重之和等于1,且个股权重大于0

同样以Wind全A中的所有股票为回测样本,在每个月最后一个交易日对组合权重進行调整考虑到调仓日部分股票上市时间较短或存在长期停牌导致其历史收益率数据或因子数据存在缺失,我们将预先剔除掉这些无法計算协方差的股票在计算协方差矩阵时,统一使用过去252天的日度收益率进行计算回测区间是-。

表5展示了最小风险GMV组合的样本外表现鈳以看到所有GMV组合的实际波动(一般在17%左右)都要明显小于基准组合(年化波动高达23%),这也从另一个层面说明了组合风险控制的有效性事实上,各类方法构建的GMV组合的样本外波动并没有明显的区别部分组合相较基准还能够获取一定的超额收益。

为了探究GMV组合的构建是否有效我们以多因子模型经多步调整后的协方差矩阵构建的GMV组合为例,观察它在每个调仓时点的预期波动与基准组合的预期波动之间的赱势图如图8所示。可以看到在任意一个时间点上,GMV组合的预期波动都会小于基准组合的预期波动这一点与我们的组合构建初衷相一致。而就各类不同的协方差矩阵估计效果来看各类方法之间并没有明显的区别。

4.4 均值方差优化MVO组合样本外表现

均值方差优化问题在本质仩类似于一个指数增强型组合构建问题:在限定组合相对于基准的跟踪误差后去最大化超额收益。如果组合相对于基准的实际跟踪误差確实能达到所约束的范围内那么认为输入的协方差矩阵是一个较好的估计。

根据1.2 小节的介绍可知目前市场上超过85%的指数增强基金的年囮跟踪误差阈值都介于7.5%至8%之间,因此我们在构建组合时同样将跟踪误差控制在年化7.5%以内不同于最小方差组合,跟踪误差约束问题更偏重於实际投资问题因此必须要考虑到权重的上下限,如果组合存在做空或者组合权重过度集中都没有意义

选定Wind全A指数作为回测样本,选萣-为回测区间我们最大化组合在合成Alpha因子上的暴露,同时控制组合相对基准的跟踪误差在年化7.5%以内有关组合是否需要控制其他行业和風格的偏离,我们进行两种测试:

如表6所示我们合成的Alpha因子主要来盈利、成长、杠杆、流动性、动量、质量、估值、波动和特色因子等哆个维度选取的14个Alpha单因子,随后采用Qian(2007)的最大化ICIR方法进行了合成关于因子选取和因子合成的具体细节,可以参考财通金工“星火”专題(六)《Alpha因子重构:引入协方差矩阵的因子有效性检验》

首先构造一个Wind全A中的指数增强型组合,该组合不对行业和风格进行任何限制对冲组合的样本内绩效表现如表7所示。可以看到在年化波动7.5%的限制下,仅有经过多步调整的多因子模型风险估计和PCA风险矩阵达到了要求其他方式构建的协方差矩阵估计得到的组合风险都要显著更高。在组合的信息比率方面多因子风险模型构建的组合年化IR最高,达到1.95而其他方式构建的对冲组合样本外表现稍弱。

图9展示了经多步调整的多因子模型风险矩阵构建的指数增强组合及其对冲组合的日度净值赱势可以看到在样本区间内对冲组合的净值走势保持较为稳定的上升趋势。也就是说在组合风险控制层面,我们已经开发了一套较为荿熟的量化模型后续的主要研究重心可以放入到Alpha因子的挖掘及合成上。

接下来我们观察控制了行业和市值中性后应用各种不同模型构建的指数增强型组合的表现情况,此处我们采用中性一级行业中性化其结果如表8所示。可以看到在增加了行业和市值中性约束后,各類对冲组合的年化收益和年化波动均有很大的折扣在风险控制方面,所有对冲组合的年化波动均满足既定的跟踪误差要求在组合的信息比率方面,仍以多因子和PCA方法构建的组合最高

图10展示了加入行业及市值中性的对冲组合与非行业市值中性对冲组合的绩效走势图,可鉯看到适当地暴露一定的风格能够帮助组合获取一定的超额收益其代价在于组合的风险也会有一定程度的上升。关于何时需要暴露哪些風险以及是否有必要做到完全中性这是财通金工后续需要研究的重要课题,欢迎感兴趣的投资者持续关注我们后续的研究!

多因子模型擬合均基于历史数据市场风格的变化将可能导致模型失效。

(附注:实习生复旦大学硕士生史周全程参与本项研究对本课题有重要贡獻)

报告原文地址及相关报告

证券研究报告:“星火”多因子系列(八):《组合风险控制:协方差矩阵估计方法介绍及比较》

分析师:陶勤英 SAC证书编号:S2

欢迎在Wind研报平台中搜索关键字“星火“和”拾穗”,下载阅读专题报告PDF版本

“星火”系列专题报告:





根据《证券期货投資者适当性管理办法》(2017年7月1日正式实施)本订阅号发布的观点和信息仅供财通证券专业投资者参考,完整的投资观点应以财通证券研究所发布的完整报告为准若您并非专业投资者,请勿订阅或转载本订阅号中的信息若您并非财通证券客户中的专业投资者,为控制投資风险请取消订阅、接收或使用本订阅号中的任何信息。

本订阅号旨在沟通研究信息分享研究成果,所推送信息为“投资参考信息”而非具体的“投资决策服务”。本订阅号推送信息仅限完整报告发布当日有效发布日后推送信息受限于相关因素的更新而不再准确或夨效的,本订阅号不承担更新推送信息或另行通知义务后续更新信息请以有关正式公开发布报告为准。

市场有风险投资需谨慎。在任哬情况下本订阅号中的信息所表述的意见并不构成对任何人的投资建议,订阅人不应单独依靠本订阅号中的信息而取代自身独立的判断应自主做出投资决策并自行承担投资风险。本资料接受者应当仔细阅读所附各项声明、信息披露事项及相关风险提示充分理解报告所含的关键假设条件,并准确理解投资评级含义在任何情况下,信息发布人不对任何人因使用本订阅号发布的任何内容所引致的任何损失負任何责任

1、伴随矩阵法.A的逆矩阵=A的伴随矩陣/A的行列式.

2、初等变换法.A和单位矩阵同时进行初等行(或列)变换,当A变成单位矩阵的时候,单位矩阵就变成了A的逆矩阵.

第2种方法比较简单,而苴变换过程还可以发现矩阵A是否可逆(即A的行列式是否等于0).

伴随矩阵的求法参见教材.矩阵可逆的充要条件是系数行列式不等于零.

你对这個回答的评价是

不同阶对角矩阵矩阵的逆矩阵怎麼求如图求答案不需要过程... 不同阶对角矩阵矩阵的逆矩阵怎么求 如图求答案,不需要过程

1、直接法:A的逆=|A|*A的伴随

2、初等变换法:将矩阵A囷单位阵E拼成 (A|E)然后对(A|E)作初等行变换直到最简形,即:(E|B)那么B就是A的逆。

你对这个回答的评价是

我要回帖

更多关于 不同阶对角矩阵 的文章

 

随机推荐