摘要:选取2016年以来的月度数据进行研究发现,以OMO利率、CPI、社融-M2为基础的三因子模型可以从线性角度对10Y国债进行描述,且拟合优度较高(=0.84)。模型排除了多重共线性、异方差等问题。
我们以Bernanke三因子模型为基础,结合机器学习方法,对10Y国债的点位进行测算。
选取2016年以来的月度数据进行研究发现,以OMO利率、CPI、社融-M2为基础的三因子模型可以从线性角度对10Y国债进行描述,且拟合优度较高(=0.84)。模型排除了多重共线性、异方差等问题。
进一步的,我们对上述三个因子的滞后值重新进行建模以解决不便预测的问题,并纳入机器学习方法提升预测准确度。滚动窗口回测发现,基于上述三因子的机器学习模型的历史真实预测效力较好(=0.90),较线性模型有明显提升(=0.54)。
结论上,6月10Y国债均值预测结果为1.68%,故认为市场中短期内以震荡为主,较难产生趋势。不过,当前外部关税、内部政策对冲等因素不确定性仍大,仍应关注外生扰动的冲击。
海外关税政策反复,近期市场出现震荡。
在先前的报告中,我们对10Y国债进行过结构性描述,但在预测方面仍有短板,主观因素参与过多是其主要问题。为解决这一问题,我们参考Bernanke三因子模型进行优化,并利用机器学习的方法对更新后因子的滞后值进行建模预测,有效的排除了主观误差,提升了预测效力。
1. Bernanke三因子模型:对10Y国债具有结构性的解释能力
Bernanke三因子模型是前美联储主席Ben S.Bernanke于2015年提出的一个长端利率拆分模型,其基本含义是长端利率可以拆分为未来实际短端利率、通胀预期和期限溢价三个部分。这一拆分对于美国国债有较好的解释力。
我们发现,就10Y国债而言,上述结构性拆分在一定程度上仍旧适用。如果以短端政策利率替代未来实际短端利率,假设市场维持适应性预期并以当前通胀水平替代通胀预期,以经济景气度的变化来表征期限溢价,则上述框架可以用于描述10Y国债到期收益率。其计量表达式的描述如下:
10Y国债到期收益率=α*短端政策利率+β*通货膨胀+γ*经济景气度因素+C
其中,α、β、γ是三个因素的系数,C为常数。结合实际情况,短期政策利率选择7日OMO利率,通货膨胀因素选择CPI,经济景气度因素用社融数据和M2数据的差来表示。数据频率选择月度,统一到月度均值。
选取2016年以来的数据,采用OLS方式对上述表达式进行计量检验发现,α拟合值为1.6448(P=0.0000),β拟合值为-0.1049(P=0.0000),γ拟合值为0.0212(P=0.0816),常数C拟合值为-0.5186(P=0.0224),模型拟合优度为0.84。上述结果均为稳健标准差下结果,所有因子均在10%水平上显著,且不存在严重多重共线性问题,拟合具有有效性。此外,时间趋势项T在本模型中系数不显著。这一结果说明,调整后的Bernanke三因子模型对于10Y国债有结构性的解释能力。
进一步的,我们以10Y-1Y利差为被解释变量,以“社融-M2”为解释变量进行单变量的OLS回归,以验证使用经济景气度的变化来表征期限溢价这一替换是合理的。检验发现,“社融-M2”系数为-0.0437(P=0.0000),在1%的水平上显著。模型拟合优度为0.24。这一检验验证了二者的相关关系,说明了因子选择的合理性。
至此,我们得到了以Bernnanke三因子模型为基础,描述10Y国债结构的结构化表达式,即:
10Y国债到期收益率=1.6448*OMO利率-0.1049*CPI+0.0212*(社融-M2)-0.5186
2. 滞后因子:修改模型为用于预测
第一部分的模型描述了同时期下10Y国债的走势,可以用于解释历史情形,但预测能力仍旧较弱。对未来某一时期T而言,T期的OMO利率、CPI、社融-M2数据均是未知的。尽管可以通过预期值来替代,但这引入了较多的主观因素而增大了误差。
为了提升模型的预测效力,我们考虑使用自变量的滞后数值来替代同期值重新进行建模。这样在短期预测中,所有的自变量都是已知的,可以在不引入主观因素的情况下进行计算。同时滞后项可以起到工具变量的效果,排除潜在的内生性问题。
从数据公布的时点来看,CPI、社融、M2数据多在次月月中公布,而OMO利率的值是每日公布的。这就意味着,CPI、社融-M2两因子需要滞后2期以保证在T月初存在数据,7日OMO利率滞后1期即可。据此,我们可以重新得到如下表达式:
10Y国债到期收益率=α*lag(短端政策利率)+β*lag2(通货膨胀)+γ*lag2(经济景气度因素)+C
同样选择2016年来的数据,采用OLS方式对上述表达式进行计量检验发现,α拟合值为1.5970(P=0.0000),β拟合值为-0.0972(P=0.0000),γ拟合值为0.0250(P=0.0368),常数C拟合值为-0.4371(P=0.0461),模型拟合优度为0.81。上述结果均为稳健标准差下结果,各因子在5%水平上显著。据此我们可以得到新的表达式:
10Y国债到期收益率=1.5970*lag(7日OMO利率)-0.0972*lag2(CPI)+0.0250*lag2(社融-M2)-0.4371
对比先前的表达式可以发现,尽管模型的拟合优度略有下降,但系数显著性没有降低,个别因子显著性甚至得到了提升。该结果一方面验证了经济数据的粘性,另一方面也验证了先前的适应性预期假设,即市场倾向于用最近一期可得的统计值来研判真实情况。
3.机器学习:提升预测准确率
在滞后因子的基础上,我们纳入机器学习的方法来提升预测准确率。机器学习可以视作一种非线性回归,能够挖掘因子间的非线性关系,提升模型的拟合优度和预测效力。
我们选取了机器学习中的随机森林回归方法(RandomForest Regressor)进行建模,以利用其抗异常值、适应小样本的优势。该方法首先从原始数据中进行Bootstrap采样,而后进行会针对每个训练子集构建回归树,并基于最小化均方误差(MSE)的原理计算最优分裂点,直到达到最大深度、节点样本数小于阈值或无法进一步降低MSE时停止生长。预测时,根据每个回归树的结果进行等权集成,得到最终的预测结果。
同样选择2016年以来的数据,对滞后因子利用随机森林回归的方式进行建模。其中,目标变量是10Y国债到期收益率,特征值是7日OMO利率的滞后1期值、CPI的滞后2期值、社融-M2的滞后2期值、外加时间趋势T。按照70%、30%的比例对样本划分为训练集和测试集,分别用于模型训练和检验模型效力。重要参数方面,n_estimators设定为5000,random_state设定为42。
结论上,我们发现,模型具有较好的样本内训练结果和可以接受的样本外测试结果。其中,模型训练集拟合优度为0.993,测试集拟合优度为0.859,均高于线性模型的拟合优度。考虑到线性模型对历史数据的拟合属于样本内结果,机器学习方法下的拟合优度有明显的优势。
4.滚动窗口回测:机器学习方法下预测效力较强
为了进一步检验模型的效力,我们利用历史数据进行滚动窗口的样本外预测,用于检验历史真实情况下的模型预测效力。模型的构建方式同前文一致,因子选取滞后值,分别采用OLS模型和随机森林回归模型进行建模,而后滚动窗口进行回测。窗口宽度固定为70。
对比发现,随机森林回归模型较OLS模型预测效力更强,且更为稳定。就回测结果而言,OLS模型的MSE为0.0632,RMSE为0.2514,为0.5427;相对的,随机森林回归模型的MSE为0.0138,RMSE为0.1173,为0.9004,预测效力明显更好。
单就OLS模型而言,观察其滚动窗口的系数可以发现,CPI、社融-M2两因子的系数总体较为稳定,变化不大,但OMO利率的系数和常数项的数值在中期内发生了一定幅度的变化,前者呈现增加态势,后者呈现出一定的减少态势。这意味着,对于长期点位的结构性描述需要关注模型结构的变化。同时,OMO利率系数的趋势性提升也意味着短端政策利率对市场的影响力在持续增加,政策变化带来的情绪变化带来了更大的的市场振幅。
5.结论:6月10Y国债均值预测结果为1.68%
根据上述分析,我们可以选取随机森林回归模型对国债的6月点位进行预测。模型的特征中,OMO利率、CPI、社融-M2的滞后值均是已知的,可以直接带入已有数据进行预测。为了使预测值接近滚动回测准确度,采用2016年以来的全样本重新进行建模,并预测6月的数值,可以得到结果为1.68%。该数值与当前市场实际值接近,故认为,场中短期内以震荡为主,较难产生趋势。
关于上述结论,仍有两点需要注意。
第一,上述结果为中枢值,无法描述短期的情绪性波动。当前海外关税政策动荡,国内酝酿增量政策对冲海外影响,导致多空因素交织,市场或有意料外的情绪性变化。模型以月度均值为单位,从中期的结构性因素入手,其效力应客观看待。
第二,机器学习模型的可解释性仍旧较弱。从最终结果来看,尽管拟合优度来到0.9,但其仍存在一定的系统性偏差,模型拟合值历史上较真实值略高,平均幅度为6BP。这意味着市场惯性走强的背后可能有更为稳定的驱动因素,目前尚未捕捉到。另外,当前市场超常规因素较多,模型对于全新情形的解释力度会受到削弱。
总的来看,本研究从定量的角度入手,给出了一个可以用于短期点位预测定量分析框架,对于辅助研判市场走势、制定投资策略有积极的作用。
海外市场波动风险:长时间通胀对美欧市场造成一定负面影响,企业成本上升,居民需求下降,工业品和消费品价格上涨。同时,特朗普的上台激化了美国的逆全球化思潮,其关税政策的不确定性影响到了全球经济增长,加剧了外部不确定性
地缘冲突风险:俄乌冲突及巴以冲突仍存在较大不确定性。随着北约对乌克兰的持续支持和俄方立场的持续强硬,俄乌战争局势仍不平稳。同时,巴以冲突持续,周边国家有卷入冲突、扩大冲突的风险。受此影响,全球金融市场可能出现一定的波动,甚至出现区域性系统风险。需要考虑到风险在全球的传导并加以防范。
宽信用加速风险:随着稳增长政策的持续出台,宽信用进程不断推进,政府债供给充裕。随着基建、投资拉动的推进,宽信用存在加速的可能,将使得市场风险偏好升高。考虑到当前流动性局面较近年更为复杂,信用走宽叠加流动性的加速转向或推动市场转向,造成债券收益率上行,价格下跌。
曾羽:中信建投证券固定收益首席分析师,研究发展部总监。四川大学经济学学士、硕士,金融硕导。曾从事房地产监管及市场分析工作,现深耕固定收益研究领域,对地方政府债务及房地产债务有长期深入研究。多年新财富、水晶球等评比最佳上榜分析师,其中2016年新财富固定收益第一名。
曲远源:中信建投证券固定收益研究员,南开大学金融学硕士,经济学学士。主要研究宏观经济、产业债,采用模型化的方法开展研究
证券研究报告名称:《基于Bernanke三因子模型的点位测算——机器学习与传统方法的结合》
对外发布时间:2025年6月2日
报告发布机构:中信建投证券股份有限公司
本报告分析师:
来源:点滴财学