手机版 欢迎访问伴佳68(www.banjia68.com)网站

当前位置: 主页 > 分析

使用随机森林方法定量分析理财利率影响变量——华创投顾部理财系列专题之二20181230

时间:2023-06-02 17:17|来源:网络|作者:小编|点击:

  原标题:使用随机森林方法定量分析理财利率影响变量——华创投顾部理财系列专题之二20181230

  在《华创投顾部理财系列》第一篇专题(以下简称“上篇专题”)中,我们聚焦于银行理财负债端研究,讨论了影响理财利率的各种变量。但是仅仅定性分析是不够的,我们选择了机器学习算法中的随机森林方法来衡量不同变量与理财利率之间的关系,这对指导业务实践具有更重要的意义。

  2、自变量:从资产、负债端、监管等维度综合考虑,具体而言,主要基于各类资产回报率综合决定理财利率、存量资产收益和负债刚性也是理财影响变量、非保净值化和现金管理产品化影响大、理财竞争加剧等四个维度寻找自变量。此外,我们还需要考虑银行其他负债来源的比较。除了理财产品外,银行也可以通过发行同业存单、存款等途径吸收负债。

  随机森林方法相对于其他方法最大的不同即为引入了更多的模型(其他方法只有1个),取各个模型的优点,以此获得更高的预测准确度。(具体介绍详见正文部分)

  随机森林方法实验结果优于传统的计量方法。最后的实验结果显示,R方为0.95,远高于传统计量方法未引入自回归的结果。

  资产端比资金利率更加决定理财利率。除了准确性以外,随机森林方法还能够得到各个自变量对于模型的重要性排序。从结果可以看出,重要性比较显著的是10年国债到期收益率和3年期AA企业债收益率。而代表资金市场利率的3个月同业存单、1个月shibor和R007得分相对较低,因此资产端比资金利率更加决定理财利率;尽管股市和非标在一定时期对理财利率起到牵引作用,但整体而言它们对理财利率的影响相对较小;非保本理财占比对结果有一定的重要性,体现出资管新规等监管规则对理财的影响。

  根据上文,10年国债到期收益率和3年期AA企业债收益率是最影响理财利率的两个变量,那么对未来理财利率的预测则主要围绕着十年国债和3年AA信用债收益率预测展开。我们认为随着宽货币向宽信用的逐步传导,有望逐步改善市场对经济基本面的悲观预期,央行货币政策继续放松空间有限,低评级信用债行情难现,预计债券收益率整体下行空间有限,因此未来短期理财利率或将保持震荡,向下空间不大。

  在《华创投顾部理财系列》第一篇专题(以下简称“上篇专题”)中,我们聚焦于银行理财负债端研究,讨论了影响理财利率的各种变量。但是仅仅定性分析是不够的,比如各个变量分别对理财利率走势产生了多大的影响呢?资管新规等监管文件是否已经影响到理财利率呢?本文中,我们选择了机器学习算法中的随机森林方法来衡量不同变量与理财利率之间的关系。不同于传统计量方法需要依据数据结构特征选择模型,随机森林方法不仅能够给出比单一模型更优的结果,而且还能够同时提供各个变量对于预测理财利率的重要性排序,这对指导业务实践具有更重要的意义。

  因变量理财利率有两种可能的数据来源:一是直接利用wind里全市场3个月理财周度数据。根据wind的解释,该指标具体为当周开始发行(销售起始日期)的所有银行理财产品预期年收益率的算术平均值。二是可以根据某大行的理财发行数据(取3个月人民币产品)计算。如当日有产品发行则将当日发行所有产品的预期年收益率算术平均值作为当日理财利率;对于未有产品发行日期的理财利率,则用前值有数据的点代替。这样处理将数据粒度缩小到日度,但是实际数据波动较大。从数据的平稳度和预测的实际效果(能够预测出周度理财利率已经足够了),我们最终选择了wind周度数据作为因变量,因此实验数据以周为单位。

  维度一:各类资产回报率综合决定理财利率。银行理财资金在各类基础资产间轮动,寻找高息资产,因此各类基础资产的综合回报率将决定理财收益率。我们认为同业存款利率限定理财利率的下限,高息资产对理财利率形成牵引。不同的时期高息资产有所差异:11年非标收益较高,13年债市行情回暖,15年股市进入牛市,这些资产都可能成为我们的自变量。

  更进一步,我们从最新的17年理财年报中披露的银行理财产品资产配置情况来来看,债券、非标、现金及银行存款、权益类和拆放同业及买入返售排名比较靠前。对于债券类资产,我们可以使用10年国债、3年期AAA企业债和AA企业债收益率来代表;非标资产可以取6个月票据转贴利率作为自变量;对于现金及银行存款,考虑到协议存款没有高频历史数据,我们使用同为资金利率的1个月shibor来替代;权益类资产即为上证A股指数;拆放同业及买入返售为银行间质押式回购7天加权利率(R007)。

  维度二:存量资产收益和负债刚性也是理财影响变量。因为银行理财投资时普遍使用资金池模式,期限错配下理财利率和资产收益率变化有时候就不一定同步。并且即便资产端出现亏损,银行通常会考虑首先维系负债。因此,理财利率变化具有一定的滞后性,即前期理财利率会影响到本期理财利率的表现情况,对应于传统计量分析中的自回归。考虑到一旦引入自回归,实验结果就会虚高,因此我们不考虑因变量的任何形式作为自变量。

  维度三:非保净值化和现金管理产品化影响大。近两年,资管新规等一系列监管政策对于理财利率产生较大影响,主要体现在非保净值化,因此我们使用非保本理财占比作为自变量之一(实际使用时为5周中心移动平均)。

  维度四:理财竞争加剧。银行之间的竞争环境也会对理财利率产品影响,面对同地区越来越多的机构,银行可能不得不被动提高理财利率应对。我们使用新发售理财数量刻画这一因素的影响(实际使用时为5周中心移动平均)。

  此外,我们还需要考虑银行其他负债来源的比较。除了理财产品外,银行也可以通过发行同业存单、存款等途径吸收负债。

  在介绍具体的随机森林方法之前,我们对问题进行描述:假定有M个因变量和1个自变量,数据样本空间为N。传统的计量方法或一般的机器学习算法会将N个样本按照一定的比例划分为训练集和检验集,而后在训练集产生单一模型,最后将该模型用于检验集,因变量预测值和真实值之间的差距即可计算出该模型的效果(对于回归问题为R方等)。

  随机森林方法不划分训练集和检验集,它通过无放回取样的方法从样本空间中抽取训练样本空间(次数为N,但是因为是无放回取样,因此实际的训练样本空间会小于N),然后在该样本空间上训练出一个模型。因为训练样本空间小于N,因此剩下来未被取到的样本空间可以作为检验集用于评估模型效果(因此随机森林方法不需要人工划分训练集和检验集)。上述过程为第一个模型(随机森林方法中使用的是决策树模型,关于决策树模型可参考任何一本机器学习教材分类部分),我们可以重复该过程得到K个模型,最后的预测可以使用K个模型的综合结果(比如对于分类问题可以采用票数最多的分类结果,对于回归问题可以使用K个预测结果的平均值)。打个看医生的通俗比方,其他方法只用一个模型相当于选择固定的一个大夫,大夫的水平可能参差不齐,直接决定预测结果可能很差;但是随机森林K个模型相当于去找了K个大夫,最后的预测结果取决于K个大夫的综合判断,因此随机森林方法相对于其他方法具有天然的优越性。

  综合而言,随机森林方法相对于其他方法最大的不同即为引入了更多的模型(其他方法只有1个),取各个模型的优点,以此获得更高的预测准确度。

  在实践中,我们的数据时间段为10年6月到18年6月,对于空值,我们使用临近数据填充。随机森林方法中模型个数K为200个,其他均采用默认参数(限于篇幅,本文不对具体的算法和实验细节过多阐述,如对实验细节感兴趣,欢迎联系作者)。

  随机森林方法实验结果优于传统的计量方法。最后的实验结果显示,R方为0.95,远高于传统计量方法未引入自回归的结果。这也从侧面证明随机森林方法的有效性和准确性。

  除了准确性以外,随机森林方法还能够得到各个自变量对于模型的重要性排序,具体做法如下:分别将各个变量数据全部改为噪声,以此构造模型,模型的准确性下降得越大,证明该变量越重要。这就好比评估团队中每个人的贡献度,分别将每个人踢出团队后,如果团队战斗力越差,越说明踢出去的这个人对团队更加重要。

  资产端比资金利率更加决定理财利率。图表5显示了各个自变量的重要性得分,从结果可以看出,重要性比较显著的是10年国债到期收益率和3年期AA企业债收益率。而代表资金市场利率的3个月同业存单、1个月shibor和R007得分相对较低,因此资产端比资金利率更加决定理财利率;尽管股市和非标在一定时期对理财利率起到牵引作用,但整体而言它们对理财利率的影响相对较小;非保本理财占比对结果有一定的重要性,体现出资管新规等监管规则对理财的影响。

  根据上文,10年国债到期收益率和3年期AA企业债收益率是最影响理财利率的两个变量,那么对未来理财利率的预测则主要围绕着十年国债和3年AA信用债收益率预测展开。我们认为随着宽货币向宽信用的逐步传导,有望逐步改善市场对经济基本面的悲观预期,央行货币政策继续放松空间有限,低评级信用债行情难现,预计债券收益率整体下行空间有限,因此未来短期理财利率或将保持震荡,向下空间不大。

  综合而言,我们通过引入机器学习中的随机森林方法量化分析了影响理财利率的各个变量。最终结果显示资产端比资金利率更加决定理财利率;尽管股市和非标在一定时期对理财利率起到牵引作用,但整体而言它们对理财利率的影响相对较小;非保本理财占比对结果有一定的重要性,体现出资管新规等监管规则对理财的影响。本篇专题只聚焦于3个月全市场理财利率,未来我们将使用同样的方法对银行理财的机构利差、期限利差和风险溢价等影响因素进行定量分析研究。返回搜狐,查看更多

banjia68.com 版权所有 | 备案号:鲁ICP备2021038504号-2