量化基金又现“封盘”，“机器学习”还能躺赢多久？

原创展恒基金网

2019-12-06 阅读量：1

2019年无疑是量化基金的“丰收大年”，上半年量化基金叱咤风云，成了各路投资追捧的“香饽饽”。半年“激情”过后，受到规模扩张、交易量萎缩、基差等因素的影响，整体收益表现开始持续低迷。

目前来看，越来越多的机构开始控制规模，先前幻方量化、九坤、因诺等先后宣布“封盘”后，近期思勰投资也宣布主动控制限制短周期管理期货（CTA）产品的规模，其公告称，“决定不晚于2020年1月31日起，暂停公司日内CTA产品线的净申购，控制相应策略的管理规模。此举是为了保护现有投资者权益，维护量化策略有效性”。

何为策略的有效性？

我们先来看一下量化基金是如何运作的。

量化基金如何赚钱？靠模型；模型是如何组建的？靠因子；因子是什么？简单的说就是各种数据的维度，比如基本面、量价、市值、反转、舆情等等。而如何让这些因子有效的运转起来搭建成一个有效的“模型”，一般来说国内主流的就是两种方式：逻辑和统计。

“逻辑”其实很好理解，更多的是从基本面等角度出发，关注这些因子在理论中的可解释性。举个例子，当前国内经济下行压力较大，大部分行业的盈利都会受到明显的影响，但对于“喝酒吃药”这些必需消费品而言受到经济周期的影响是很小的，从而表现在公司业绩的“逆周期”增长，这些最终也会体现在股价上。这些理论上都是可以可解释的，这就是“逻辑”推导。

而“统计”则更多的是从数理的角度，通过对海量数据的挖掘，总结出高胜率的规律。例如我们常说的“超跌反弹”，如果个股暴跌幅度过大，不管基本面如何，均线效应总会拉起至少几个点的反弹。这个反转，逻辑是没法解释的，但胜率非常高，就可以形成一个统计规律。

从“逻辑”和“统计”的角度出发，通过高频的交易次数和基数庞大的选股，获得长期稳定的高胜率，这应该就是量化运行的核心。

而这两种方式主要是通过传统统计模型或者机器学习来实现的。

机器学习

今天主要简单讲一下“机器学习”。机器学习，其实就是通过给机器饲喂大量的数据，利用它来发现规律或重现规律。相对于传统的统计模型而言，机器学习对数据没有任何假定，产生的结果用交叉验证的方法来判断，摆脱了“假设分布>明确数学模型来拟合>假设检验>p值”的经典统计过程。传统统计更关心模型的可解释性，而机器学习更关心模型的预测能力，总体来说，可解释性强的模型会损失预测能力，预测能力强的模型往往比较难解释。

举个例子，比如机器模型推导出“上班能治感冒”，那么我们就认为上班可以治疗感冒，尽管在我们已有的理论和认知体系中对此无法解释，但我们仍然认为其具有较为可靠的预测能力。

国内机器学习在A股应用大概是开始于2014-2017年，直到去年和今年随着量化基金的崛起迅速膨胀，引起外部资金大量关注蜂拥而入，诸多量化管理人也开始往这个方向进行转型。但随着量化规模的急速扩张导致策略的容量开始不足，而策略的容量是由因子的有效性和丰富性决定的，这两点由取决于技术实力。所谓的技术实力，就是管理人对于机器学习尤其是深度学习前沿的掌握，以及在量化这个场景的应用经验。这成为一个很重要的门槛，不管是老牌还是新兴，谁能够做到，谁就能不停的迭代，保持优势。

我们认为，量化投资的野蛮生长阶段已经过去了，简单的数据处理和调算法包挖掘出有效因子就能躺赢的阶段将很难再现，未来恐将形成“强者恒强”的鼎立局面。

上一篇：“私转公”？谈何容易

下一篇：基金经理观点—远望角投资

声明：

展恒基金除发布原创研究报告/文章以外，致力于优秀投研类文章精选、精读等，所载文章、图片、数据等部分涉及内容推送时未能与原作者取得联系。若涉及版权问题，敬请原作者联系我们。本站所载文章、数据等内容纯属作者个人观点，不代表本公司立场，仅供读者参考。