提起量化投资,大家第一印象往往是神秘,会觉得量化策略都是躺着挣钱的,然而在实践中,量化投资之路却是充满荆棘。下面从策略开发前期、策略运行中期、策略运行后期三个阶段简单介绍一下各自面临的困难。
一、量化策略开发的前端三陷阱。
1、幸存者偏差。
幸存者偏差是量化策略开发中最普遍问题之一。在对历史数据进行调整时,一些破产、退市、表现不佳的股票定期都会被剔除。而这些被剔除的股票没有出现在你策略的股票池里,也就是说对过去做了回测时只利用了现在成分股的信息,剔除了那些在未来因为业绩或者股价表现不好而被剔除出成分股中股票的影响。
2、未来函数。
未来函数是指在回测时,使用了回测当时还不可用或者还没有公开的数据,这也是回测中最常见的错误。在做量化策略回测时,往往会用到一些当时不能准确获得的数据,比如当时公布的宏观数据在后来又进行了修正,而在做回测时,往往使用的时修正后的数据,而这个数据在历史的当时是无法获得的。
3、非对称性。
一般来说,做多因子策略时较常用的策略是多空策略,即做多好的股票同时做空差的股票。然而,并不是所有的因子都是平等的,多数因子的多空收益特征存在不对称性,加之做空可能存在的成本和现实可行性,也给量化投资造成了不小的困扰。
以上只是量化策略开发中较为常见的几种陷阱,通过一些技术手段还是可以规避的,下面来讨论一下量化策略运行中的可能遇到的问题。
二、量化策略运行的中的两大难题。
1、市场容量。
对于承载较大资金规模的策略而言,如果没有充分考虑市场容量的问题,可能会导致交易结果与预期偏差较大。例如,涨跌停和流动性中断时,大资金常常很难成交,这在策略回测时很难纳入考量,而只能通过实盘交易来验证;或者,实际品种的市场容量有限,较大的单量不能全部以指定价格成交,这也会影响最终的交易结果。
2、滑点设置。
在做回测时,都有一个滑点的假设,这个平均的滑点往往是基于历史数据估算的,然而在未来的实盘中,市场可能已经发生变化,在一定的时期内,实际的滑点可能远高于回测数据,这样的话,回测有效的模型很有可能在实盘中表现差强人意。
三 、量化策略后期面临失效问题。
量化策略大多基于过去的历史数据(往往是用近三年甚至更短周期的数据),从中提取相对有效的因子,进而开发量化交易模型。因而,难免会遇到市场环境变化,而导致策略失效的情况。
举个例子,在2016年之前的几年时间里,小市值因子具有显著的超额收益,因此,在当时的环境下,很多量化策略都会把小市值作为模型的重要因子,甚至是决定性因子。固然,这类型策略在2016年以前的历史数据中表现良好,具备很好的配置价值。但是,2017年市场风格突然转变,呈现‘一九行情’,以白酒、家电为代表的的‘漂亮50’走出了独立的上涨行情,而对于很多中小市值的个股而言,则走出了单边下跌的走势。当年,量化对冲策略大面积失效,甚至亏损。主要原因就在于,2016年以前的历史数据的统计特征在2017年发生了重大变化,进而导致基于历史数据的交易模型失效。
总之,量化投资外表虽然光鲜亮丽,但是背后却充满艰辛,甚至是波折。