- insight back 过去没有现在这样全面的分析方法
- data back 过去没有现在这样全面整理的数据来分析
- computational power and technology 过去没有现在的计算能力和技术
以上三个因素只是影响预测准确率的众多因素之一.
- 回撤大于正常水平
- 夏普下降
- 与其他已发现的有效规则冲突
多策略同时使用: 某策略在50%时间能正确预测价格, 假如有10条相同准确率的策略, 把它们同时应用起来会比使用单一更好.
- 日内alphas有以下两种:
- 一定时间间隔的再平衡, 比如1/5/15分钟
- 事件驱动再平衡
- 日间alphas:以天为最小间隔的再平衡 2. 基于N天内数据 2. 基于当前的快照数据 2. 开盘/收盘 集合竞价时的交易
- 周/月度的alphas
基于公开的信息, 找到其中的信号/模式, 这些数据处理过程越有效, 则alpha越好. 公开数据可以分为下面5个分类:
- 量/价 使用技术分析对 量/价 做 预测/回归.
- 基本面数据
- 宏观数据
- 各种文本数据:交易所公告, 公司公告, 报纸, 杂志, 新闻, 甚至社交媒体上的内容
- 多媒体数据:音视频数据
有些数据并不能直接用来生成alpha, 但可以用来提高alpha的表现. 有下面3个例子:
1 风险因子模型: 通过控制风险因子甚至消除风险因子可以提高alpha的表现 2 关系模型: 不同票据之间在某种程度上有着关联, 在价格变动时有些是领跑的, 有些是被拖着跑的, 这些关联创造了套利的机会 3 微观模型: 提高真实交易执行中的表现 现在不是数据不够, 而是各种各样的数据太多了, 如何对数据消除噪音, 提取出我们要的信号. 问题的解决空间为非凸集, 断续, 动态. 我们可以对解决空间的范围的缩小就是通过不断使用已消化的结果来对新的数据进行处理.
- 信息比率(Information Ratio) 持续表现怎样
- 边际收益(Margin) =alpha带来的收益/交易次数, 可以得知交易次数对收效的影响, 值越高越好, 说明交易次数对收益影响越小.
- 唯一性 与策略池里其他alpha相关性越低越好
当然还有其他测试方式来评估, 比如从票据流动性的好还是差还评估. 但记住, 对alpha的参数调整要以未来为目标, 因为就算你调整参数后, 对历史数据回测有多大提高也是没有用处的. 如果调整参数后对未来的预测贡献很小甚至负数, 但对历史数据却贡献很大, 那很可能是过度拟合了, 这时要用”样本外数据(out-of-sample data)”(机器学习里面有定义)来对alpha做评估, 而不能只是用”样本内数据(in-sample data)”