原创文章第462篇,专注“AI量化投资、个人成长与财富自由”。
按惯性每周五咱们会迭代版本,今天也不例外。
年前咱们更新到quantlab3.6:
Quantlab3.5代码发布:因子表达式及Alpha158因子库实现 | 超参数优化(代码+数据)
本周的重点是gplearn在因子挖掘上的应用,重点是CTA场景。
gplearn遗传算法应用于CTA因子挖掘:手把手教程(代码+数据下载)
gplearn系列:使用因子rank ic评估因子性能(代码+数据)
大家知道,原生的GPLearn并不适合挖掘因子,主要存在以下几个问题:
1、gplearn只支持单标的,在CTA策略单标的可以,但单标的下挖掘的因子,很容易过拟合。
2、内置的函数不适合金融量化因子,需要自己扩展。而且原生的扩展,不支持常数项,比如SMA(10),这个10就是常数。
3、原生的fitness是ic和Rank IC,不支持夏普比或者卡玛比率这种。
4、而且网上能用的代码有限,版本鱼龙混杂,不成体系,或者文档不全。
5、传统的因子挖掘方法大多基于遗传规划(Genetic Programming)方法,这类方法具有收敛速度慢、超参数难以调优等局限;
网上的代码都是“暴改”之后的,且没有文档,demo未必能跑通。
我给大家跑通了一份,但是基于qlib的,与DeepAlpha同构,后续以这份代码为蓝本了。
大家直接pip install -r requirements.txt即可(python 3.8)
基于A股的qlib数据也会打包给大家,置于~/.qlib/qlib_data/cn_data_rolling目录下:
代码已经发布至星球:AI量化实验室——2024量化投资的星辰大海
1、支持GPLearn, DSO以及强化学习的版本。
2、数据目前的A股全量数据,qlib格式。
3、支持多支股票同时挖掘。
4、支持多因子联合评测。