原创文章第462篇,专注“AI量化投资、个人成长与财富自由”。

按惯性每周五咱们会迭代版本,今天也不例外。

年前咱们更新到quantlab3.6:

Quantlab3.6:后续产品化的思考

Quantlab3.5代码发布:因子表达式及Alpha158因子库实现 | 超参数优化(代码+数据)

本周的重点是gplearn在因子挖掘上的应用,重点是CTA场景。

gplearn遗传算法应用于CTA因子挖掘:手把手教程(代码+数据下载)

gplearn系列:使用因子rank ic评估因子性能(代码+数据)

大家知道,原生的GPLearn并不适合挖掘因子,主要存在以下几个问题:

1、gplearn只支持单标的,在CTA策略单标的可以,但单标的下挖掘的因子,很容易过拟合。

2、内置的函数不适合金融量化因子,需要自己扩展。而且原生的扩展,不支持常数项,比如SMA(10),这个10就是常数。

3、原生的fitness是ic和Rank IC,不支持夏普比或者卡玛比率这种。

DeepAlpha通用因子挖掘:支持GPlearn遗传算法和深度强化学习挖掘因子(代码+数据下载)

4、而且网上能用的代码有限,版本鱼龙混杂,不成体系,或者文档不全。

5、传统的因子挖掘方法大多基于遗传规划(Genetic Programming)方法,这类方法具有收敛速度慢、超参数难以调优等局限;

网上的代码都是“暴改”之后的,且没有文档,demo未必能跑通。

我给大家跑通了一份,但是基于qlib的,与DeepAlpha同构,后续以这份代码为蓝本了。

大家直接pip install -r requirements.txt即可(python 3.8)

基于A股的qlib数据也会打包给大家,置于~/.qlib/qlib_data/cn_data_rolling目录下:

代码已经发布至星球:AI量化实验室——2024量化投资的星辰大海

1、支持GPLearn, DSO以及强化学习的版本。 

2、数据目前的A股全量数据,qlib格式。

3、支持多支股票同时挖掘。 

4、支持多因子联合评测。

AI量化实验室——2024量化投资的星辰大海