1,熟练使用 alphalens 框架,进行因子 IC 分析.股票经验8年
2,熟练使用 python 爬虫技术如:requests,xpath,BeautifulSoup,re,selenium,
3,熟练使用 numpy,pandas,matplotlib,scipy,tailb,sklearn,tensorflow等
4,熟练使用机器学习各种回归和分类算法及深度学习.K-邻近,贝叶斯,决策树,随机森林,kmeans 聚类.卷积神经网络,建模分析。
5,熟练使用米筐,聚宽,掘金等量化平台,用 python 语言进行策略构建回测。
6,熟悉 ubuntu 操作系统,进行策略定时部署。
7,淘县选手。
项目概述:基于米筐量化平台,提取股票数据,利用 numpy、pandas、matplotlib、scipy、talib、sklearn 第三方处理库进行因子与收益率之间相关性分析。利用 alphalens 框架进行因子 IC 计算及图表的绘制。根据每个因子的 IC值,IR,,和平均收益为每个因子打分,排序后再计算因子之间的相关性,相关性高的用 PCA 降维,合成一个因子。最后选取因子的 IC 值大的因子 进行选股。常用的是打分法选股(打分后,利用 pandas 进行数据拼接,选取靠前的股票),股票选出后利用 CAPM 模型,确定投资组合各股票投资比例.
项目流程:
项目流程:
1,获取的数据,利用 pandas,sklearn 进行特征工程处理:如市值中性化,缺失值处理,中位数去极值,标准化处理.
2,利用 alphalens 框架,得到处理后的 IC值,IR,,和平均收益.这三个指标都打分,三项综合得分高的因子,为价值较高的因子。
3,选取靠前的因子,根据因子的方向性,为每个股票的各个因子上的数据排序后打分,正相关的就大到小排列,负相关从小到大排列,比如越靠前的分数打的越高,然后再用 pandas 进行拼接,求出拼接后的每个股票的总和得分,得分高的自然是隔期上涨概率最大的股票。
4,选取得分高的前几只股票作为股票池.
5,获取历史数据,利用 CAPM 模型,进行蒙特卡洛模拟,选取夏普比率最高的权重,作为投资比例.
选取50个基本面指标,对50个基本面指标进行IC分析,进行多因子策略构建,打分法总分选股,最后季度调仓。
淘县选手,研究2进3胜率,验证追高是否有参与价值,结论是风险极大,参与价值不高。短线选手还是主要考虑首板,比较合理。