熟练使用python,了解内存管理机制,oop编程思想,单例模式、工厂模式
掌握Django框架,能独立完成开发任务
熟练使用docker,使用k8s部署项目
熟悉linux常用命令
熟悉mysql, 了解oracle等数据库
了解机器学习,算法如svm、logistic
一、税务风控平台,工作内容包括:
1.税务数据预处理,使用sql语句,对数据进行初步处理,包括缺失值、异常值,数据转置,分组统计等
2.特征处理,为指标以及机器学习做准备
3.使用指标公式,把特征带入公式计算指标值(行业经验指标公式)
4.尝试算法包括svm、gbdt等,调参、训练
5.Django后台,税务数据查询,模型预测结果查询
二、可视化建模平台,工作内容包括:
1.数据源,支持mysql、oracle等数据库的配置,连接,表中数据增删改查、表结构查看、修改,新建表,删除表
2.异构数据源数据互相导入,上传文件(excel,txt,csv)导入数据库
3.可视化执行流程,通过拖拽算子,连接算子,最终按连接顺序执行整个dag流程图,算子包括数据读取,加工,清洗,可视化,特征工程,机器学习等
4.支持可编程的自定义算子,用户自己上传代码
三、量化平台,工作内容包括:
1.股票数据每日定时爬取入库
2.量化策略,基于股票开、高、低、收、成交量、换手率、ma5,ma10等数据,
构建规则公式,筛选股票(由业务专家写策略)
3.股票回测,计算策略在历史数据上的平均收益率和最大回撤
4.账户建仓、平仓,收益率统计
5.计算量化因子(宏观因子、基本面因子、交易风格因子约40个因子)数据,
使用svm,logistic算法,因子作为特征列,下周的收益率做标签列,进行建模、分析。
过程:缺失值按行删除,
特征列标准化,
使用gbdt,得到特征列重要性排序
尝试使用top5、top10特征,用svm训练并预测
把预测收益率从高到低分为5组,计算每组预测收益率、实际收益率均值,画图展示
django后台开发,业务平台的增删改查业务 mysql库表设计 计算流程的解析,以及具体实现整个计算流程的过程 docker+k8s部署
python爬虫爬取股票数据 python的django后台开发 股票指标公式开发,支持自定义公式,筛选股票 股票策略回测,计算在历史数据上的收益情况