【大数据】
Hadoop,Storm,Spark,Presto集群监控维护调优。
Storm ,SparkStreaming实时计算项目代码编写。
Mahout,Mllib,Sklearn 机器学习实践
Nginx,Flume,Logstash,Kafka日志收集插件的部署维护。
Kylin ,Pinot ,Tez等新的开源项目调研。
【机器学习】
sklearn、pytouch
分类、聚类、回归
【后端】
Django、Flask
【前端】
Html、Vue
大数据平台搭建,主导前后端编写Django + Vue。
大数据集群搭建,初始13台服务器及后续的扩容。
生产集群 部署 维护 测试,kerberos 的使用,大数据系列的分享
离线计算 Hive,实时计算 Spark、Flink,对外接口,监控
评分卡模型构建
随机森林特征上下限异常预测