1.大数据集群搭建
2.开发kafaka,spark,hive,storm,hadoop等技术,ETL和spark实时离线分析
3.熟悉shell编程,熟悉linux命令
4.熟悉python开发和python web服务化
5.熟悉docker镜像和docker搭建
6.熟悉java spring开发
1.大数据平台类开发及简单运维
2.训练平台-打通大数据,实现拖拉实现编排算法
3.凤凰项目-解决收派端实时数据分析
4.客户关系网络-利用大数据技术+java技术分离线实时2个项目建立关系网,然后提供接口实时分析用户风险度
5.非标部署平台-利用python web部署相关模型等非正规系统,减少生产部署复杂度
6.数据分析项目-利用spark或者hive离线帮助业务人员分析统计相关指标及特征变量
7.etl