擅长python、scala、java开发,擅长spark、hadoop、clickhouse、kudu、kubernetes、docker、tensorflow、pytorch等技术。擅长数据平台开发、数据挖掘、数据分析、算法开发、分布式计算。
1、基于开源组件搭建大数据平台,囊括从数据采集到数据落盘的整个流程,完成TB级数据的秒级处理和存储,长期稳定支撑数百人以上开发任务和业务应用。对存储的数据进行挖掘和分析,建立企业级知识图谱并在此基础上进行算法开发。
2、算法平台开发,搭建模块化算法平台,包含了当前常用的各类型统计分析算法、机器学习算法和深度学习算法,让用户可以在不依赖任何代码的情况下构建复杂算法流程。同时,也支持用户利用多种编程语言在线编辑自定义的算法模块,充分进行数据分析。