熟练SparkCore,SparkSQL,SparkStreaming的开发并了解Spark源码及调优;熟练使用Python与Scala编写Spark;熟练数据仓库Hive、数据库MySQL的使用及Hive的基本调优;熟练掌握Linux的基本操作;熟练掌握阿里云dataworks、maxcompute、hologres等的使用,并基于阿里云进行开发
医保大数据风控分析平台:通过大数据及数据分析建模技术,对现有医保大数据进行分析,根据不同的规则与模型,筛选出不同的风险场景、风险金额及风险项目等信息。打通从数据生成、数据ETL、规则风控场景、模型场景并将生成的风险结果与原始数据结合。某汽车零部件供应商各部门报表开发:基于阿里云maxcompute,对各个部门的报表进行开发上线