负责搭建和持续改进公司数据ETL流水线和数据仓库。基于Spark SQL+MongoDB+Airflow+EMR+Redis,分析处理用户业务数据和行为数据,给下游业务部门和决策部门提供数据服务支撑(推荐结果及排序、实时排行榜、给BI提供数据源、等等)。
负责搭建和持续改进公司BI系统。基于MongoDB+AWS Athena+AWS Glue+AWS Lambda+AWS Quicksight+Mixpanel(曾经还用过Google BigQuery+Looker),分析用户数据,给高层决策部门提供数据分析报表和Dashboard。