- 教育背景:清华大学本科,MIT博士在读,专业方向为系统及机器学习
- 编程能力:对C++/Java/Scala/Python均有多年经验
- 大数据相关:对Hadoop/Spark/HDFS/HBase均有一定程度了解,对数据库MySQL/Oracle较为了解
- 工作中熟练使用Docker和Kubernetes
- 基于Spark/HBase的batch processing engine:服务于广告、推荐、市场等团队的workflow engine,支持多种任务(包括训练机器学习模型,广告投送,用户推广等),每日处理数据在上百TB级
- 基于Kafka/Spark Streaming的stream processing engine: 每日处理千万条日志数据