6年java/大数据/爬虫开发经验
擅长于大数据开发,熟练使用Cloudera Hadoop、Flink、HDFS、MapReduce、Hive、Spark 、Flume、Sqoop、HBase等技术进行大数据处理
精通Java编程语言开发
擅长java/python爬虫程序开发
1、多个爬虫项目经验
房产网站(Q房网、链家),手机网站(中关村、太平洋)、企业信息(启信宝)、快递(格格、速递易、EMS、菜鸟等)多个网站和手机APP信息抓取,熟练使用模拟浏览器抓取动态网站数据、验证码破解及使用动态代理等技术饶过防爬虫程序。
2.大数据智制管理平台
公司2018年重点项目,立足于大数据管理和挖掘分析等实际需求,集元数据管理、任务定制管理、任务调度、报表定制,到日志分析、网管功能、权限管理等多个子系统于一体的大数据管理平台。用户可通过简单的拖拽方法灵活定制任务流程,实现大数据统计和数据挖掘。
3.广东省电信异网号码解析
基于大数据平台,按照统一的数据模型对全省固网Wi-Fi下用户上网数据(每天数据量约1200亿,17T)进行清洗、挖掘、整合、统计分析(主要采用MapReduce + hive),并向外系统提供运营数据共享,为前端市场部门提供标准的运营数据支撑。
4.广告决策平台
基于电信用户宽带上网数据清单,分析用户上网行为,为每个用户标记相应标签,并同步到redis,提供接口,供广告DSP方投放广告时调用,筛选用户,提高广告投放精准度。