精通java,python语言,熟悉linux脚本。熟练使用hadoop,hive,impala等大数据平台,并能开发各种大数据算法。精通爬虫scrapy框架,反爬机制;熟悉各种机器学习分类,聚类,关联,预测算法。“南京人工智能大赛-机械故障预测”比赛复赛第八名,天池“广东智能图像大赛”排名Top10%。熟悉sklearn,keras,xgboost,lightgbm等多种机器学习工具,在公安政务,能源预测预警,税务风险预警,上市公司治理等行业具有丰富的行业经验
GA大数据分析平台:基于采集的终端数据,基于朴素贝叶斯算法设计并实现了警种分类,基于TF-IDF分类设计并实现了智能web网页分类,自研了终端安全嫌疑人溯源算法。
广告点击率预估:基于用户历史数据,通过数据预处理,特征工程,使用ftrl在线算法,通过预估广告的点击率对广告重排序,提升广告的点击率20%与转化率10%。
上市公司指标体系建设:提取3000多家A股上市公司17年年报PDF,文件大小300G,通过转换文本,表格压缩数据,设计多线程,20多个业务类,提取上市公司各指标数据,形成121个,五大类指标体系,对上市公司作出全面的评价
角色 | 职位 |
负责人 | 数据分析师 |
队员 | 前端工程师 |
队员 | 后端工程师 |