本科毕业于重庆大学软件学院,研究生毕业于中科院计算所。
熟悉Java、C++、Python、MySQL
熟悉Springboot、kafka、Elasticsearch、Flink、logstash、binlog,了解neo4j
熟悉pandas库
1、数据库血缘系统:通过antlr实现底层SQL语句解析,自动提取出多个表/列之间的关系,支持MySQL、Hive、impala、sqoop等多种不同的环境。为了提高系统整体性能,项目采用了多线程设计,模块间采用kafka传递数据,分析出的血缘关系图利用neo4j存入到图数据库中。
2、Flink实时处理系统:项目使用logstash监控数据库变化,将新增的数据添加到es,同时通过kafka上传到区块链,并将区块链返回信息返回,通过flink实时处理,将最终结果写入es。
3、基于POI的蜂窝数据特征挖掘:通过爬取地图POI信息,综合移动蜂窝数据信息,挖掘用户使用APP的行为特征。该项目中采用了自行开发的爬虫工具爬取各地图的POI信息。在POI信息的基础上,配合合作方提供的移动蜂窝数据信息,使用聚类分析、高斯混合模型拟合等多种数据分析技术分析用户使用APP的行为特征。
基于POI的蜂窝数据特征挖掘:通过爬取地图POI信息,综合移动蜂窝数据信息,挖掘用户使用APP的行为特征。该项目中采用了自行开发的爬虫工具爬取各地图的POI信息。在POI信息的基础上,配合合作方提供的移动蜂窝数据信息,使用聚类分析、高斯混合模型拟合等多种数据分析技术分析用户使用A
功能:文件加水印,支持txt、csv、word、ppt、excel、png等多种文件格式,支持明水印和暗水印。 负责的角色:后端算法设计与功能开发。