本人为中山大学统计学硕士,曾在字节跳动从事数据挖掘工程师工作,于腾讯从事安全技术类数据分析工作,后续于腾讯继续从事数据分析工作。本人主要熟练编程语言包括python、R语言,有爬虫、数据分析、机器学习、深度学习等多方面项目经验,参与过实验室多项科研项目,在实际工作中主要从事数据相关工作。
(1)独立完成微博用户挖掘项目,自行通过爬虫爬取微博热门内容、对应评论以及用户数据,对热门内容及用户进行内容分析,采用无监督的机器学习算法对异常用户进行挖掘。
(2)负责特定业务下用户标签体系的构建,在已有模型输出的基础上,实现用户自动标签生成,提升运营侧工作效率。
(3)参与实验室新冠肺炎疫情分析平台的建设,主要负责平台内数据的爬取部分。
(4)参与眼底图像诊断识别项目,通过深度学习实现糖尿病视网膜病变多种病症的检测识别,为眼科医院提供技术支撑。
(5)独立完成中文文本情感倾向分析项目,实现基于中文文本的情感分类模型。
平台为科研工作人员免费提供新冠肺炎疫情可视化分析,包含国内疫情分析模块、国际疫情分析模块等多个模块。本人在其中负责数据爬取部分。
通过python爬取微博热门内容,博文下的评论,对应评论用户以及对应用户发布的博文信息,通过对微博内容、用户属性等信息分析用户特点,通过无监督学习的方法进行异常用户检测,并设计异常用户检测方案。在本案例中,本人独立负责整个项目的所有内容,包括方案构思、爬虫、数据分析、数据挖掘、方