熟悉自然语言处理技术,熟练无监督的文本聚类以及有监督的分类模型搭建、文本提取关键字、摘要生成以及情感分析等,项目经验丰富。
熟练数据挖掘,工作当中需要经常爬取网页上的内容,清洗后用于训练模型,爬虫经验丰富。
熟练tensorflow、pytorch、caffe等深度学习框架,熟练搭建训练模型。
熟练python,C++语言,代码功底较为扎实,熟悉Linux工作环境,熟悉常用算法和数据结构。
有较强的数据分析和解决问题的能力;组织和沟通能力强,思路清晰,有将复杂问题拆解并实施的能力。
爬取各大新闻网页内容、点评类网站评论内容,数据清洗,制作数据集
爬取点评类网站美食图片
色情文本聚类模型搭建与训练
涉政文本聚类模型搭建与训练
暴恐类文本聚类模型搭建与训练