1.熟悉python语言,熟悉常用深度学习框架Tensorflow,熟悉后端开发框架(Flask,Django),熟悉常用的机器学习算法(回归,聚类,贝叶斯,SVM,决策树),有过深度学习项目开发经历,熟悉RNN,CNN深度学习算法,熟悉自然语言中的分词以及文本分类。
2.熟悉关系与非关系型数据库,如MySQL,Redis,Mongo基本操作。熟悉容器Docker操作。
3.较好的英文阅读、听力与翻译能力 ,能阅读国外的开发文档
1.水滴信用数据平台。负责搭建水滴信用产品的底层数据平台,实现分布式数据采集、大规模数据存储、数据清洗、数据更新。负责水滴信用数据采集以及数据监控工作,使用Scrapy构建分布式数据采集系统,使用Mysql+Redis对大规模更新数据进行缓存,并将数据写入Mongo中。
2.太平洋保险机器学习运维平台。基于Tensorflow框架使用线性分类及CNN算法构建高风险SQL语句分类模型,对运维开发人员提交的数据库修改命令进行风险分类以及自动审核,降低人工审核成本。使用Word2vec算法,将客户提供的运维人员上报的问题工单语料进行分词训练,得到词向量,并计算出句向量,基于句向量实现关键词提取及短文本聚类,然后依据聚类结果,训练短文本分类器。实现通过短文本分类以及关键字提取,将常见的问题工单相应解决方案返回,减少人工参与。使用Flask框架开发相应分类接口,并使用Docker部署服务在客户内部系统中。