爬虫、python、自然语言处理(对话机器人、问答、机器翻译、语音、文本分类、文本挖掘、知识图谱、文本摘要、自动分词)、计算机视觉(图像分类、目标检测、人脸识别)、深度学习、数据挖掘、机器学习、统计分析、算法落地、基础前后端开发、基于docker容器的服务部署
1.基于微信的问答机器人。采集人事领域问答知识库,训练深度学习模型,搭建基于微信的后端服务。
2.独立完成机器翻译系统。爬取亿级文本翻译数据库,训练基于Transformer的中英翻译模型,模型准确度达到业界领先水平,BLEU值对标BAT,翻译服务基于docker容器打包部署。后期进行服务并发性能优化和模型压缩,单GPU支持20路并发请求,响应延迟在200ms以内,显存消耗压缩至1G以内。该系统现已在某AI上市公司的产品中落地。
该项目基于微信前端实现人事助理问答机器人,具有自动匹配知识库问题,回答用户问题,评价与反馈记录和缺失问题自动记录的功能。我负责该项目的整个流程,包括数据采集与处理、模型训练、基于docker容器的模型部署、服务后端与前后段交互。
基于Transformer的中英文机器翻译系统。我负责从数据爬取到服务部署的所有环节。包括数据爬取、数据清洗、翻译模型训练、翻译模型压缩、基于docker的服务部署、并发优化、前后段交互代码、前端页面代码