大规模分布式机器学习算法开发和优化,机器视觉如图像识别和视频理解相关,知识图谱,NER,实体/关系抽取,对话机器人及其他NLP相关技术,强化学习,算法服务上线。
开发语言:java, c++, python
机器学习框架:tensorflow, pytorch
大规模参数服务器的算法研发,分布式深度强化学习平台,淘宝猜你喜欢排序机制的优化,短视频质量评估模型,图文信息流排序,知识图谱补全和表示学习,车载对话机器人。
视频 feed 流 corpus 存在一定比例的低质量视频,质量评估模型应用在精品 corpus,进退场控制,召回和排序优化。主要负责图像质量评价和视频内容质量评价两个项目: 图像质量模型: 总体设计为Wide&Deep结构,包括传统特征+深度特征,同时引入 双线性池化
构建 IP 知识图谱,完善以 IP 为中心的知识图谱补全,学习图谱表示用于长/短视频推荐及可解释性,视频标签分类等业务。 开发 BERT+CNN+CRF命名体识别模型,关系抽取模型,以及本体分类,图谱融合和实体链接等工作; 基于TransR和KG-BERT构建图谱表示模型,实