1 掌握并熟悉Python、MATLAB、Java语言;
2 熟悉机器学习的线性回归、逻辑回归、支持向量机、贝叶斯分类、聚类等算法;
3 熟悉自然语言处理的n元语法模型、隐马尔科夫模型、条件随机场模型、机器翻译、知识图谱、词性标注、生成模型等模型;
4 熟悉深度学习的TensorFlow开源框架;熟悉神经网络的各种模型,如:深度神经网络(DNN)、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆神经网络(LSTM)、自编码网络(AE)等;
5 熟悉神经机器翻译领域的RNN编码-解码模型、注意力机制模型以及Transformer模型;
6 有良好的英文文献阅读能力。
1 项目名称:人工智能机器人研发
开发语言:Python
主要工作:参与智能聊天机器人的研发,主要研究相关文本分类、排序以及端到端的生成模型的算法。主要工作为使用对话状态跟踪、生成模型、意图识别、同义词转换、生成相似语料、关键字提取、句子相似度、情感分析、文本分类等相关技术,使得所使用的智能聊天机器人的回复率达到76.78%,准确率达到99.22%。
2 项目名称:中英机器翻译模型研究
开发语言:Python
项目描述:随着年初升级版的微软翻译系统的推出,使得机器翻译步入了新阶段,但是微软所推出的机器翻译系统仅仅只是在新闻这个领域中的翻译效果较好,在其他领域中的翻译效果并不明显。系统Open Subtitles
2016的开源数据集上获取的120万中英文数据集,通过对该领域最新的研究成果谷歌所推出的Transformer模型进行改进,使得改进的模型结果的BLEU值有了提高。
3 项目名称:电影评分推荐
开发语言:MATLAB
项目描述:在用户看完电影需要对电影进行评分时,系统会自动给用户产生推荐评分。系统搜集大量用户对电影的评分的数据,将数据按7:3的比例分成训练数据集与测试数据集,然后利用协同过滤推荐算法以及相关改进算法进行训练模型,使得测试数据集的平均绝对偏差MAE的值达到最优。
角色 | 职位 |
负责人 | 深度学习工程师 |
队员 | 产品经理 |
队员 | 前端工程师 |
队员 | 后端工程师 |