1深入理解并熟练掌握自然语言处理中的常用算法,包括textcnn,rnn,lstm等。
2.深入理解并掌握目前主流大型深度学习预训练模型,包括Bert,ERNIE,XLNET,GPT-2等。
3.对文本分类与序列标注问题有较深刻的理解。
4.对基于知识图谱的KBQA问题有较成熟的解决方案,包括技术选型,部署,展示等一体化。
京东商场 商品动态标题摘要
1.商品标题成分分析,包括实体提取,分词。
2.term 重要性计算,赋予每一个短语一个 term 重要性指标。
3.用户高频 query 分析,term 匹配。
4.线上环境 term 组合排序,返回动态标题。
百度大搜 相关性排序模型优化
1.负责百度搜索相关性精排模型预训练方向优化,分析挖掘搜索场景下的真实召回和点击数据(千亿级),并在模型预训练阶段引入高质量数据,提高排序模型效果。
2.基于线上模型打分存在的 bad case ,挖掘数据在模型 finetune 阶段解决。
NER任务下的不同任务的评测项目。具体实例见本人博客:https://zhuanlan.zhihu.com/p/191355122
基于GPT-2的文本自动摘要的任务,具体详情见本人博客:https://zhuanlan.zhihu.com/p/113869509