精通机器学习算法和NLP,可搭建机器学习框架支持机器学习应用开发,可开发算法来支持智能应用落地。
熟悉搜索引擎框架,可搭建搜索引擎框架。
熟悉爬虫,可搭建爬虫框架按需求爬取数据。
熟悉数据挖掘,精通文本类数据挖掘。
熟悉java服务端工作,可搭建服务API。
序列文本分类。负责过试卷识别功能的实现,核心使用深度学习分类算法,搭建web server提供试卷识别服务。试卷识别正确率达到95%以上。
特定领域搜索引擎实现。和美国伙伴开发过教育内容搜索引擎,开发search api,elasticsearch schema design,crawler。