熟悉传统的机器学习算法理论以及深度学习模型,有自然语言处理和图像处理等相关实践的经验
掌握Python/C等常见编程语言 掌握常用数据结构及算法、网络、操作系统等基础知识
掌握HTML+CSS+JS前端技术,了解PHP后台开发语言
了解基本的Linux命令
1.基于主题的中文文本情感分析
使用 Tensorflow 实现 BI-LSTM-CRF 神经网络模型用于序列标注,设计基于规则学习的情感词与主题词 匹配的算法,对情感词做粗粒度的情感分类;在原有模型中加入Attention注意力机制
2.汽车之家和观察者网站的数据爬取实现
设计爬虫思路并基于requests、BeautifulSoup实现爬虫脚本。爬取汽车之家网站包括文章、口碑、论坛 等数据;爬取观察者网文章及评论。通过设置频率、ip池、字体映射等措施应对网站中的反爬机制
3.金融行业问答
实现金融行业的相关FAQ问答任务