英语技能良好,CET-540,经常阅读英文文献并有个人发表的国际性文章
熟悉常见的编程语言:Java,Python,Matlab,C/C++,Linux shell, SPSS
掌握linux服务器开发及运营技术,并掌握深度学习的GPU开发
对深度学习技术熟悉,掌握常见的深度学习模型以及先进技术,并经常写模型,包括Natural Language Processing(自然语言处理)和图像识别技术,包括知识图谱等等,掌握Pytorch/tensorflow/Sklearn/Keras语言
对爬虫技术以及反爬虫技术熟悉,多线程爬虫:Scrapy/PySpider等框架;
熟悉Django及前端网站开发技术
成都清数科技 算法研究人员
公司行业: 大数据
1. 深度学习图像识别领域 车牌识别的应用 验证码识别应用
2. 爬虫爬取科技公司相关信息
3. 网站开发
学术会议COLING2020 论文发表者和会议演讲者
学术期刊TKDE 期刊合作者-二作
学术会议ACL2019 论文合作者-三作
学术会议EMNLP2018 论文发表者和会议演讲者
远程监管被广泛用于使用自动标记的数据集提取关系事实,以减少人工标注的高成本。但是,当前的远程监督方法存在单词级和句子级噪声的共同问题,这些问题源于句子中大量不相关的单词和许多句子的不正确的关系标签。这些问题导致关系提取的精度无法接受,这对于使用远程监管的成功至关重要。在本文中,我
一、 豆瓣信息爬取和知识图谱构建 1、使用python scrapy爬取豆瓣读书(https://book.douban.com/tag/?view=type&icn=index-sorttags-all)下的图书基本信息,包括:类别、名称、作者、出版社、出版时间、价格