技术: Python, C++, C, Java, Linux, SQL, R, JavaScript, Microsoft office, Spreadsheets
语言: 美本美硕留学经历, 英语读写能力佳, 托福 103 分
Forward Data Lab – 计算机领域关键词的相似性科研项目 小组成员
一个由教授带领的科研项目; 目的在于建立一个专门提供计算机领域关键词的检索网站, 包括定义, 相似关键词, 重要领域, 重要学者等; 本人利用了网页数据爬取从 70 多万篇论文中收集了超过 80 万个关键词, 利用多种方法进行对关键词的筛选, 最后使用的方法是构建一个关键词的图, 再利用 classification, personalized page rank, graph embedding等方法, 对关键词进行排序; 学习并应用了多种机器学习和自然语言处理算法, 熟悉了网页爬取技术, 提高了 Python 的编程能力