熟悉爬虫技术:拥有自建免费代理池并长期持续维护,有淘宝、京东等电商和知乎、百家号等文章爬虫开发经验,熟悉各种数据存储和搜索开发,包括但不限于mysql、mongodb、redis、neo4j、elasticsearch,熟悉java和python开发。
熟悉知识图谱:有行业知识图谱的项目经验,熟悉spark编程,处理过十亿级数据的清洗、实体归一化和实体链接等任务。
熟悉推荐算法:从事4年推荐算法工作,有丰富的模型经验。
熟悉爬虫技术:拥有自建免费代理池并长期持续维护,有淘宝、京东等电商和知乎、百家号等文章爬虫开发经验,熟悉各种数据存储和搜索开发,包括但不限于mysql、mongodb、redis、neo4j、elasticsearch,熟悉java和python开发。
熟悉知识图谱:有行业知识图谱的项目经验,熟悉spark编程,处理过十亿级数据的清洗、实体归一化和实体链接等任务。
熟悉推荐算法:从事4年推荐算法工作,有丰富的模型经验。
利用requests和selenium等工具和scrapy爬虫框架,爬取电商品牌和商品信息,并存入mongodb数据库,进行数据清洗和挖掘,构建电商知识图谱
小程序开发,识别图片中的所有电话号码,并可一键拨号,为销售朋友做的一个小工具,前端小程序和后端接口以及识别算法都是一个人实现的