本人硕士毕业于清华大学软件学院,从事人工智能,机器学习,深度学习方向三年(截止到2021),对数据分析,数据挖掘方面有很多经验,同时擅长python爬虫,数据采集等工作。最经常使用的编程语言为python。
在计算机视觉三大顶会之一ECCV上发表过论文,参与导师的国家重点研发项目,快手未来媒体研究院项目,担任重要技术角色,擅长使用python进行爬虫,数据采集,深度学习,数据分析等操作
根据已有的从天眼查上下载到的PDF,从大量的PDF中解析出甲方想要的数据信息,其中包括工商信息,法人信息等等,最终格式输出为excel表格
甲方给定了两组数据,需要对两组数据进行名称匹配,为数据找到最合适的名称,采用的技术是计算分数的方法,将分数最高的名称赋值给最终结果。其中包括数据清洗,数据分析,数据计算等步骤。最终输出格式为excel文档
使用python爬虫技术,爬取彼岸网的壁纸照片,由于彼岸网对数据下载有限制,因此耗费时间较久。最终输出结果为壁纸图片。