擅长phyton语言,爬取网站中的指定数据。能够分析读懂HTML、CSS、JS的页面结构,会用正则表达式。会用xpath,Beautiful提取页面元素。会使用爬虫库requests、框架scrapy等来爬取数据,会定时将爬取到的内容发到邮箱。能根据需求,处理常见的反爬,抓取数据。
收集药监局中相关化妆品企业的企业信息,包括经营地址,经营项目,社会信用代码,企业法人,并将收集的信息优秀地整理到Excel表中,便于后续的整理分析。项目主要是分析网站的源代码,爬取数据,起到收集整理的作用。
分析网站的源代码,找到数据的储存的地址,编写代码,爬取数据,将爬取的数据有序的储存到Excel表中。
分析网站的源代码,找到数据的储存的地址,编写代码,爬取数据,将爬取的数据有序的储存到Excel表中。