熟悉Scrapy框架,能实现Scrapy-Redis的分布式爬取
具有一定的反爬,反反爬经验,能处理一些懒加载,验证码登录的问题
熟悉selenium,appium
熟悉逆向JS
熟练使用Xpath,正则表达式,能使用BS4, CSS选择器
对MySql, mongodb,Redis熟练掌握
熟悉python语言
有小程序开发经验
熟悉linux系统,熟悉TCP协议
能独立解决验证码/IP封禁/JS动态加载
抖音数据爬取
项目简介:抓取目标的粉丝数,获赞数,视频等主页上需要的数据
开发环境:Appium+fiddler+requests+font解密工具
责任描述:1.使用fiddler找到与目标主页相关的URL接口
2.爬取视频需使用Appium模拟用户向下刷新出更多视频
3.爬取粉丝数,获赞数这些主页上的数据需要用font解密工具找到字体加密的映射表后使用正则替换才能拿到正确的数据
4.也可逆向JS找到signature的加密方式来获取相应需求的数据