pythong工程师 精通爬虫, 深入理解TSP/IP协议; 精通 urllib, urllib3, Beautifulsoup, Beautifulsoup4, python selenium自动化, lxml解析, re解析, PyMongo数据库指令, redis-py数据库指令, 等等... ; 其中常用 requests模拟cookie会画, ip地址, 模拟登陆, ajax爬取, pyquery解析 Redis数据库, MySQL数据库写入数据等, 会搭建ip池, cookie池, 也常用 Python Selenium模拟多个用户一键式爬取, 解析, 写入, 完成项目后熟练运用 Pyinstaller 发个用户, 实现一键式"傻瓜"操作, 极大地方便用户
requests爬取, pyquery解析, mongo写入, 今日头条文字, 图片, 视屏; urllib, requests爬取, pyquery, re解析, bilibili大会员视屏并下载, requests, ajax爬取网易云音频, redis写入存放网址等等, ip池, cookie池, request模拟登陆github并批量爬取, selenium爬取知乎, 贴吧等
requests爬取HTML中所要爬取的URL, urllib.parse再构造URL, requests爬取网站JSON数据, 解析JSON, 用pymongo保存入数据库MongoDB
python requests模拟构造URL, 并爬取标签页获取图片地址URL, requests再爬取URL获取.jsp文件格式二进制文件数据, 写入图片