1.使用多线程,协程获取网页数据
2.使用selenium框架,进行自动化操纵
3.mysql数据库,mongodb数据库和非关系型数据库redis
4.使用scrapy框架,进行增量式爬虫获取数据,并将数据进行持久化存储
5.pc端逆向
6.app端逆向
1.使用协程爬取某盗版网站电影,这里仅限于盗版网站,像腾讯、爱奇艺这样正规的视频网站中的vip付费电影资源没法获取。
2.使用selenium框架实现用户自动登录功能
3.scrapy框架实现分布式、增量式爬虫
4.pc端逆向
包含b站刷播放,获取今日头条某专栏的资讯信息,央视频刷播放
5.app端逆向
JNI开发、b站刷播放量和完播率、得物搜索功能、知乎关键字搜索功能、抖音获取评论信息、flask框架,qt5
该项目自己独立完成,工时半天左右。视频下载看似简单,其中涉及到众多技术。其中包括,文件解析、协程、文件解密、视频合并等操作。具体请看作品图片展示部分。
免费代理ip可用性存在很大的不确定性,实际生活中对需要大量代理服务的往往需要付费。一般使用隧道代理,这里并不重要。重要的是一些重要的思想,包含多线程,窗机爱你服务器向外提供接口等。具体请看作品图片