基础的python爬虫,可进行大部分加密不严重的网址 核心数据筛选如xpath以及正则和BS4之类的
scrapy分布式框架可在已经安装数据库的局域网内多台设备同时进行数据爬虫
JS反扒 可以绕过一些中间用js进行加密的网址
字体反扒 根据网页字体信息对爬取下来的数据有显示错误的情况
数据分析 可以将爬取下来的数据形成表格后再根据要求进行分析之后进行筛选或者制作成需要的表格类型
视频爬取:m4s,mp4,u3u8格式爬取
音频爬取:基础的几个平台非VIP格式
数据爬取:一些基础练手项目,具体情况根据网址不同写法不同