熟悉python、HTML、JavaScript等多门语言。熟悉掌握了python爬虫、python+selenium自动化测试。熟悉pandas、numpy等第三方库、mogodb数据库、熟悉使用flask框架
不通过登录获取cookie爬取网易云vip单曲
自己尝试过爬取网易云vip歌曲,通过爬取目标歌曲对应的mv,再对目标歌曲通过第三方库进行音视频的抽离.
爬取B站视频
通过抓包,找到目标视频对应的音频和视频url链接,并通过xpath定位提取目标链接文本。最后对音视频的url进行请求,通过moviepy合成音视频
通过非登录状态寻找目标VIP歌曲对应的mv,通过抓包获取视频的链接,再通过第三方库moviepy对音视频进行抽离得到目标音频,
b站的视频是以音频和视频分开存储的,通过抓包,找到音视频对应的标签所在位置,通过xpath定位提取出目标url的文本,最后通过第三方库对音视频进行合成操作就能得到目标视频