会熟练的试用python做数据收集项目。静态网页,动态网页,json数据包,都可以。
会使用selenium做自动化测试。request高级语法。
数据持久化可以做,可以保存图片 视频 txt文档 都可以
也可以保存csv文件 可以读取写入
b站的所有视频皆可爬取下载。可以用python发评论 发弹幕
也可以爬取视频弹幕做词云, b站的电影,视频 番剧都可以
微博的超话,百度文库项目,西瓜视频 这些平台都做过 网易云音乐 qq音乐 酷我音乐 的音乐下载
会使用python做数据收集项目,可以绘制词云,可以进行简单的数据清洗 可以爬取一定网站的视频 会使用ffmpeg合并视频
百度文库项目 可以爬取百度文库的文档 包括word pdf 但不限于 可以输出txt 也可以word pdf和ppt则输出为图片