技能:
熟悉python
善于各类爬虫包括app和网站
熟悉报告分析以及制作
熟悉numpy,matplotlib和pandas
熟悉http,tcp和udp
熟悉群控系统开发
熟悉adb,uiautomator2,selenium等使用
熟悉mysql和sql,mongodb
熟悉Linux常用命令
熟悉线程,进程和协程
熟悉客户端和服务器之间的互动
熟悉基本爬虫框架
熟悉反反爬虫应对措施
了解js,css和jq
作品:
1.获取爱奇艺综艺和电视剧数据
2.获取腾讯综艺和电视剧数据
3.B站爬虫系统开发
4.编写数据报告
5.获取芒果综艺和电视剧数据
6.获取优酷电视剧和综艺数据
7.实时监测B站综艺数据并且获取入库
8.电视剧和综艺数据入库清洗
9.抖音群控爬虫系统开发
10.微信公众号和其他APP数据获取
这两张图片仅仅时工作中的一个小角落.因为我们需要每日的数据爬去达到百万级,在这里就展示这两张用户的基本数据.爬去下来的数据通过清洗后入库,为后续的每日报表以及业务提供需求
芒果,爱奇艺,B站,抖音,百度,360等网站上的综艺数据以及电视剧数据,包括弹幕,用户,评论进行每日爬去并且更新入库,后续通过分词形成词云图