1. Html css javascript
2. Python C/C++ QT
3. http 协议,socket 网络编程,数据结构算法
4. Hadoop fdfs,pandas。会使用
5. Reques,urllib3 ,异步编程 ,自动化工具 selenium,appium,pupeter,airtest
6. Redis,mysql,mongodb
7. 熟悉 Liunx 服务器
项目描述: 爬取抖音的用户信息以及每个视频,在进行视频的切割。交给算法工程师做后期处理
工作内容:
1. Mitmproxy,mitmweb,夜神模拟器,airrtest,进行接口分析。
2. 用户接口中首先需要的参数有:uid 和 shor_id
3. 需要返回真正的视频数据链接的是通过_signature 的签名算法加密
4. 用户中的 dytk 参数。
5. 以及每个 json 返回的 max_cursor 最大时间戳组成的 URL 返回视频 json
知乎的请求头加密,大众点评,新浪微博登录解密,芒果 tv 视频,YouTube 视频下载等等项目
使用 c++语言搭建爬虫软件的服务器接口
工作内容:
1. 实现日志系统主要功能:监控服务器性能预警、以及脚本异常日志
2. 爬虫日志展示 API、搜索 API、增删改查以及调用公司内部员工登录接口做登录验证
3. 分布式文件系统管理:图片以及视频文件主要技术为 HDFS
4. 任务调度,关闭任务,定时以及立即开始执行任务 API