熟练使用python,go语言,flask框架,go-gin框架,asyncio框架,分布式爬虫。
熟练使用redis,mongo,lemondb,kafka,docker,selenium,playwrigth,linux等工具。熟悉js逆向,cookie加密,js混淆,混淆还原,hook,代理,模拟滑块,rpc,瑞数等反爬。
熟悉搭建代理池,cookie池,熟悉redis,mongo海量数据存储优化。
了解spark,elasticsearch,hdfs,app抓取。
负责小环爬虫平台,大环渲染爬虫,压力控制开发,性能优化,部署维护。
负责需定制化爬虫开发,所有js逆向和反爬问题攻坚突破,为其他人提供技术支撑。
负责视频,小说,词典,app,box,大模型,站点覆盖等垂域抓取。
负责日常的case挖掘,case分析,case修复等。
负责爬虫服务器,mongo,redis,docker优化扩容等维护,爬虫程序巡检。
负责小环爬虫团队日常管理,所有对外需求的对接,沟通,任务协调分配和进度跟踪。
1.基于go-gin构建爬虫后台。 2.基于python+asyncio+aiohttp+playwright+mongo+redis+mysql+docker搭建爬虫系统
通过爬虫平台,有cookie池, 定时任务,网站覆盖,压力控制,瑞树等功能。 在服务器或者Windows上可以使用docker直接进行部署。