案例ID:141973
技术顾问:沃特胡 - 9年经验 - 惠普(上海)软件研发中心
联系沟通
项目名称:分布式爬虫系统
所属行业:工具 - 云盘|下载
分布式爬虫系统是基于Gerapy做的分布式多平台爬虫任务管理系统,可以添加执行主机,分配调度爬虫执行,在线管理所有的测试脚本项目,定时多线程分布式执行爬虫脚本。该系统是自己独立搭建完善的,目前实现了头条热点新闻,CSDN热点新闻,抖音热门小视频爬虫爬取任务等,脚本会将爬取的数据插入后台数据库,经过相关洗涤,漂白,混淆操作等可快速去重,保证数据的完整和唯一,可帮助提高门户网站的SEO转化率。
其他人才的相似案例推荐
1、crm app,公司内部销售专用的客户管理系统 2、基
独立开发 解决pixiv排行图片批量下载 --支持黑名单
基于Python Flask架构后端开发,结合前端HTML,
对接的是腾讯的api,实现智能机器人对话和其他的功能 技术
文件实时同步 保证所有设备中的文件版本一致与同事或合作
和一般的云盘一样啦是上传下载什么的 也没什么其他的特别的东
华为云空间web端备忘录模块 主要功能是添加、修改、删除备
实现了用户注册和验证,还有人脸识别的部分。用户下载管理页面,
需要用户登陆,然后微信授权,里面包含有下载多文件,实现文件大
抖音/快手/微视等平台无水印采集,主要是采集指定用户的所有视
dplb论文批量导出 将dplb上整页的论文批量导出 并尝
通过Scrapy爬取某影视项目,共爬取二十多个数据字段,数据
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送