案例ID:172496
技术顾问:Leo - 9年经验 - JD
联系沟通
项目名称:新闻媒体分布式爬虫系统
所属行业:企业服务 - 数据服务
对海量媒体新闻网站,进行数据的抓取。 提供可视化抓取配置功能,供运营人员配置抓取。 数据实时清洗推送,通知下游编辑人员使用。 实现分布式抓取架构,以及全方位的实时抓取监控。 对接代理池平台,所有请求都走代理,防止IP反爬虫 可配置使用浏览器查看跟踪抓取路径 抓取配置采用json,方便配置,解析
其他人才的相似案例推荐
Apache Atlas是一个可伸缩和可扩展的元数据管理工具
Ambari 就是创建、管理、监视 Hadoop 的集群,但
实时计算平台是通讯行业中的一个系统,这个系统的开发目的是解放
该项目为公司内部容器编排技术平台 随着项目的增多,公司在各
此项目是基于Spring boot和minio搭建的分布式存
此项目是基于Spring Cloud Alibaba搭建的微
寺庙数字化智能化,从寺院事务实际出发,涵盖了从信徒、法事、捐
吃货一款寻找附近美食的app,可以快速找到本市和附近比较出名
完成路由器管理系统开发,包含路由器基本功能,以及vlan,s
一体化智能plc柜,高速公路隧道供配电系统,plc设备车道灯
采集某行业网信息数据,对采集的数据进行清洗,过滤,分表,存储
此小程序为一个售课平台,用户可以加入班级,然后进行课程的购买
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送