爬取网站信息,主要使用webmagic框架 网页后端功能实现,主要包括获取数据库的数据,任务队列的设计等 利用spark集群处理大数据 熟练使用正则,基于正则的文本信息提取 基础的neo4j使用 基础的elastic search使用 基础的linux使用
实现数据处理平台的后端,实现大数据轮廓的计算分析、数据资产的呈现 舆情、电商商品信息等的爬取处理 法律文书、招标文书等的信息提取处理
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送