熟悉Python爬虫,了解各项反爬手段,均有妥善的处理方法。 熟悉自然语言处理和数据挖掘,对抓取的数据可进行简单的清洗。 程序运行稳定快速,响应及时。 熟悉基于Chrome Headless模式的爬虫编写。
西安四叶草信息技术有限公司 完成基于 Chrome 网站爬虫,能够解析执行 JS 代码,适配 Web2.0 的站点。 使用自然语言处理和机器学习的方法构建了态势感知引擎,能够高效的发现网页中的敏感信息。 使用自然语言处理和数据挖掘技术,识别网站是否被恶意篡改。
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送