负责大规模文本、图像等数据的抓取、结构化信息的提取、质量识别等工作。
1. 开发分布式网络爬虫
2. 提取结构化信息
3. 识别结构化信息的质量
岗位要求:
1. 熟悉 Linux 开发环境,熟练使用 Shell
2. 熟悉 高并发、高性能分布式系统
3. 熟悉 HTTP协议,熟悉 HTML,JavaScript,XPath
4. 熟悉 网络协议
负责大规模文本、图像等数据的抓取、结构化信息的提取、质量识别等工作。
1. 开发分布式网络爬虫
2. 提取结构化信息
3. 识别结构化信息的质量
岗位要求:
1. 熟悉 Linux 开发环境,熟练使用 Shell
2. 熟悉 高并发、高性能分布式系统
3. 熟悉 HTTP协议,熟悉 HTML,JavaScript,XPath
4. 熟悉 网络协议
负责大规模文本、图像等数据的抓取、结构化信息的提取、质量识别等工作。 1. 开发分布式网络爬虫 2. 提取结构化信息 3. 识别结构化信息的质量
https://www.baidu.comhttps://www.baidu.comhttps://www.baidu.com