案例ID:223190
技术顾问:卟哙飛の潴 - 6年经验 - 视联动力
联系沟通
项目名称:学术文献爬取
所属行业:医疗健康 - 医患问答
和某医院合作训练大模型,训练数据需要采集大量文献期刊(共156个期刊,医院已购买期刊会员),利用爬虫技术完成数据自动化采集与管理。 1. 开发相关脚本实现数据自动化采集,Python3、Selenium、Requests、BeautifulSoup等。 2.文献资料自动保存为PDF文件。 3.输出采集日志,采集记录保存到Mysql数据库。
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送