基本信息

案例ID:223190

技术顾问:卟哙飛の潴 - 6年经验 - 视联动力

联系沟通

微信扫码,建群沟通

项目名称:学术文献爬取

所属行业:医疗健康 - 医患问答

->查看更多案例

案例介绍

和某医院合作训练大模型,训练数据需要采集大量文献期刊(共156个期刊,医院已购买期刊会员),利用爬虫技术完成数据自动化采集与管理。
1. 开发相关脚本实现数据自动化采集,Python3、Selenium、Requests、BeautifulSoup等。
2.文献资料自动保存为PDF文件。
3.输出采集日志,采集记录保存到Mysql数据库。

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服