基本信息

案例ID:222283

技术顾问:日照者气盛也 - 2年经验 - 无

联系沟通

微信扫码,建群沟通

项目名称:使用Python爬虫爬取豆瓣top250

所属行业:企业服务 - 数据服务

->查看更多案例

案例介绍

任务介绍
需求分析
爬取豆瓣电影Top250的基本信息,包括电影的名称、豆瓣评分、评价数、电影概况、电影链接等。
链接:https://movie.douban.com/top250
三步走
获取数据(常用Urlib2,Requests,aiohttp,elenium)
解析数据(常用pyquery,Beautifulsoup,xpath,re)
存储数据(常用mysql,xlwt等)
反扒措施
header: 爬虫请求头与浏览器保持一致
动态页面: 查到页面内容的request
用户: 每次请求间隔几秒,或使用代理服务器
cookie: 禁止cookie

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服