基于python的豆瓣电影信息获取系统

基本信息

案例ID:220449

技术顾问:🌈扶摇 - 1年经验 - 暂无

联系沟通

微信扫码,建群沟通

项目名称:基于python的豆瓣电影信息获取系统

所属行业:企业服务 - 数据服务

->查看更多案例

案例介绍

本实验应用scrapy框架和xpath爬取糗事百科的作者及内容,并将其存储到csv文件及txt文件中。
原理:
(1)scrapy概述:
框架是一个集成了很多功能并且具有很强通用性的一个项目模版。Scrapy框架是爬虫中封装好的一个框架。Scrapy的功能:高性能的持久化存储,异步的数据下载,高性能的数据解析。
(2)scrapy框架的基本使用:
windows环境的安装:
①pip install wheel
②下载twisted
③安装twisted
④pip install pywin32
⑤pip install scrapy
构建工程
①创建糗事百科工程:scrapy startproject qiubaiPro
②进入到工程目录,在spider子目录中创建爬虫文件
scrapy genspider qiubai https://www.qiushibaike.com/text/
③执行工程 scrapy crawl qiubai

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系聘用方端客服
联系聘用方端客服