1、分析网址
首先我们观察下豆瓣电影 top 250 的网址变化后会发现,top 250 共计分为 10 页,每一页 25 条记录,网址https://movie.douban.com/top250?start={start}&filter= 其中 start 从 0 开始,每次递增 25,到 225 结束;
2、分析网页
接下来我们需要确认一下我们需要的具体详细信息藏在哪个位置。打开网址 https://movie.douban.com/top250?start=0&filter=,然后打开 chrome 的控制台。
3、获取数据
抓取网页数据需要用的 requests 库,解析网页需要用的 BeautifulSoup 库,因此先将二者引我们的程序。