爬虫:爬取大众点评某个城市某类美食的所有商家相关的有市场价值的重要信息,包括:城市、分类、商圈、店名、链接、评价数量、人均消费、星级评分、口味评分、环境评分、服务评分地址等等相关信息,并导出结果。
主要爬虫思路:
1、确认提取的数据来源及方式:先确定数据是哪里提取,通过什么方法进行加密。
2、破解数据提取方法:大众点评的数据基本都是加密的,要研究加密的类型,并破解,大众点评是通过woff来解密。
3、提取相关的数据并写入文件。
data = {
'城市':[shop_city],
'分类':[shop_leixing],
'商圈':[shop_shangquan[3]],
'店名':[shop_name],
'链接':[shop_lianjie],
'评价数量':[shop_pingjianum],
'人均':[shop_renjun],
'星级评分':[shop_xingjipingfen],
'口味':[shop_kouwei],
'环境':[shop_huanjing],
'服务':[shop_fuwu],
'地址':[shop_dizhi]
}