猿急送>

其他Python兼职程序员

ID：199278

梦璃

python工程师

公司信息：
进讯网络科技有限公司

工作经验：
1年

兼职日薪：
500元/8小时

兼职时间：
下班后

所在区域：
其他
全区

技术能力

熟练掌握Excel(各种骚操作要掌握，比如VBA；会做透视表；各种公式)
python，一些机器学习原理
Mysql
统计学知识
比较：比较数据间各类别的关系，或者是它们随着时间的变化趋势，比如折线图；
联系：查看两个或两个以上变量之间的关系，比如散点图；
构成：每个部分占整体的百分比，或者是随着时间的百分比变化，比如饼图；
分布：关注单个变量，或者多个变量的分布情况，比如直方图。

项目经验

项目时间：2019-06到2020-2

项目名称：分布式爬虫爬取北京市企业信用信息网

项目描述：

这个项目是通过scrapy-redis搭建分布式爬虫爬取企业信用信息网公布栏，爬取列表页每一项下的子页获取数据

我的职责

首先爬取首页后通过xpath匹配每个的信息块的span后构建请求，并通过scrapy.Request发送请求，用xpath匹配需要的信息。

同时循环创建下一页请求的form表单，通过scrapy.FormRequest发送POST请求。所有爬取的信息缓存到redis数据库中，

最后通过编写python脚本将redis数据库中数据读取出来加入mysql数据库。

其他爬取的网站：搜狐新闻、豆瓣、腾讯新闻网。

案例展示

电商零售

通过图表可以看出，每年的利润和销售额一样，是在逐年增加的，说明企业经营还是比较妥善的，而且和表2年度销售额增长率对比来看，除了14年利润率同比下降及对比销售额增长率（26.25%）低之外，前两年均高出销售额增长率，可能14年促销让利比较多（后面分析促销给销售的影响时会检验）
面积堆叠图

从表格显示，首先，几乎所有的月份同比前一年都是增长的，只有2012年9月份是特殊负增长了，这个需要结合当时运营情况来具体情况具体分析。其次，结合表2 年度销售额增长率来看，每年月度销售额增长率超过年度增长率的月份分布，基本没有什么规律；第三，同比增长率目前来看，没有太大规律，这给