ID:199278

梦璃

python工程师

  • 公司信息:
  • 进讯网络科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 500元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 其他
  • 全区

技术能力

熟练掌握Excel(各种骚操作要掌握,比如VBA;会做透视表;各种公式)
python,一些机器学习原理
Mysql
统计学知识
比较:比较数据间各类别的关系,或者是它们随着时间的变化趋势,比如折线图;
联系:查看两个或两个以上变量之间的关系,比如散点图;
构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图;
分布:关注单个变量,或者多个变量的分布情况,比如直方图。

项目经验

项目时间:2019-06到2020-2

项目名称:分布式爬虫爬取北京市企业信用信息网

项目描述:

这个项目是通过scrapy-redis搭建分布式爬虫爬取企业信用信息网公布栏,爬取列表页每一项下的子页获取数据

我的职责

首先爬取首页后通过xpath匹配每个的信息块的span后构建请求,并通过scrapy.Request发送请求,用xpath匹配需要的信息。

同时循环创建下一页请求的form表单,通过scrapy.FormRequest发送POST请求。所有爬取的信息缓存到redis数据库中,

最后通过编写python脚本将redis数据库中数据读取出来加入mysql数据库。

其他爬取的网站:搜狐新闻、豆瓣、腾讯新闻网。

案例展示

  • 电商零售

    电商零售

    通过图表可以看出,每年的利润和销售额一样,是在逐年增加的,说明企业经营还是比较妥善的,而且和表2年度销售额增长率对比来看,除了14年利润率同比下降及对比销售额增长率(26.25%)低之外,前两年均高出销售额增长率,可能14年促销让利比较多(后面分析促销给销售的影响时会检验)

  • 面积堆叠图

    面积堆叠图

    从表格显示,首先,几乎所有的月份同比前一年都是增长的,只有2012年9月份是特殊负增长了,这个需要结合当时运营情况来具体情况具体分析。其次,结合表2 年度销售额增长率来看,每年月度销售额增长率超过年度增长率的月份分布,基本没有什么规律;第三,同比增长率目前来看,没有太大规律,这给

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服