ID:282001

@98行路者

爬虫工程师

  • 公司信息:
  • 省略
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 600元/8小时
  • 兼职时间:
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 其他
  • 全区

技术能力

1.掌握Python语言、熟悉Python各种第三方库、具有扎实的Python编程能力。
2.熟练使用Excel办公软件,掌握SUMIF、COUNTIF、VLOOKUP、SUBSTITUTE等基本函数的使用。
3.了解Scrapy爬虫框架,熟悉网页爬取原理及技术,熟悉正则匹配、requests、Xpath。
4.了解Numpy, Pandas进行数据处理工作。
5.了解Matplotlib,Seaborn、PyEcharts等库并进行数据可视化。
6.了解常用的数据分析业务模型,5W2H模型、AARRR模型、和RFM用户价值分群等。
7.了解Power BI和Tableau等数据分析可视化工具。
8.了解MySQL数据库操作,能在MySQL环境下进行增删改查。
9.了解MySQL窗口函数、掌握ROW_NUMBER( )、RANK( )、DENSE_RANK( )。
10.了解Git远程仓库、分支(branch)、版本(tag)等常用操作指令。
11.了解sklearn机器学习框架,了解KNN. LinearRegression、LR、K-means、Decision Tree、朴素贝叶
12.掌握各种剪辑软件的基本操作,有一定的摄影基础,有航拍经验。

项目经验

项目1:电商订单数据用户行为分析
项目介绍:为了平台创造出更多的利润,并且能够合理的投放广告,使用网站2019年销售数据进行分析,根据复购率、回购率、GMV、客单价、转化率、折扣率、拒退量、拒退额、实际销售额等指标以及RFM消费模型得到高价值的用户进行有针对的客户管理和维护 。
负责内容:
1.了解数据组成、类型、字段(数据约10万条数据、10个字段、有文本,数值,日期等类型);
2. 数据清洗:
● 删除重复数据;
● 过滤订单号重复数据;
● 过滤支付时间早于订单创建时间;
● 订单金额或支付金额小于0的数据;
● 过滤渠道ID为空;
● 过滤非2019年数据。
3. 数据分析:
● 计算交易总金额(GMV)、总成交额、实际成交额;
● 计算总成交额占比GMV,实际成交额占比GMV;
● 计算总单数,退单数,未退单数,退单率;
● 画出2019年GMV、总成交额、实际成交额趋势图,得出结论;
● 画出各渠道销售额占比的饼图,得出结论;
● 计算周一到周日哪天的下单量最高,画出条形图,得出结论;
● 根据RFM模型,将用户分类。
4. 进行指标的说明:
● GMV(总交易额、成交总额):Gross Merchandise Volume,通常说的交易“流水”;
● 客单价(ARPU):总收入/总用户数(不重复);
● 转化率:付费用户数/访客数;
● 折扣率: GMV/吊牌总额 ,其中吊牌总额为: 吊牌价×销量;
● 拒退量:拒收和退货的总数量;
● 拒退额:拒收和退货的总金额;
● 实际销售额:GMV-拒退额。

项目2: 使用Scrapy框架爬取链家深圳的二手房信息并进行可视化
项目介绍:可以了解深圳各行政区的二手房源的各维度信息 。
负责内容:
1.使用爬虫获取数据,Numpy、Pandas导入数据,观察数据。
● 使用Scrapy爬虫框架爬取深圳各行政区的二手房源的详细信息(约20000条数据);
● 了解数据类型(有object、float);
● 了解字段的基本信息(有title:房源标题、total_price:总价、direction:房间朝向等共11个字段);
● 统计空值数量;
● 检查数据中是否有重复值需要删除。
2.Matplotlib,Seaborn,PyEcharts进行数据可视化。
● 标题文本的词云图;
● 户型分布;
● 均价最贵的15个地段
● 均价最贵的15个小区
● 各行政区的均价;
● 房间朝向分布。

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服