ID:391468

bingo

大数据开发工程师

  • 公司信息:
  • 明略数据
  • 工作经验:
  • 9年
  • 兼职日薪:
  • 1100元/8小时
  • 兼职时间:
  • 下班后
  • 所在区域:
  • 西安
  • 全区

技术能力

1.熟悉面向对象的思想,掌握java基础知识
2.熟悉scala语言和思想
3.熟悉 linux 的命令常用开发工具的安装和操作,能在linux系统下搭建开发环境
4.熟悉hdfs分布式文件系统存储结构和高可用原理,hadoop mapreduce计算框架编程,对yarn的资源调度,作业监控有一定认识,熟悉flume,kafka等日志收集,分发框架的使用
5.熟悉Hadoop,Spark/Sparkstreaming,Hive,Hbase,kafka,flink等大数据生态技术

项目经验

项目一:数据采集系统
项目名称:数据集成平台
开发时间/开发周期:2021.2-至今
使用技术: Linux+nifi
对于多源异构数据进行数据采集和清洗,负责选型以及开发工作,底层采用nifi进行数据采集,web端通过用户配置数据源,以及清洗脚本,启动底层nifi任务流,进行端到端数据操作,将数据推送不同业务库,支持传统rdms,http,nosql数据库的采集。


项目二:数据中台(数据汇聚)产品
项目名称:数据汇聚2.0平台
开发时间/开发周期:2019.04-2020.7
使用技术: Linux+Spark+Sparkstreaming+Drools+Kafka+Zookeeper+Hive
产品描述:
针对数据来源的库,数据需要推送的库不同,数据多数据情况比较杂乱,字段不标准,或者错误。开发数据汇聚产品。主要负责部分开发数据底层处理包,针对不同数据源的数据通过Sparkstreaming实时、Spark批处理进行数据采集,采集对数据进行标准化操作。关联,回填,去重,错误数据备份过滤等操作,根据上层业务系统需求,将数据推送到不同的数据库中入Elasticsearch、Hbase、Hive等。
责任描述:
1. 根据任务配置使用Sparkstreaming实现底层jar包跑数程序,实现数据到数据的流转
2. 使用drools模板,进行规则开发
3. 大数据和web端的消息发送,包括日志,统计类信息
4. 将实时数据和上层应用系统对接
参与技术选型和新技术研究

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服