ID:275326

追月

高级java开发工程师

  • 公司信息:
  • 阿里巴巴
  • 工作经验:
  • 5年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 可工作日远程
  • 所在区域:
  • 杭州
  • 西湖

技术能力

python: opencv,flask,numpy
java:springcloud,springboot
组件:hadoop周边生态,redis,elasticsearch,hbase,rocketmq,kafka,zookeeper等
前端:vue,html,js,css

项目经验

**项目描述**:为电商、服装企业设计师企划设计师等时尚从业爱好者提供持续的最新灵感快速把握时尚趋势, 便携收集管理设计素材, 助力高效完成设计任务, 采集多个源(ins,微博,秀场等)的数据,通过自研的算法模型实时计算链路, 提取服装的各种要素(纹理,工艺,图案等)和数据源的相应维度信息进行提取, 采用优化后的kappa架构搭建数据链路, 分别进行离线和实时的数据分析计算, 提供最新销量榜单, 同类相似商品价格对比, 往年爆款商品, 商品趋势预测, 相似灵感, 供应链等各种功能.
2. **技术栈**: maxcompute,flink, dataworks,loghub,rocketmq,elasticsearch,hbase
3. **负责内容**:
- 于2021年初将图片业务从线下的hadoop集群迁移到阿里云max_compute, 参照了阿里云的one-data体系, 对图片业务进行分层建模(ods,dwd等), 映射到离线架构的不同模块, 以更系统的, 更规范的方式重新定义了公司的数据开发流程, 同时也解决了线下机房集群弹性扩容不易的问题
- 主导并负责了对公司实时计算链路的一站式架构设计, 将公司实时性较高的业务由原来小时调度的伪实时结构调整到了kappa架构, 并对数据明细层做落盘处理, 在保证数据质量的前提下真正实现了实时处理
- 借鉴flink的exactly-once语义,elastic的segment定义和读写分离的思想,自主研发了一套实时的算法处理链路, 解决了具有依赖关系的去重数据流处理缓慢的问题, 成功由原来的单机30万每日处理量提升至1500万的单日处理量
- 糅合算法组与业务的思想差异, 对外提供统一的查询服务, 通过api网关实现了接口级别管理, 有效避免了不同产品间获取数据与期望不符的现象
- 通过收集客户对于款式灵感的行为数据, 清洗, 过滤后提供给算法组加入训练集, 成功实现了一个产品驱动技术提升, 技术提升反哺产品的完美闭环
- 废弃原来的代码裸机部署, 统一docker容器化, 用k8s的统一管理, 以更低的成本花销实现了服务的快速复制同时服务稳定性也得到了显著的提升

案例展示

  • 知款

    知款

    - 于2021年初将图片业务从线下的hadoop集群迁移到阿里云max_compute, 参照了阿里云的one-data体系, 对图片业务进行分层建模(ods,dwd等), 映射到离线架构的不同模块, 以更系统的, 更规范的方式重新定义了公司的数据开发流程, 同时也解决了线下机房

  • 城市大脑天擎系统

    城市大脑天擎系统

    - 针对elasticsearch script向量搜索速度过慢的问题, 通过自研聚类索引, 在物理机器资源有限的情况下, 有效提高了近8倍搜索性能同时对搜索结果的召回率达到90%以上 - 针对省, 市间数据访问不可见的问题, 采用轻量级的restful风格搭建了接口级统一口

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服