ID:223903

Leo 有团队

高级算法工程师

  • 公司信息:
  • 亿阳信通股份有限公司
  • 工作经验:
  • 10年
  • 兼职日薪:
  • 800元/8小时
  • 兼职时间:
  • 可工作日远程
  • 可工作日驻场(自由职业原因)
  • 所在区域:
  • 北京
  • 西城

技术能力

数据分析算法开发:精通 Python 和 R 实现各种爬取、清洗、分组汇总等分析算法;

机器学习算法开发:精通线性回归、样条回归、随机森林、SVM、聚类等机器学习算法;

网站开发:有集于 Python 和 Bootstrap 实现电商网站的经验;

Shell 开发:熟练使用 shell 实现各种自动化工作;

技术培训:有 Python 和机器学习算法培训经验;

论文和书籍翻译:出版过两本译著。

项目经验

光伏和风电设备故障诊断和预警算法开发

2017.1 至今

光伏板在自然环境中受到灰尘杂草遮盖、冰雹沙粒撞击等多种因素影响,形成裂纹热斑等局部故障,进而导致整个组串发电效率损失,由于光伏板安装数量极大,或者位置特殊(例如屋顶),导致人工巡视成本很高,我们采用组串离散率方法分析故障面板,及时替换故障设备,提高了发电效率。

风力发电机使用风向标测量风向、驱动电机调整风机角度,保持正面对风,由于风向标结冰或者尘土卡滞导致对风不正,对发电效率影响很大,由于风机的人工检测成本很高,我们采用风场风速中位数和具体风速仪测量风速比对,结合历史数据,快读定位存在结冰或者卡滞问题的风速仪,提高了风机的发电效率。

每个算子从业务建模、数据获取、数据探索(包括数据清洗、模型评估、可视化等)、输入输出定义、算法实现到性能评估整个过程中,我带领技术团队与业务顾问、前后端开发确定实现方案和数据格式,为算法工程师提供技术支持,编写和测试关键部分算法。

算子作为设备故障检测应用的核心部分,在陕能、七琴等电站的实际运行中大幅降低了设备检测成本,提高了设备发电效率。业主的预计收回成本时间从 4~5 年降低到 2~3 年。


新能源远程诊断分析平台

2017.1 至今

新能源远程诊断分析平台是主要面向工业领域的大数据分析平台,计算分析部分由一组通用算子和工业领域专用算子组成,用户通过在 Web 界面上拖拽算子并组合连接的方式,完成一个针对具体业务场景的计算流程搭建。
对接数据源后,自动完成离线和在线大数据分析,支持用 Python, R 和 Spark 等语言编写算子。
我负责开发了 KMeans 聚类、ARIMA 时序分析、二项系统参数估计和异常检测、DBSCAN 等十多个算子,部分代码整理在 github.com/znbt/mlOperatorIntro 中。

工业领域专业算子方面,我负责开发了组串故障预警算法,包括针对短期故障预警的离散率算法和针对中长期故障预警的相关性矩阵算法。在万、百万和千万条记录3个量级上对单进程、单机并行、集群并行等方式进行了性能对比。


国家电网某省用工量分析和预测

2017.9 ~ 2017.12

输入数据:国家电网某省1968~2017年全省各单位人员详细信息
实现算法:ARIMA 时序分析模型
输出数据:历史用工量模型、2018年月度用工量预测

分析过程:根据每个员工的“进入本单位时间”字段做月度汇总,计算出1968~2017每年的月度用工量,填充缺失数据后形成模型可用的时序数据,首先做成分分解,提取长期趋势、季节波动和随机波动项,确定差分阶次、自回归系数、移动平均系数后,做 ARIMA 拟合,并通过模型残差项特性评估模型整体质量,最后基于模型的平稳性特征预测未来12个月的用工量。

我负责整个项目的需求确认、数据处理、算法实现和测试。用工量分析和预测通过了国家电网人力资源部的功能验收,由该部做进一步整合。


牛展网

2015.6 - 2016.11

牛展网是一个会展行业的在线交易网站,为参展商(买家)和组委会(卖家)提供了在线交易商品(展位)的平台,在线支付部分使用平安银行支付管理工具管理会员交易资金,一方面形成自己的资金池,另一方面解决了在线交易的担保信用和资金安全问题。

网站基于 node.js 开发,使用 MongoDB 做后端数据库,搜索使用 Elasticsearch,展位图使用 SVG 矢量图转换后入库,应用服务包含 4 万多行代码,使用 git 和 git-flow 作为版本控制工具。

网站采用微服务架构,基于 PaaS 容器云实现了快速部署、自动升级、弹性伸缩和高可用能力,同时降低了网站运维成本。
基于公有云服务搭建了完整的产品和办公网络,保证稳定、可靠、方便的同时,降低了企业的硬件支出成本和运维人力开支,基于 Phabricator 搭建了产品-开发-运营工作流平台,管理者、业务部门、开发团队通过这个平台分配日常产品开发任务,监控开发进度,反馈产品问题和用户需求,运行3年多为牛展网的发展提供了坚实的 IT 基础设施保障,目前运行状态良好。作为产品的技术负责人,带领4人团队完成了前后台设计、功能开发和测试、银行 API 对接等工作。

在线展位交易平台在内部测试中能够完成从注册、搜索会展信息、浏览展位、将展位加入购物车、在线交易、订单状态查询、展位状态更新等完整流程。


告警相关性分析:https://github.com/leetschau/alarm-relations

2014.4 - 2015.1

使用 Python(单机算法原型)和 Apache Spa

团队情况

  • 整包服务: PC网站开发   
角色 职位
负责人 高级算法工程师
队员 产品经理
队员 前端工程师
队员 后端工程师

案例展示

  • 机器学习常用算法使用说明

    机器学习常用算法使用说明

    作为算法团队内部学习和验证工具,介绍了常用各种机器学习、数据分布、异常检查算法的实现方法,主要使用 Python 和 R 语言实现。 每种算法包括功能介绍、参数的选择方法、与相关算法的对比、输入、输出数据的格式等。 对培训算法新人起到了很大作用。

  • 机械部件电商网站

    机械部件电商网站

    一个向用户展示在售机械零部件商品的电商网站,包括商品和品牌管理、图片管理、管理员搜索、用户搜索的多种管理和展示功能。 采用 Python Django + Bootstrap 开发,支持多种后台数据库,如 SQLite、MySQL、PostgreSQL 等。

  • 机器学习算法在线培训

    机器学习算法在线培训

    以轻松幽默的方式介绍了机器学习的历史背景,与相关技术的关系,覆盖的领域、应用场景、建模方法、工作流程、评价指标等。

  • Python函数式编程(第2版)

    Python函数式编程(第2版)

    Python函数式编程(第2版)和 精通Puppet配置管理工具(第2版) 由人民邮电出版社出版,在配置管理和 Python 函数式编程领域获得了不错的反馈。

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服