ID:289395

🌾

强化学习算法工程师

  • 公司信息:
  • 腾讯科技有限公司
  • 工作经验:
  • 1年
  • 兼职日薪:
  • 1000元/8小时
  • 兼职时间:
  • 下班后
  • 周六
  • 周日
  • 可工作日远程
  • 所在区域:
  • 北京
  • 海淀

技术能力

强化学习
机器学习
数据挖掘
数据分析
• 编程语言: Python,C/C++,R,MATLAB,LATEX,STM32
• 软件: 熟练使用 Excel,Word,PPT,Photoshop,After Effects 等
• 证书:普通话二级甲等,计算机二级证书,英语四级 (512),英语六级 (449)

项目经验

1、强化学习在游戏领域的研究
• 配置 Moba 游戏环境,生成完备的一套 Docker 镜像。
• 使用实验设计的方法调试强化学习参数,比对实验结果,选出最优参数。
2、强化学习在组合优化中的应用
• 对调度问题进行建模,以满足马尔科夫性质;通过强化学习 PPO 算法学习最优策略提升调度性能。
• 已录用一篇 EI 检索 DDCLS2020 会议论文和一篇SCI I区论文。
3、外汇交易与 AI 辅助决策
• 利用深度强化学习结合市场情绪和宏观经济数据(通货膨胀、GDP、就业增长、央行基准利率等),
预测长期和短期的外汇走势,构建选股策略进行回测。

案例展示

  • 强化学习

    强化学习

     对全自动生产流水线中的组合优化问题进行建模,通过强化学习 PPO 算法学习最优策略提升调度性 能,与传统优化算法相比效能提升 10%左右;  研究适用于异构问题的混合整数线性规划模型,提出一种基于 Transformer 的机器学习方法加速分支 定界的求解过程,并在公

  • 强化学习

    强化学习

     对全自动生产流水线中的组合优化问题进行建模,通过强化学习 PPO 算法学习最优策略提升调度性 能,与传统优化算法相比效能提升 10%左右;  研究适用于异构问题的混合整数线性规划模型,提出一种基于 Transformer 的机器学习方法加速分支 定界的求解过程,并在公

  • 强化学习

    强化学习

     对全自动生产流水线中的组合优化问题进行建模,通过强化学习 PPO 算法学习最优策略提升调度性 能,与传统优化算法相比效能提升 10%左右;  研究适用于异构问题的混合整数线性规划模型,提出一种基于 Transformer 的机器学习方法加速分支 定界的求解过程,并在公

查看案例列表(含更多 0 个案例)

信用行为

  • 接单
    0
  • 评价
    0
  • 收藏
    0
微信扫码,建群沟通

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服