职位ID:156037

强化学习算法工程师

  • 合作方式:
  • 项目制 全国远程
  • 预估日薪:
  • 1000
  • 预估总价:
  • 4000元
  • 预估工时:
  • 4天
  • 所在区域:
  • 全国远程

需求描述

人才需求:
可以熟练使用python完成DQN或double DQN算法
能够开发票

需求描述:
1.有一段空调房间温度和机组能耗的计算代码(相当于强化学习的游戏环境,我已经用python搭建好了,具体需求可以线上沟通),可以通过外部环境参数和动作参数的输入,输出下一时刻的房间干球温度、房间相对湿度和十五分钟的设备总能耗。每日开始时的初始房间参数与室外相同。(即,通过四个逐时更新的环境参数和两个逐时更新的状态参数,输入两个动作参数,会得到两个新的状态参数,这两个新的状态参数和四个新的环境参数构成下一时刻新的状态)
2.通过对整个供冷季节的动作参数的输入学习,训练智能体double DQN模型
3.将训练好的模型保存,完成本地部署,使之能够根据实时的外部环境参数和动作参数,离线调用训练好的模型,自动寻找到最优的动作参数。
4.结果展示,保证代码可以在机主本地使用,以及代码的使用调参培训和答疑。

投递职位 已有13人投递,发布人 点此登录 后查看。

信用行为

  • 发布项目
    2
  • 订单总数
    0
  • 退款单数
    0

完善简历

工程师完善技术能力和项目经验,更易接到订单

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信客服

需求方请加需求方端客服沟通需求,工程师请加工程师端客服浏览推送职位

需求方端客服
工程师端客服
联系需求方端客服