人才需求:
可以熟练使用python完成DQN或double DQN算法
能够开发票
需求描述:
1.有一段空调房间温度和机组能耗的计算代码(相当于强化学习的游戏环境,我已经用python搭建好了,具体需求可以线上沟通),可以通过外部环境参数和动作参数的输入,输出下一时刻的房间干球温度、房间相对湿度和十五分钟的设备总能耗。每日开始时的初始房间参数与室外相同。(即,通过四个逐时更新的环境参数和两个逐时更新的状态参数,输入两个动作参数,会得到两个新的状态参数,这两个新的状态参数和四个新的环境参数构成下一时刻新的状态)
2.通过对整个供冷季节的动作参数的输入学习,训练智能体double DQN模型
3.将训练好的模型保存,完成本地部署,使之能够根据实时的外部环境参数和动作参数,离线调用训练好的模型,自动寻找到最优的动作参数。
4.结果展示,保证代码可以在机主本地使用,以及代码的使用调参培训和答疑。