技术栈:Python Pytorch 深度学习强化学习经验回放目标/策略网络
具体成果:
项目涉及:深度学习与强化学习技术的结合,引入经验回放机制,目标网络,策略网络,神经网络冻结技术,实现一个可自主探索陌生环境的智能体。
项目实践中:项目以python为工具,运用pytorch框架,结合深度学习与强化学习原理,人脑记忆机制,实现一个智能体,通过与复杂环境探索交互获取经验,对经验的学习,增强智能体推理能力,进一步与环境交互,最终在多种不同环境中表现出超越人类的效果。
项目涉及技术点:python、pytorch、深度学习、强化学习、经验回放、神经网络冻结技术、智能体探索、智能体推理、智能
体内省(backforword)等前沿技术。