案例ID:223939
技术顾问:芝麻开花 - 14年经验 - 东软
联系沟通
项目名称:人机大战
所属行业:人工智能 - 其他
这是一个人工智能强化学习项目,智能体挑战人类的认知逻辑推理能力。人类和智能体进行一场比赛,在10*10的矩阵方格内用最短的时间和步数找到飞机的头部即为获胜方,飞机随机生成,为‘士’字形。找到除飞机的方格为‘空’,找到飞机除头部的位置为‘伤’,找到头部游戏结束。智能体根据训练目的的不同分为两个模型进行训练,主要采用DDQN和PPO两种算法进行强化学习训练。采用Ray框架rllib进行训练,最后达到性能为平均5-6步找到飞机头部,优于人类平均水平。
其他人才的相似案例推荐
项目中实现了一个集成多种预测模型和不确定性分析的水文预测框架
根据客户的需求, 要在比较基于经验重放(Experience
项目介绍:AI 智能助手“智小仙” 作为 AI 智能助手“
负责项目中 HTML 排版和 CSS 样式编写,积极和项目经
高功率电机限位控制上位机,通过蓝牙连接得到拉力传感器数据,通
之前公司的项目已经没有了存根,这家公司的性质要求保密,我所上
铁路行业的语言类大模型和多模态大模型的训练、部署和发布 我
当然,我明白你的需求。以下是一份基于你的要求编写的Java开
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送