DQN算法训练atari游戏breakout，训练越往后越慢，游戏停滞不前

breakout-v0的action_space有4个动作，分别是0-NOOP,1-FIRE,2-RIGHT,3-LEFT。之前一直以为环境默认发出小球供击打，其实发出小球需要智能体做出动作1-FIRE。而我的模型没有学会在一小轮失败后做出动作1，故一直环境停滞不前。

supergreener

725人浏览 · 2023-03-24 13:54:40

supergreener · 2023-03-24 13:54:40 发布

技术共进，成长同行——讯飞AI开发者社区

更多推荐

未来最好就业的十大行业：人才缺口大、薪资高，政策红利持续释放！_到2025年,中国在人工智能、集成电路、生物医药等重点领域的人才需求预测与当前存

讯飞AI开发者社区

读人形机器人21全球经济格局

1.7.1. 随着机器人接管常规任务，社会对技能的需求转向与自动化互补的技能，包括编程、维护、人工智能开发以及需要创造力、情感智能和复杂人际互动的工作。4.7.1. 为机器人技术和AI制定明确的规章制度，能够确保安全、增进信任，并促进其应用，包括产品安全、数据保护、有道德和负责任地使用AI等方面的标准。初创公司和老牌公司都在投资开发医疗机器人，以提升医疗服务的可及性和质量。2.1.2. 随着对机器