围棋击败AlphaZero!各类游戏测试碾压前辈,谷歌DeepMind AI再添新员
|
接下来,研究人员评估了MuZero的一个版本-MuZero Reanalyze,该版本已进行了优化,可提高采样效率,并将其应用于75场Atari游戏中。他们报告说,它管理的标准化分数中位数为731%,而以前的最新无模型方法IMPALA,Rainbow和LASER分别为192%,231%和431%,同时所需的培训时间大大减少(12小时与Rainbow的10天相比)。 研究人员写道:“人工智能的许多突破都基于高性能计划(high-performance planning)。”“在论文中,我们介绍了这种结合了有模型和无模型的方法。我们的算法MuZero在他们主要的领域(如国际象棋和围棋等逻辑复杂的棋盘游戏)都可以达到高性能规划算法的超人性能(superhuman performance),并且在具有复杂视觉的Atari游戏中,性能优于最新的无模型强化学习算法。 结语:DeepMind推动自我学习型AI更进一步此次MuZero的推出代表了谷歌目前在AI的底层算法领域的最高成就。它已经在测试得分和训练用时上都超过前代,甚至超过前代传奇AlphaZero。 DeepMind AI算法最大的特点就在于它不是预先设定好的解决特定问题的AI,而是遇到问题,通过学习,总结,寻找规律来完成任务,这更加接近实际应用中的情况,也是AI发展的方向。 希望谷歌的突破可以带动更多国内外科技巨头投入底层算法的研究中,推动AI进步,让AI在现实中具有更强大的能力,为人们带来更加便捷美好的生活。 原文来自:Venturebeat (编辑:52刷机网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
