谷歌的AI现在能踢“足球”了它是如何做到的

martion | 当前状态：在线 总积分：5074 2025年可用积分：0 注册时间： 2013-07-25 最后登录时间： 2019-12-19 空间发短消息加为好友: 谷歌的AI现在能踢“足球”了它是如何做到的

martion 发表于 2016/8/21 13:29:16 1412 查看 2 回复 [上一主题] [下一主题]

手机阅读

谷歌的AI一直朝着超神的道路走去。自从在围棋上击败李世石之后，谷歌的DeepMind小组并没有停下，接下来他们要挑战的内容是3D导航和益智解谜游戏。

在DeepMind的挑战中，最值得注意的是一款名为“蚂蚁足球”的游戏。玩家需要控制一只蚂蚁形状的物体去追逐小球，然后带球直至将其送进球门得分。这种事对于人类来说可谓易如反掌，就看DeepMind怎么做了。

根据DeepMind小组David Silver说法，AI不仅完成了这个挑战，最令人惊讶的是它在整个过程中“完全不需要提前灌输有关力学的任何知识”。这个结果表明，谷歌提出的强化学习（Reinforcement Learning）概念近来又有了巨大的突破。

为了得到这样的结果，DeepMind结合了强化学习、神经网络深度学习和Deep Q-Network于一体。专门有一个算法负责存储机器人的经验积累，以及在完成某个特定行为后它的奖励预期。其实这也的算法早在DeepMind完成2D游戏挑战时就已经得以应用，不过Silver说它现在已经得到改进，比以前好得太多。

举个例子，该算法现在能够允许单个神经网络去学习多个游戏。为此研究组打造了一个大型分布式深度强化学习系统，能够利用谷歌的云平台来加速训练时间。值得注意的是，该技术已经被运用在谷歌的推荐系统中了。

不过，真正能够让DeepMind学会玩这个“蚂蚁足球”的关键在于谷歌最新开发出的所谓“异步Actor-Critic算法”，即A3C。在解决电机控制和使用视觉在随机3D迷宫中导航的问题上，采用这个算法的话标准多核CPU较之GPU效率更高。

David Silver 表示，DeepMind 现在达到的成绩可以说是最尖端的了，这样能够在训练时间和资源消耗上达到一个平衡。

随着AI 技术的继续发展，人类会受到威胁吗？事实上谷歌也有类似的担忧，DeepMind 小组曾表示他们担心AI 会自己发展出一套它们认为可以达到目的，但却不是人类想要的方案来完成目标。

为此，DeepMind 小组已经开发出了一种机制，据说可以无视AI 的任何行动直接使其失去作用。尽管并不清楚具体的原理，但我们似乎可以无需为此过分担心了。关于AI 会不会带来毁灭性后果的问题，业界中一直有着激烈的争论。不过对于我们每个人来说，这似乎还不是值得去认真忧虑的事情。

1楼 0 0 回复

zhangmengmeng   |   当前状态：在线

总积分：1958  2025年可用积分：0

注册时间： 2013-12-26

最后登录时间： 2023-08-14

空间发短消息加为好友

zhangmengmeng   发表于 2016/8/22 8:31:10

谢谢分享
2楼 回复本楼

引用 zhangmengmeng 2016/8/22 8:31:10 发表于2楼的内容
lanan   |   当前状态：在线

总积分：5000  2025年可用积分：0

注册时间： 2013-08-07

最后登录时间： 2023-08-11

空间发短消息加为好友

lanan   发表于 2016/8/23 7:58:41

谢谢分享！好人好事！赞一个！
3楼 回复本楼

引用 lanan 2016/8/23 7:58:41 发表于3楼的内容

总共 2, 当前 1/1

高级回复 | 发新主题

发表新帖

控制工程师论坛

谷歌的AI现在能踢“足球”了 它是如何做到的

2016年积分排行