Google让两个AI一起玩游戏,他们会合作还是打架?

2020-06-07 阅读 102 次 作者: 来源: O潮生活
Google让两个AI一起玩游戏,他们会合作还是打架?
REUTERS/Andrea Comas

相信自从 AlphaGO 战胜人类之后,不少人想乾脆让两个人工智慧直接对决算了。

Google 的 DeepMind 团队还真的做了一件类似的事,不过设定有点稍稍不同,这源于试验的目的并不是要找出哪只人工智慧玩围棋更厉害,而是想知道,人工智慧在特定的规则环境下,究竟是会合作还是竞争?

毕竟,未来人工智慧在这个社会中,要处理的事情可能很多,小到指挥交通,大到国家的经济运行,可能都有人工智慧的参与。然而人类发展的历程告诉我们,有时候合作也许才是对大家最好的。

为了探讨这个问题, DeepMind 做了个实验,将几个 AI 机器人置于一系列的 「社交困境」 中,在这些情况下,个人可以从背叛他人中获利,但如果所有人都那幺自私,那就没有赢家。这是不是让你想起了诺贝尔奖得主奈许提出的 「博弈论」 里面的「囚徒困境」?

DeepMind 做实验的方法就是 ,让这些 AI 们一起玩两个简单的电动游戏。

第一个电动游戏叫 「捡苹果」,两名玩家要在中间的同一支管子上收集苹果,谁捡的苹果多谁就赢。同时他们都有一个技能,透过用雷射来阻碍对方的行动,让对手暂时在游戏中消失,就有机会收集更多的苹果了。

第二个游戏叫 「狼群」,两名玩家需要在一个充满困难和障碍的环境中捕猎一只猎物。不过不仅是抓到猎物那名玩家可以得分,而是当猎物被捕时,所有靠近猎物的玩家都可以得分。

比如,在 「捡苹果」 游戏中,当苹果数量很充足的时候,这些人工智慧似乎懒得去动手阻碍别人,而是努力在自顾自地捡苹果。然而当苹果的总数逐渐减少,他们使用雷射功能的次数也开始增多了

但这是一个机器人,接下来的事情就更有趣了,当引入一个运算能力更强的人工智慧时,它却倾向于无论剩下多少苹果,都会去阻碍对手。似乎更聪明的 AI 表现出来的是,在这个游戏中,什幺时候都要好斗。

研究人员认为,更高级的人工智慧在游戏中使用雷射的次数较多,有可能只是因为发出雷射这个动很难,所以高级 AI 做得比较顺手。 AI 需要把武器瞄准目标,还要追蹤它们,这样的举动需要更多的运算能力,而且还会佔用宝贵的捡苹果时间。所以除非玩家觉得发雷射划得来,否则大概会乖乖一起捡苹果。

那幺在 「狼群」 游戏中又如何?

这个游戏的情况则恰恰相反,较聪明的 AI,在这个游戏里较容易倾向于和其他玩家合作。研究人员解释,这也是因为跟其他玩家一起追蹤和围捕猎物,要求用更多运算能力 。

不得不说,不同级别的机器人模式转变的理由,真是十分实在。即便 AI 展现出来的合作与好斗的程度,跟他们的 「能力」 有关,但无论如何,研究结果都说明,人工智慧的行为模式会随着它们所面临的规则而变。如果游戏规则鼓励的是好斗的行为,也就是说你要好斗才能拿高分, AI 会变得好斗;如果游戏规则鼓励合作行为,那他们会表现得更为合作。显然上面的游戏中,第一个捡苹果的游戏更像一个零和博弈,你捡的苹果多了我的就少;第二个则像正和博弈,合作时双方或至少一方的利益会增加,也就是整体利益会增加。

这也告诉告诉了人工智慧研究的相关人员,未来在涉及多个 AI 互动的场景中,确保制定的 「游戏规则」 适当,是控制 AI 行为很重要的部分。就像研究人员在 部落格 中写道:

如果把上述游戏中的 AI 换成人,得出的结论很像社会心理学的基本假设,倾向于将人的行为模式归结到环境变化。然而人的不可控性在于複杂的七情六慾,还有内心各种特殊阴影,都会影响他的选择。对于机器而言,还没有性格可言,在同一环境下的不同行为,变量仅是运算能力。

也许囚徒困境不会是个问题,因为即便资讯不对称,只要你给我足够的演算力,我可以算出合作是最佳解。但人呢?即便智商够高,也不一定能相信坐在隔壁的人不会背叛我。

不过如果出现了影集《西方极乐园》的情况,机器人有了记忆和意识,不知道他们还会不会纯粹靠智商差异来思考?