LinkedIn新兴工作排行榜中,前5名的工作还有机器人工程师

GHFaTvb4 火狐体育电竞贴吧 2020-04-18 56 次浏览 没有评论

火狐体育电竞与国际象棋或围棋这些AI挑战人类的其他游戏不同,Hanabi是合作游戏,参与者可共同努力,朝着共同目标努力。游戏最大特点在于,牌面是向着别人,玩家看不见自己的牌,但其他人都看得见。大家的目标是下牌到桌面让5种颜色的牌都从1到5照顺序排出来。

火狐体育网址

火狐体育网址

曾经发表相关论文的牛津大学研究员JakobFoerster说,Hanabi是关于沟通和合作的游戏,人工智慧目前还没有深入这类游戏领域。其中一件非常令人兴奋的事是,我们观察到的改进,与透过深度强化学习观察到的改进,是完全正相关:你可以在任何策略上加上这个,效果会更强大。

火狐体育官网

火狐体育官网

研究员在电话采访这样告诉VentureBeat。我们看到的结果远远超出我们或其他研究人员的预期。实际上,我们从搜寻获得的好处,要强于过去所有深度强化学习演算法所获得的好处。据了解,这次Facebook的HanabiAI计画借鉴Pluribus一些搜寻技术,Pluribus是今年稍早推出玩扑克的AI,击败了一些人类冠军。报导称,Facebook的AI团队透过将搜寻技术与深度强化学习结合起来做到这次壮举。

火狐体育平台

火狐体育平台

搜寻演算法把一个代理之外的所有代理执行商定的策略将问题转换为单个代理设置,这是一种称为蓝图的强化学习演算法。根据一篇题为透过在合作部分可观察的游戏搜寻改进策略论文,这个演算法允许搜寻代理将其他代理的已知策略当作环境的一部分处理,并基于其他行为来维护对隐藏讯息的信念。

回顶部