欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

经过7万小时训练,OpenAI宣布做出了最强的《我的世界》AI

2023-04-06 09:38:23 159

摘要:视频是种潜力巨大的培训资源。Open AI最近公布了一项他们在人工智能领域的最新成果——最擅长玩《我的世界》的AI。厉害到什么程度?无论是建造地堡、金字塔这些复杂的建筑,跟游戏里的恶龙战斗,亦或是“白手起家”,制造出稀有的钻石工具都不在话下...


视频是种潜力巨大的培训资源。


Open AI最近公布了一项他们在人工智能领域的最新成果——最擅长玩《我的世界》的AI。


厉害到什么程度?无论是建造地堡、金字塔这些复杂的建筑,跟游戏里的恶龙战斗,亦或是“白手起家”,制造出稀有的钻石工具都不在话下,这些任务即使是交给熟练的人类玩家来做,往往也需要数十分钟的流程以及上万个点击操作。



而该AI在经过训练后,则可以在没有任何外力辅助的情况下自主完成这一系列事件,这是此前其他AI都无法做到的。根据Open AI的介绍,能够实现这一成果,依靠的是在模仿学习(imitation learning)技术上的新突破。


在这项技术中,AI会被训练成通过观察并模仿人类的行为来完成相应的任务,此前很多效果都运用到了类似的原理,比如控制机械手臂或者驾驶汽车。


既然AI需要观察模仿,那么就势必需要一定量的素材,而单就“熟练操作《我的世界》”而言,各大视频网站上的学习素材其实已经非常多,完全能够满足AI的学习需要。



但问题是,还需要另一项额外的工作,即“让AI准确理解视频里的内容”。


《我的世界》是一款没有明确目标的游戏,虽然网上素材繁多,可并不能直接拿来当作学习资料,因为视频里的每个动作和操作,其实都需要人类为其贴上“标签”,也就是做出相应的注释,才能AI明白操作的含义。


如果每个动作都需要人工注释,那效率自然会降低,为了解决这个问题,研究人员想出了一项新方法——训练能够自动为视频操作贴标签的AI。


他们先是召集了一批志愿者玩家来操作游戏,并保留了玩家们的按键记录,在得到2000个小时的游戏数据后,研究人员训练了一个新的模型,并人工将按键操作与游戏里的效果一一对应,比如在什么情况下点击鼠标会让人物挥动斧头。


下一步便是用这个模型来处理网上海量的《我的世界》视频,为他们贴上让AI能够理解的标签。根据公布的数据,为了得到理想的效果,科研人员提供的视频素材长达70000个小时。


而这确实也获得了一定的成果,比如像开头说的那样,AI已经学会了如何自己制作钻石工具。而Open AI的负责人Bowen Baker表示:“我们觉得《我的世界》是一个很好的研究领域。”


由于《我的世界》没有明确的输赢且自由度极高,所以研究人员可以训练AI执行更多复杂的任务,而他们认为这些工作最终可以反哺到现实——如果AI能在游戏里设计一张桌子,那么在现实里没准也行。

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网