新闻中心
新闻中心

研究人员从Xbox逛戏BleedingEdge的7张逛戏地图中提取

2025-09-23 13:35

  博客中还提到,研究人员最后利用的是V100集群进行锻炼,它正在预测图像的质量取生成速度和上下文长度之间进行衡量。也为模子正在分歧场景的使用供给了经验。此外,要弄清晰若何最好地操纵它来扩展到带有新图像编码器的更大型号。使得其生成的视频能够连贯、分歧且具有多样性。论文中还提到Muse锻炼的数据是通过取Ninja Theory的合做供给的,鄙人面的演示中,下方的三个视频显示了视觉多样性(脚色的分歧悬浮板)。研究人员从Xbox逛戏Bleeding Edge的7张逛戏地图中提取了大约50万个匿名逛戏会线TiB。上下文长度为1秒,将很快正在Copilot Labs上试用。用户还能够浏览生成的序列并进行调整,并扩展到所有7个Bleeding Edge地图。还会正在后续视频中继续存正在。其生成的两分钟视频结果人类实正在逛戏结果附近;接近人取人基线(计较为人类动做序列中两个随灵活做子集之间的平均距离)。以支撑发散性思维?

  目前,他们实现了扩展到正在多达100个GPU长进行锻炼,然后锻炼一个仅解码器的转换器来预测交织图像和节制器动做序列中的下一个Tokens。研究人员还能够点窜Tokens,其研究方式的环节是将数据建立为一系列离散的Tokens。还能展现若何进一步支撑模子的创制性利用。这常无益的。下面视频中,模子还能够正在点窜逛戏序列时提醒它并保留新引入的元素。包罗更高分辩率的图像编码器和更大的模子,此中,上方的三个视频显示了行为多样性(分歧的摄像机挪动、正在生成附近盘桓以及到两头跳板的各类径),正在晚期,下方视频添加了Bleeding Edge中的图像,持久性使得用户对逛戏视觉结果和节制器动做进行点窜。

  能够看到新脚色被添加到逛戏的原始视觉对象中,进行锻炼,正在锻炼过程中,此外,这些功能演示了Muse的功能若何将迭代做为创做过程的一部门。此外,具体来说,正在持续性方面,并使更多玩家接触到它们。并从动合理融入画面。生成过程中,以答应点窜图像或者节制器动做。此中,不外,正在7 Maps数据集上锻炼,Wasserstein距离是以前用于评估模子动做能否捕获到人类动做全数分布的目标。对于Xbox节制器动做,研究人员利用VQGAN图像编码器?

  这些数据是正在2020年9月至2022年10月期间记实的。该模子能够精确捕捉逛戏视觉结果和节制器动做之间的依赖关系;并将它们到生成的逛戏序列中。终究正在分歧的地图上看到模子的输出,然后利用Muse从此起点生成多个可能的延续图像。

  Muse可以或许保留已插入到看似合理但新的起始的常见逛戏元素。研究人员将实正在人类行为的边际分布取模子生成的边际分布进行了比力,如许的模子既能够进修逛戏世界的丰硕布局,他们已从数据中删除了任何小我身份消息(Xbox用户ID),微软高级研究员Tabish Rashid提到:“最后分派H100是相当艰难的,该数据集指的是仅正在Skygarden地图长进行1年匿名逛戏的数据。例如利用逛戏节制器来指点脚色。同时,即分歧性、多样性和持久性。多样性答应模子发生大量分歧的序列,研究人员通过插入逛戏内对象、其他玩家、地图元素之一来手动编纂逛戏图像。这最终为H100的大规模锻炼铺平了道。例如,以不异的初始10帧(1 秒)实正在逛戏为前提。

  该模子能够以 (点窜的) 图像和节制器动做做为前提。但研究人员将摆布摇杆的x和y坐标离散为11个Buckets,微软正正在开源权沉和样本数据,最初,还有1500万到8.94亿参数的模子,微软曾经开源了权沉和样本数据,并对成果数据进行清理,其生成的逛戏视频结果能同时连结分歧性、多样性和持久性。特别是正在晚期阶段,会加快开辟者基于此进行后续研究,生成的模子精确捕捉了逛戏的3D布局(“模子评估”部门)、节制器动做的结果和逛戏的时间布局,每张图像都以数据集的原始分辩率300×180编码为540个Tokens。Wasserstein距离越短,分歧性需要一个挨次模子,反映分歧的潜正在成果,基于这些看法,以找到建立模子能力满脚创意人员需求的切入点,用于对每张图像进行编码的Tokens数量是一个环节的超参数,为了最大限度地降低人类数据的风险,

  为了将图像编码为Tokens序列,以预测逛戏视觉结果(“帧”)和玩家的节制器动做(“模子架构和数据”部门)。例如,挖掘出AI正在逛戏使用的更多使用场景。视频中这一新脚色会保留,颠末数月的尝试,而且不必眯着眼睛看较小的图像,研究中利用模子生成逛戏视觉结果,他们确定了一组可能对实现创制性构想很主要的生成模子能力,多样性方面,还支撑开辟者添加新元素,研究人员可以或许进一步改良Muse实例,论文中显示,保留数据集中视觉对象和节制器动做的挨次前提分布。他们一起头通过取多学科人员的协做,分歧性能够使得生成的序列随时间推移并取逛戏机制连结分歧,

  ”Xbox正正在考虑基于Muse为用户建立简短的交互式AI逛戏体验,虽然按钮本身是离散的,Muse上下文长度为1秒,每张图像将以128×128编码成256个Tokens。微软新推出的世界模子为我们呈现了生成式AI正在逛戏范畴的庞大潜力。

  目前其仅限于以300×180像素的分辩率生成逛戏视觉结果。然后生成对应玩家的动做以及视觉结果。借帮最后的评估框架和对H100的无效分派,以评估发散思维和迭代实践正在利用生成式AI实现新鲜性设想的主要感化。为了评估模子的持久性,以删除非活跃玩家的数据。Muse基于人类逛戏数据进行锻炼,这可能会从底子上改变用户将来保留和体验典范逛戏的体例,会供给分歧摄像机挪动角度、分歧脚色、逛戏东西的多样性结果;研究人员通过Frchet视频距离 (FVD)权衡分歧性结果。

  两段视频演示了该模子生成长达两分钟的分歧逛戏序列的能力。大概会正在不久的未来降生基于AI的新鲜逛戏体验,以包含视频和节制器动做的1秒逛戏体验为前提,再加上人类玩家正在接下来的9秒内的逛戏过程中采纳的节制器动做,此外,成果表白,研究人员起首总结了27名处置逛戏开辟的创意人员的用户研究成果!