Ubisoft揭开了生成的ai neo neo npcs",而彼得·莫里诺(Peter Molyneux)的米洛(Milo)的精神一直在
与去年一样,AI仍然是GDC 2024年该镇的话题。RobloxStudio宣布了一个新的基于AI的角色创建者 。图形卡制造商NVIDIA推出了一种新的AI驱动芯片 ,其股票价格飞涨。在闭门造车后面,Ubisoft向一小部分媒体展示了自己的内容:与Inworld AI的合作伙伴关系,为“新发展的NPC ”或Ubisoft称他们为“新的NPC”或Neo NPC创建原型。
在这里强调“原型”因素很重要 。在活动中 ,Ubisoft简要介绍了其研究团队的起源 - 由Ubisoft Paris和支持的Ubisoft生产技术人员及其目标 - 通常将该项目称为“实验 ”。此后,我有机会坐下来,实际上“玩”三个,大约10分钟的长时间演示在假设游戏的情况下进行了行动。但是 ,尽管这些演示在技术上是可以播放的,但目前它们被明确描述为“独立的概念证明”。在动手实践之后的简短小组讨论中,研发团队的高级数据科学家MélanieLopez Malet说 ,他们只是“只是在我的雷达上划过地面……在我的雷达上都不是在我的雷达上 。”
尽管如此,这还是生成AI的第一个工作示例之一。有点
新闻广播:为什么这么多电子游戏行业裁员?
完整的前提是,用Ubisoft的话来说 ,使用NPC使用生成AI的典型方法 - 例如,用于对话中的ChatGpt式功能的标准游戏大型语言模型(LLM)mod通常在实践中是“空的 ”或“浅”。尽管他们可以从技术上说什么,但这些NPC所说的话不会影响游戏本身 ,因此,正如科学总监David Louapre所说,您最终所说的是“角色扮演 ,不是游戏玩法” 。NEO NPC的目标是做一些将两者融合的事情。
演示被用作实践中该技术可能使用的示例。第一个涉及与假设的Ubisoft游戏中略微讽刺的摘要中与一个名为Bloom的角色进行对话 。布鲁姆(Bloom)是一个穿着牛仔衬衫和下垂的豆豆的永恒的男人,是抵抗运动的成员,并希望认识您“检查我们是否有兼容的氛围 ”。您有一些目标 - 与他成为朋友,找到更多有关某些主题的信息 ,等等 - 与对话结合在一起。对话本身是通过语音到文本进行的:您按住LT并说话成麦克风,而Bloom则做出了相应的反应 。
在第二种情况下,布鲁姆再次与您聊天 ,该团队对游戏中的电视屏幕实时反应,显示无人机在敌人的位置偷偷摸摸,并由第三个外屏幕外角色控制。布卢姆(Bloom)在显示器上出现时大喊“敌方士兵发现” ,同时还与您聊天并提供与任务相关的对话提示。
“黑客可以继续 。”|
在第三种情况下,我们正在与另一个称为Iron的角色聊天。在GTA抢劫式设置中,我们正在研究一个计划委员会 ,该计划委员会展示了我们希望渗透的敌方基地的平面图。铁询问我们要如何接近它,并对我们所说的一切做出相应的反应,最终同意实际可玩选项的一组清单之一 - 例如 ,使用窗户旁的树将树抓到建筑物中,或者使用烟手榴弹进行封面,我们注意到我们注意到房间周围躺在房间周围并提供了建议。
所有这一切的第一印象 - 实际上与其他一位看到演示的记者进行了几次对话中,这是有点熟悉的 。如果您还记得E3 2009年舞台上臭名昭著的时刻 ,彼得·莫利诺(Peter Molyneux)向他的注定的人工智能朋友米洛(Milo)承诺了一些相似的事情。
注定是否像任何自重的哺乳动物一样,我对假装自己物种成员的人工实体进行对话的第一个回应是无情地嘲笑它 - 或者至少,至少 ,测试其逻辑的界限并查看可能失败的地方。结果混合在一起,并很好地了解了NEO NPC的限制 。当布卢姆(Bloom)向我们询问我们可能会带来阻力的任何专业技能时,我们建议对钢管弹和平稳的讲话 ,他回答了这一点,他回答了一个可能的文字游戏,以使我们兴奋地与我们一起“取得飞跃 ”。
随着我们进入第二和第三个演示 ,角色记得我们之前谈到的。但是,尽管我们最好地尝试找到一根大杆,以推动自己穿过敌人大院的上窗 ,但我们总是被带回到可玩的游戏中选择 - “我认为我们没有那么大的杆子” 。我们提出的建议是找到一个大纸板箱,将其放在头上,蹲下,并用它偷偷溜走后卫:“听起来像是一个好主意 ,但我认为我们无法找到足够大的纸板箱以适合我们俩的纸板,”巧妙地观察到了铁。
Cluedo的游戏将永远不会再相同。|
作为非常早期的原型,对话也与LLM驱动的聊天机器人的通常局限性相抵触 。例如 ,对话的很少会通过人类编辑。也许我们可以在某一时刻“浏览画廊窗户上的窗户 ”。“哦,尼尔森,你肯定知道如何赢得抵抗 ,”布卢姆早些时候就说 。研究小组叙事总监Virginie Mosser将她的工作描述为像导演一样,提示“即兴演员” - 给他们个性,背景和详细的简介 ,他们向外开花。她在新闻稿中说:“作为一名作家,看到我的角色栩栩如生,并第一次与我交谈一直是我职业生涯中最充实 ,最感人的时刻之一。 ”毫无疑问,与您创建的角色进行公开对话一定是一个令人惊讶的时刻,但是正如老电影所说的那样,导演只能像演员一样出色。
更有趣的是 ,恰好是原型本身的核心存在的某种存在的困境 。是的,NPC可以对您对他们说的一切产生近乎无限的可能性的反应,随后他们可以将这些反应束缚于实际变化的游戏内目标 ,场景,任务等。但是,除了聊天机器人之外 ,育碧声称的这些新NPC设定了这些新的NPC,这是它们最终位于人类设定的“墙壁”中。因此,您可以建议在盒子里被警卫划掉 ,但是除非在这种情况下这是20多个预设的解决方案之一,否则您实际上不能做到这一点 。(实际上,当我通过通知铁进行测试时 ,我会拒绝执行任务,除非她让我使用大型纸板策略,否则她屈服了 - 育碧专家告诉我这是一个错误)。
剩下的是与标准游戏非常相似的东西,在该游戏中 ,您可以在环境中找到有关棘手或可用的线索的线索,请提供它们,直到角色说“是” ,然后继续进行预编程的选择。为了沉浸式,所有无限的对话有效地颜色 - 角色扮演,但仍然不是真正的游戏玩法 。
如果没有语音到文本作为输入(或使用键盘) ,那么它如何工作也有限制 - 育碧本身所指出的这并不是大多数玩家的首选选项。但是,删除语音元素将意味着再次恢复到标准的游戏设计策略:具有对话选项的设定列表,也许其中一些隐藏在您发现游戏中的某些东西以触发其可用性之前 ,然后简单地浏览您想说的内容。
从左到右:MélanieLopez Malet(高级数据科学家),David Louapre,(科学总监) ,Emmanuel Astier(高级负责人程序员),Xavier Manzanares(制片人),Virginie Mosser(叙事总监)
当然,最重要的是 ,当涉及生成AI时,仍然存在与以往相同的问题 。例如,没有提及使用中正在使用的模型的培训数据。关于Inworld AI网站FAQ部分的答案是 ,该问题是否开放了AI的大型语言模型,例如GPT -4和CHATGPT(目前是纽约时报的版权侵权诉讼的主题),尽管这是值得指出的 ,因为这项技术可能与该技术有所不同,但该技术可能是不同的。
"We have 20+ models that drive our characters. This includes non-LLM models like emotions, text-to-speech, speech-to-text, and more. For LLMs, we dynamically switch between LLM APIs and our own proprietary models depending on which is best for the conversational context and latency. Our goal is to provide you with the best and fastest answers. We understand the strengths of the individual LLM APIs and our own models, and dynamically query the one that will provide the best角色经验 。
正如Ubisoft的团队在活动中所说的那样,结果是一个原型 ,它更多地依赖于将来“可能”的概念,而不是现在。有人建议,未来的新NPC可能比当前的发现类型 ,或者在这些NPC发现或遇到的情况以及它们的行为方式之间更接近“视觉 ”。
从这个意义上讲,值得给它一些好处:乌比索夫(Ubisoft)竭尽全力地强调,这是关于“在其中有什么创意;玩家中有什么?”,并且尝试将技术与实际游戏玩法相匹配。再说一次 ,这些演示实际上只是模型,可玩的概念验证,因此 ,判断他们对技术的说明而不是手头的任务设计很重要 。
但是,它也又回到了其他AI技术(尤其是在视频游戏中)以及最近的许多近期革命性思想的另一个问题。目前,这一切仍然纯粹是投机性的。这是一个首先构建的工具 - 就这样一个概念而言 ,如果我们构建它,那么聪明的人肯定会出现并利用它 。有一个论点要说的是背靠背:最好的工具是解决那些聪明人已经遇到的问题的解决方案。
在同一NEO NPC新闻发布会上,Ubisoft Boss Yves Guillemot将Generative AI描述为要测试的另一种新技术。
相关文章
发表评论