AI PC让马良的创作变得神奇,NPC变得喋喋不休。(马良教程)

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图1

NPC对话(图片来源:钛媒体APP作者拍摄)

“我正在寻找马丁-莱恩先生,他告诉我他目前正在这间酒店居住,我有急事,请你帮我联系他,谢谢!”我说道。

“非常理解您焦急的心情,但是处于对酒店客人隐私的保护,我无法提供这位客人的信息给您,很抱歉。”前台服务员表示。

“我知道马丁-莱恩先生在这里寄存了物品,我是受到他委托来取走的,请你把它交给我吧。”我说到。

“好的,那您可以将行李寄存的收据给我吗?如果没有收据的话,可以让马丁-莱恩先生给礼宾部打电话,告知我们将东西给您。”

以上两段对话,听起来很像是摘取自某部小说或者是电影、游戏内容的固定台词,但它们竟然出自人与电脑的语音交流。

人工智能使得游戏中的非玩家角色“栩栩如生”

更准确地说,上述这些对话是玩家与游戏非玩家角色(NPC)的交流,只不过游戏流程中既没有固定的逻辑脚本,也没有预设的提问和回答选项。玩家唯一要做的就是想尽办法与电脑进行对话,以获取信息。

电脑的目标是确认玩家的身份是否与目标人物相关,同时尽可能保守秘密。换句话说,这场对决实际上是人脑与电脑之间的“智力与信息的攻防游戏”,而驱动这台电脑的背后技术正是当前被所有行业集中讨论的“生成式人工智能”。

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图2

ACE技术演示(图片来源:钛媒体APP作者拍摄)

早在去年的COMPUTEX展会上,英伟达就推出了ACE(Avatar Cloud Engine)技术,旨在通过生成式人工智能为游戏中的非玩家角色(NPC)带来智能对话和互动功能。如今大家看到的是最新的DEMO演示,展示了ACE技术在游戏中的应用。

与过去采用固定语句、动作与玩家交互的方式相比,利用NeMo语言模型,ACE可以创建能够进行自然语言对话的非玩家角色(NPC)。这些NPC不仅能够理解玩家的输入,还能根据特定的背景和情境生成合适的回应。例如,上文提到的各个角色会根据自己的身份进行回答,并且在称谓和回答内容上也会更加贴合真实场景。

对于ACE技术的出现,最大的意义在于可以帮助游戏内容制作者打破“线性”叙事的框架,也就是说,所有的游戏内容并不需要按照固定的内容流程完成。玩家可以充分发挥自己的想象,甚至可以颠倒任务的前后顺序,只要围绕最终目标即可,但这仅限于推理类的游戏,因为此类游戏中非玩家角色(NPC)的重要性更高。

对于其他游戏而言,如果拥有开放式世界设定,也会在ACE技术上获得巨大的好处。因为每一个非玩家角色(NPC)都拥有了自己的“思维”,而不是像传统游戏那样只有固定的逻辑,每天重复相同的事情。相比之下,过去的游戏就像电影《楚门的世界》一样,只有玩家一个人可以尝试灵活处理情况,而在ACE技术的支持下,玩家想出的各种创意操作,电脑都能找到应对的方法。

想象很美好,对吧?但就如同每次游戏画质的展示DEMO一样,回看2012年的虚幻4引擎展示,现在很多3A大作可能都还无法达到它的水平,ACE技术的应用也是如此,它的条件还是非常苛刻的,现阶段对线上同时在线的玩家数量、网络带宽等都有着严苛的要求。

想象很美好,对吧?但就如同每次游戏画质的展示DEMO一样,回看2012年的虚幻4引擎展示,现在很多3A大作可能都还无法达到它的水平,ACE技术的应用也是如此,它的条件还是非常苛刻的,现阶段对线上同时在线的玩家数量、网络带宽等都有着严苛的要求。

据英伟达工作人员介绍,想要获得与非玩家角色(NPC)的实时沟通体验,需要使用专线网络。同时,为了确保良好的游戏体验,在线的玩家数量也需要控制在个位数。对于一款商业游戏而言,这样的限制是完全不可接受的。

那想要增加玩家接入量,对于游戏开发商而言,就需要更强大的云端算力作为支持,但在整个游戏内容的制作过程中,是否应该为非玩家角色(NPC)配置如此重要的资源以及它们能够给玩家带来的反馈提升,都是现阶段面临的问题。所以说,ACE技术确实展现出了一个能够让游戏NPC“活”起来的方法。

人工智能计算机成为数字时代的“神笔”

“神笔马良”是很多人都熟悉的中国童话故事,讲述了马良通过一支神奇的笔,将自己的画作变成真实的物体。而在AI时代,个人电脑反而成为了现代版的“神笔”。一方面,借助于Stable Diffusion等工具,我们可以将文字描述转化为图像,这样就能够将脑海中的构想以最简单的方式呈现为画作,即使没有绘画天赋的人也能够实现这一目标。

以英伟达目前的消费级旗舰产品RTX 4090 D为例,作为市面上最快的Stable Diffusion计算出图方案,它可以支持每秒8张图的生成速度。使用当前最快的Stable Diffusion加速方法TensorRT,再配合开发者进一步的性能优化,目前RTX 4090 D GPU最高能实现每秒超过100张图的生成速度。

以英伟达目前的消费级旗舰产品RTX 4090 D为例,作为市面上最快的Stable Diffusion计算出图方案,它可以支持每秒8张图的生成速度。使用当前最快的Stable Diffusion 加速方法TensorRT,再配合开发者进一步的性能优化,目前RTX 4090 D GPU最高能实现每秒超过100张图的生成速度。这意味着RTX 4090 D GPU的性能非常强大,可以在短时间内生成大量的图像。

这是什么概念呢?路边的肖像速写是一种快速绘画人像的方式,通常在10分钟左右完成一幅作品。而与之相比,在同样的时间内,Stable Diffusion生成的图片数量(每秒8张)足够支持组合成每秒30帧的视频,播放时间长达两分半钟,总共生成了4800张图片。

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图3

利用本地算力实现图生图(图片来源:钛媒体APP作者拍摄)

当然,AI PC的能力不仅仅体现在文生图上,图生图的应用也很有趣,比如通过人像生成控制模型InstantID,就快速通过搭载RTX 4090 D的RTX AI PC上由普通摄像头的自拍照生成高质量影棚级别的肖像照,别的场景不说,至少笔者认为对很多以拍证件照作为主要盈利手段的小摄像馆来说,这项功能绝对是“抢饭碗”的利器。

应该说,更快的生成图像的速度、更广泛的图像生成应用,并不是什么稀奇的事情,毕竟并不是每一张图片都能符合预期。而且,有经验的AI生成图像的人都知道,生成的图片质量参差不齐,通常需要不断修改和尝试才能得到基本满意的效果。而绘画则不同,通常在开始时就有了大致的方向,中途也可以进行小范围的调整。

但钛媒体APP认为,AI生图应用出现,最大改变在于把绘画的门槛降低了,同时也进一步解放了人们脑中的万千创意,像“科幻元素“的作品,大众普遍能够输出的目前只包括文字部分,你可以把天马行空的想法“写”下来。

AI生图应用的出现使得绘画变得更加容易,不再需要具备专业的绘画技巧。同时,它也让人们的创意得到了更大的发挥空间。以前,大众只能通过文字来表达自己的想法,而现在可以通过AI生图应用将自己的奇思妙想变成现实。无论是科幻元素还是其他创意,都可以通过AI生图应用来实现。这种应用的出现,让人们的创作变得更加自由和多样化。

文字表述自然有其任凭读者想象优势,但在直观性上也恰恰受到了限制。因此很多科幻小说作品,比如《三体》《沙丘》等等,文字的描写在精妙,也会有很多超出读者想象的画面,而将这些作品影视化改编,其所付出的成本却又高的离谱,那么,通过AI绘图,是不是刘慈欣就可以简单描绘一下他心中的《三体》了呢?这是很有可能的。

其实,目前已经有很多设计师、艺术家,努力将生成式人工智能提供的“将想法变为现实”的能力转化为自己的创造力。

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图4

设计应用(图片来源:钛媒体APP作者拍摄)

在建筑设计领域,AI利用扩散模型和蒸馏技术,结合RTX GPU的加速,实现了实时绘画功能。设计师只需简单勾勒出线条,AI就能根据目标风格绘制出具体的概念图。这样设计师可以更多地专注于思考创意,而不是花费时间逐笔绘制。

所以说,AI PC的生产力属性,在绘画方面的表现真的非常出色。一方面,它确实极大地降低了绘画的门槛,不再需要掌握具体的绘画技巧和色彩选择,这些都可以由AI来完成,人们只需要专注于自己的“创意想法”。

另一方面,ChatGPT在行业中的渗透和落地应用潜力也是非常直接的。虽然ChatGPT可以做很多事情,但很难直接创造商业价值。然而,对于艺术家和设计师来说,使用ChatGPT可以大大提高出图效率,甚至提升几十上百倍,并且可以实现“想法预览”,这对他们来说是直接转化为生产力的。

无论是在视频会议还是游戏场景中,人工智能(PC)无所不在

很有意思的一点是,目前行业内对人工智能个人电脑(AI PC)的定义也存在一些分歧。根据英特尔的说法,预计到2023年底才会出现真正意义上的AI PC,而2024年将成为AI PC的元年。然而,微软和高通则认为AI PC是在2024年刚刚推出的一种新型个人电脑。

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图5

英伟达对AI PC的规划(图片来源:钛媒体APP作者拍摄)

但如果要追溯到更早,实际上英伟达于2018年就推出了RTX技术和首款专为 AI 打造的消费级GPU芯片 (GeForce RTX) 。在他们看来,AI PC 是搭载专用AI加速硬件的计算机,而在RTX GPU上,这些专用的 AI 加速器被称为Tensor Core。

Tensor Core的出现,实际上是为了提高AI性能,并将以前只能在云端运行的AI新功能引入到PC用户中。为了满足开发者和深度AI用户的需求,英伟达还推出了TensorRT开发者套件,用于加速深度学习推理性能。

TensorRT能够提升热门的生成式AI模型的速度,例如Stable Diffusion1.5和SDXL等。此外,TensorRT还支持全新的UL Procyon AI图像生成基准测试,并能够加速其运行。

AI能力除了可以用在提升游戏开发、生产力上,它还能应用于各种工作领域。当你觉得用自拍生成棚拍画面已经很令人惊讶时,AI的1分钟语音克隆能力可能会让你感到有些“惊悚”。

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图6

通过AI克隆声音(图片来源:钛媒体APP作者拍摄)

基于RTX GPU加速的声音克隆技术可以通过仅用5秒的录音来生成克隆声音,实现个性化声音生成而无需进行训练。该技术基于开源的GPT-SoVITS项目,可以快速使用5秒的声音样本,根据其发音特征生成个性化的语音片段。这个过程只需要五分钟就能完成。如果使用更多样本(1分钟)进行微调训练,可以实现更高质量、接近1:1复刻的声音克隆。

作为消费级GPU产品的供应商之一,英伟达非常重视AI PC在各个领域的应用,其中之一就是在“游戏”领域。为了提升游戏的画面效果,英伟达推出了DLSS图形技术,该技术利用AI来提高游戏的帧率并改善图像质量。最新的DLSS 3.5技术还可以通过AI增强光线追踪的表现,这让备受期待的《黑神话:悟空》和《永劫无间》游戏能够支持DLSS 3.5的光线重建和全景光线追踪技术。

AI PC让马良的创作变得神奇,NPC变得喋喋不休。_图7

AI对游戏图像进行增强(图片来源:钛媒体APP作者拍摄)

换句话说,就是让显卡能够以更低的负载,输出更高帧率的画面以及光影质量更加逼真的内容,而这一切并不是通过传统意义上增加图形算力获得的,而是通过人工智能(AI)能力获得的。此外还有RTX Remix技术,通过使用生成式人工智能工具自动增强材质,以及借助全景光线追踪和DLSS快速创建画质更好的“重制版”游戏。

其他一些方面,人工智能的应用也在迅速普及中,比如早期推出的NVIDIA Broadcast应用,可以为直播提供AI增强型语音、视频工具,包括消除噪音和回音、虚拟背景和AI绿幕、面部追踪、视频降噪和目光接触等功能。目前许多主播已经开始使用该应用,它的最大优势是本地算力调用不占用网络带宽且延迟低。

如果讨论生成式人工智能(AI)所能展现的多样性和潜力,英伟达无疑是目前最具发言权的厂商。无论是已经涌现的各类应用,还是各个AI公司争相争夺的高算力图形处理器(GPU),都能够展示其在AI领域硬件方面的领先地位。然而,要想普及AI个人电脑,或者让普通消费者为AI功能而购买或升级GPU,目前来说并不现实。

可以预见的是,人工智能(AI)在各行各业的应用会越来越广泛,同时其对娱乐、办公、社交等场景的渗透也会逐渐加深。与之前发布的许多技术不同的是,生成式人工智能的加入通常是“无感知”的。例如,由Stable Diffusion生成的绘画作品往往具有高质量,很难分辨真伪。而经过ACE技术加持的NPC(非玩家角色)也与真人有些相似,更不用说人工智能还能帮助实现声音克隆等能力。

对于娱乐场景来说,追求高帧率和更逼真画面的用户可以通过更新GPU并选择开启AI功能来增强体验,在生产力应用上,GPU似乎也有望成为“隐形战力”。

0
分享到:
没有账号? 忘记密码?