中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑(多模态技术有哪些)

AIGC动态欢迎阅读

原标题:中国版GPT-4o炸场:国内首个流式多模态交互模型

,现场实时且丝滑

关键字:商汤,解读,模型,人工智能,时刻

文章来源:量子位

内容字数:0字

内容摘要:

金磊 发自 WAIC量子位 | 公众号 QbitAI没等到GPT-4o,商汤先把《Her》给发布出来了!

就在刚刚,商汤直接在现场来了个炸裂的Live Show,话不多说,直接看效果:

不仅声音非常拟人(观众直呼好磁性),而且还是实时、随时可以打断的那种!

它宛如被安上了一对儿眼睛,可以做到精准无误的所见即所得。

就连手绘的粗糙的简笔画,AI也能俏皮地跟人类做互动:

一波Live Show秀下来,引得观众掌声连连、“哇”声一片。

这就是商汤发布的国内首个流式原生多模态交互模型——6000亿参数日日新5.5系列中的5o所达到的效果。

据了解,这是一种全新的AI交互模式,把文本、声音、图像还有视频等模态全都囊括到了一起,可以让AI跟人们交流的时候变得更加生动丰富。

可以说是真·电影走进现实了。

而且商汤CEO徐立现场表示,很快就可以用上了!

但新的AI交互模型,也还仅仅是商汤在这次发布中的一隅。

纵观整场活动,商汤可以说是围绕着日日新5.5,把多模态这事给玩儿得66的。

各位看官,咱们继续往下瞧。

计算机巨佬们“活”了起来你没看错,商汤用新AI搞的另一个花活儿,就是“复活”了图灵、冯诺依曼

原文链接:中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?