腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用(腾讯混元文生图大模型)

AIGC动态欢迎阅读

原标题:腾讯混元文生图大模型全面开源!Sora同架构,更懂中文

,免费商用

关键字:腾讯,模型,架构,中文,能力

文章来源:智东西

内容字数:9404字

内容摘要:

首个中文原生DiT架构,中文原生文生图大模型来了!

作者|ZeR0

编辑|漠影

智东西5月15日报道,腾讯文生图负责人芦清林周二宣布腾讯混元文生图大模型全面开源。

该模型已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,与腾讯混元文生图产品最新版本完全一致,基于腾讯海量应用场景训练,可供企业与个人开发者免费商用。

这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。

跟其他业界开源模型对比,混元DiT在多个维度上无短板,并在美学和清晰度维度上具有一定优势。其综合指标在所有开源和闭源算法中排名第三,实现开源版本中的SOTA。

评测数据显示,腾讯混元文生图模型效果远超开源的Stable Diffusion模型及其他开源文生图模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。

升级后的混元文生图大模型采用了与Sora、Stable Diffusion 3一致的DiT架构,可支持文生图,也可作为视频等多模态视觉生成的基础。

混元文生图整体模型主要由3个部分组成:a)多模态大语言模型,支持用户文本改

原文链接:腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用

联系作者

文章来源:智东西

作者微信:zhidxcom

作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

0
分享到:
没有账号? 忘记密码?