近2000亿元投入AIGC赛道,回顾2023年度世界最热门的十大AIGC工具。(aic世界赛2021)

近2000亿元投进AIGC赛道,盘点2023年度世界最火的十大AIGC工具

自2023年以来,以ChatGPT为代表的生成式 人工智能AIGC,人工智能生成内容)技术成为整个科技行业最热门的讨论话题。

人工智能技术的迅猛发展,不仅将重新塑造传统农业、制造业、工业、信息科学等领域,而且对经济社会的各个领域都将产生重大影响,对国内生产总值(GDP)的推动作用也有望逐渐显现。

首先,从投资者到创业家、从独角兽公司到大型企业、从行业内到学术界、从经济专家到电影从业者,都开始意识到人工智能技术对生产和生活的重要改变。根据Gartner的最新预测,超过80%的企业都希望在工作中使用人工智能图像识别(AIGC)的API和模型,或者部署支持人工智能图像识别技术的应用程序,而到2023年初,这一比例还不到5%。

此外,AIGC已经为全球超过38万亿美元数字经济提供了巨大的推动力。根据高盛经济学家的估计,未来10年内,AIGC技术有望推动全球GDP增长7%,相当于接近7万亿美元,并且每年将全球劳动生产率提高1.5个百分点。

最后,AIGC也成为今年唯一呈现高增长的投融资赛道。根据风投数据分析公司PitchBook的数据显示,截至今年10月15日,2023年,全球AIGC领域筹集融资总额达232亿美元(约合人民币1656亿元),比2022年全年增长250.2%,其中AI核心(Al core)领域融资达到50.82亿美元。截至目前,全球AIGC新兴领域相关公司的总数量已超过1500家。

钛媒体App详细整理了2023年至今10个最受欢迎的人工智能工具产品,旨在让更多企业家、投资者和用户了解大型语言模型(LLM)人工智能图形计算(AIGC)将如何改变人们的生活。(排名不分先后)

1、ChatGPT和DALL·E 3

随着2022年11月美国OpenAI公司推出聊天机器人ChatGPT并引发全球热潮,发布仅5天,注册用户数就突破100万,至今热度不减,每周已有超过1亿人使用ChatGPT,有超过200万开发者在该公司的API上进行开发,高达92%的财富500强公司使用它。

今年3月,全新预训练模型GPT-4发布,技术能力全面提升。全新ChatGPT-4的体验效果比之前版本更好,同时具备更高的创造性和协作性。此外,它还内置了DALL·E 3文生图模型,使得ChatGPT能够与用户一起生成、编辑和迭代技术与创意写作任务。与此同时,OpenAI还加大了商业化和安全对齐工作,以减少“幻觉”要素。

目前,ChatGPT的功能正在不断改进。最新推出的增强版本是GPT-4Turbo,它具有128K上下文窗口,响应速度更快,数据准确性也得到了显著提升,同时还能提供更周到的反馈。据称,OpenAI计划在不久的将来推出GPT-5产品。

除了ChatGPT之外,类似的 AI 聊天软件产品还包括谷歌 BardClaudeChatSonic、Jasper AI等。

体验链接:https://openai.com/

2、中途旅程

Midjourney是一款基于人工智能生成图像的应用服务,用户可以通过Discord平台使用自然语言描述来生成图像。这款产品非常受欢迎,在人工智能生成图像的潮流中表现出色。

Midjourney是由美国旧金山的AI实验室Midjourney, Inc.开发的。该公司的创始人兼CEO David Holz曾是Leap Motion的联合创始人。在2021年,David Holz带领着11名全职员工成立了Midjourney,并在短短一年的时间里吸引了超过1000万用户和一亿美元的营收。

2022年7月12日,Midjourney首次向公众公布,并开始推出公开测试版,并经历了快速的版本更新。

去年9月举行的2022年科罗拉多州博览会期间,参赛选手Jason Michael Allen基于Midjourney生成的 AI 图像“空中歌剧院”(Théâtre D’opéra Spatial)赢得了本届博览会的年度美术竞赛,随后被广泛报道。目前,包括英国杂志《经济学人》、《大西洋月刊》等多个平台都曾采用Midjourney图像产品。

如今,由于Midjourney V6生成的图像非常逼真,即使是相同的女性面部主体,V6在皮肤细节、毛发细节和光影效果方面都比V5.2更出色。实际上,几乎无法分辨出是真实拍摄还是由AI生成的图像。因此,这引发了更多人对AIGC技术的讨论。

体验链接:https://www.midjourney.com/explore

3、稳定扩散

稳定扩散(Stable Diffusion)是一种基于潜在扩散技术(LDM)的深度学习文本到图像开源模型,由英国人工智能初创公司Stability AI开发,于2022年发布。

Stability AI创始人兼CEO莫斯塔克(Emad Mostaque)来自孟加拉国,在英国长大。他在2005年获得牛津大学数学和计算机科学硕士学位,毕业后在英国一家对冲基金公司工作了13年。2019年,他曾创业做了一家身份认证的SaaS公司,但并不顺利。2020年底,Emad Mostaque卷土重来,创立Stability AI,初衷就是打造一个AI开源的平台。

2022年10月,Stability AI成功获得1.01亿美元的融资。截至去年底,Stable Diffusion已经被全球超过20万名开发者下载和授权,成为目前最受欢迎的开源模型。而Stability AI面向消费者的产品DreamStudio已经有超过100万注册用户,共同创作了超过1.7亿张图像。

2023年,随着ChatGPT的热门,Stable Diffusion产品再次引起了人们的关注。2023年12月20日,Stability AI宣布将视频生成模型Stable Video Diffusion添加到开发者平台 API 中。据报道,该模型可以在平均41秒的时间内生成2秒钟的视频,其中包括25个生成帧和24个FILM插值帧。

试用链接:https://stability.ai/stable-image

4、跑道

Runway是一家国外的在线视频编辑制作网站,成立于2018年。其中,Stable Diffusion是一款AI生成绘画模型,它借助了Runway等公司提供的技术支持。随着人工智能生成内容的流行,Runway团队将其产品定义为基于AI的创意工具,也就是一个AI原生工具工厂。从产品特点来看,Runway的定位是专业、协作、快速,并提供了许多AI魔法工具。关键在于其机器学习和云原生能力。

借助于人工智能技术的迅速发展,今年以来,Runway持续推出适用于产品的新模型框架,其中包括Gen-1和Gen-2两代图像视频编辑软件。目前,个人专业版的收费价格为每月12美元,团队版为每月28美元。

目前,Runway已经发布了 30 多个AI Magic Tools,包括文本生成、图像生成、音频处理、视频抠图等市面上主流 AI 功能。尽管在专业视频编辑场景,Runway难以撼动Adobe、达芬奇(Davinci Reslove)这些传统专业视频编辑软件地位,但在轻量化和图像生成领域,Runway具有一定的竞争力,将成为以合作为中心的自动化创作工具。

截至目前,Runway公司已经成功获得超过1亿美元的融资,使其估值达到15亿美元。令人惊讶的是,这一成绩是在不到一年的时间内实现的,公司的估值增长了3倍以上。

试用网址:https://runwayml.com/

5、Notion AI

2023年2月,Notion推出了一款基于人工智能的项目管理和协作工具插件Notion AI,受到了广泛赞誉。

Notion AI利用强大的模型和数据收集能力,可以帮助用户自动整理笔记、纠正错别字、提取文章重点、进行翻译、创建表格等。如果你是学生,使用Notion搭配Notion AI可以提高学习笔记的准确性和易读性;如果你是上班族,通过Notion AI可以快速生成讨论大纲、会议行程甚至报告内容。此外,Notion AI执行速度快,生成的内容可以以条目或表格形式呈现,大大简化工作流程。

目前,Notion AI的收费标准是每人每月10美元,如果选择年付,则每人每月优惠到8美元。

点击此处体验:https://www.notion.so/

6、HeyGen

HeyGen是一款备受争议的AI语音转换产品。今年10月底,美国著名歌手Taylor Swift在网络上分享了一段视频,其中她用中文说普通话,而赵本山和郭德纲则用英语表达。这段视频迅速在网络上热传。在视频中,Taylor Swift用中文说道:“我最近去过很多地方,比如意大利、法国和日本”,她的口型和说话内容完美地配合,达到了以假乱真的效果。

随后,该视频被剪辑发布到TikTok、B站、抖音、视频号等平台中,迅速引起了大量关注。这种是利用HeyGen生成的深度伪造类视频,其真实程度让大众非常震惊。

根据公开资料,HeyGen是一家中国公司,成立于2020年11月。公司由徐卓(Joshua Xu)和梁望(Wayne Liang)共同创立,徐卓曾在Snap担任软件工程师,梁望是同济大学的校友,担任公司的首席产品官。HeyGen的总部位于洛杉矶。在过去,HeyGen主要使用了Stable Diffusion技术。

最近,HeyGen宣布获得Conviction Partners投资的560万美元,使其估值达到7500万美元。作为交易的一部分,诗云科技(深圳)有限公司已经决定解散并申请注销登记。因此,HeyGen将来将长期在美国进行研发和销售。

在价格方面,HeyGen提供了多种订阅选项,价格范围从49美元到150美元不等,并且还提供了一定数量的积分用于兑换视频。此外,用户还可以选择创建更长、更高分辨率的视频,平均费用约为每分钟3美元;或者选择专业选项,价格为1000美元。

请点击以下链接体验:[Heygen](https://www.heygen.com/)

7、Replica Studios

事实上,以前的人工智能大多使用生成对抗网络(GAN)技术来生成逼真的音频语音。为了实现这个目标,团队需要对多个参与者的数据进行整理,并调制各种声音组合,才能产生所需的音频。即使是文本转语音(TTS)的生成过程,也需要大量的数据采集。

然而,随着AIGC技术的迅猛发展,语音到语音 (STS) 转换技术已经出现,可以利用现有的语音资源来生成语音,从而大大减少了数据采集和训练的时间和成本,轻松快速地创建画外音。现在,有许多产品或工具如Replica Studios、Synthesys、Murf、Listnr、Lovo、Speechelo等,可以为纪录片、广告或游戏生成画外音,而无需雇佣配音演员。

体验网站链接:https://www.replicastudios.com/

8、3DFY.ai

事实上,对于游戏开发商和游戏工作室来说,3D模型开发通常是开发过程中最具挑战性的部分之一,容易遇到困难。制作一个模型的成本从60美元到1500美元不等,需要2到10周的时间来完成。在此之前,创建3D模型需要大量的计算能力和算法支持。

现在,借助AIGC技术的帮助,数据都嵌入在预训练模型中,其中一些甚至是开源的。因此,3DFY.ai降低了制作3D模型的成本和使用成本。

目前,3DFY.ai正处于开放测试阶段,用户可以免费试用。新用户注册后将获得10积分,可以免费生成10个模型。如果想继续生成或下载更多模型,则需要付费。此外,3DFY还为企业提供文本转3D的API服务,以及生成大量3D数据集的服务,旨在满足未来不同的需求。据了解,该平台是由初创企业3DFY.ai开发的。

除了3DFY.ai之外,目前在3D模型领域的人工智能图形计算产品还包括Nvidia Get3D、Alpha3D、Sloyd.ai等。

请点击以下链接体验:[3Dfy AI](https://3dfy.ai/)

9、DreaMoving

这是一款我认为最有趣的产品。仅靠面部照片和文字提示,DreaMoving就能生成适用于任何场景的跳舞视频。

DreaMoving是由阿里巴巴团队开发的先进的人类舞蹈视频生成框架,它采用了扩散模型技术。该系统能够根据用户的输入生成高质量和高保真度的舞蹈视频,用户可以通过文本提示、图像提示或两者的组合来进行输入。用户可以指定视频中的人物,这些人物可以是名人、朋友或任何特定的形象。背景可以是真实的地点(如海滩、城市街道)或任何虚构的场景。此外,用户还可以通过提供脸部照片或其他图像来确定视频中人物的外观,甚至可以指定人物的动作和姿势。

DreaMoving是一个由几个关键组成部分构成的系统,包括去噪U-Net、视频控制网络和内容引导器。该系统通过对约1000个高质量的人类舞蹈视频进行训练来实现,这些视频经过剪辑和处理,形成了约6000个短视频片段。模型的训练过程包括内容引导器的训练、长帧的预训练、视频控制网络的训练和表情微调。在模型推理阶段,输入包括文本提示、参考图像以及姿势或深度序列,通过调整控制网络和内容引导器中的参数来控制视频内容。

目前,DreaMoving只有演示和项目报告,没有代码。

项目链接:https://dreamoving.github.io/dreamoving/

论文https://arxiv.org/abs/2312.05107

试用链接:https://modelscope.cn/studios/vigen/video_generation/summary

10、AlphaCode 2

随着今年AIGC技术的迅猛发展,人们发现,AIGC在软件代码生成方面具有出色的应用表现,能够自动生成准确的代码,从而显著提高开发人员的效率,并最大程度地减少手动编写代码时的错误率。

AlphaCode 2是由谷歌大脑和谷歌DeepMind共同研发的一款产品。今年12月,谷歌发布了Gemini大模型,同时也正式推出了AlphaCode 2。AlphaCode 2基于Gemini AIGC技术,能够实现快速、准确的代码编程。谷歌表示,AlphaCode 2的架构基于强大的大型语言模型 (LLM),以及专为竞争性编程设计的高级搜索和重新排名系统。

据谷歌透露,AlphaCode 2最近在编程评分平台Codeforces上进行了测试。令人惊讶的是,在仅仅10次尝试中,AlphaCode 2能够正确回答高达43%的问题,排名中位数达到了第85个百分位数。这一表现超出了人工智能系统的预期水平。

除了AlphaCode 2之外,在 AIGC 代码编程领域的国外产品还包括OpenAI Codex、Copilot、ChatGPTGitHub Copilot aigctookit、TabnineCodeium等,国内也有智谱AI的CodeGeeX、北大团队的aiXcoder 智能编程助手等相关产品。

这种自动生成代码的平台不仅可以自动编写代码,还可以自动检测和修复生成代码中的错误,从而提高整个代码库的一致性和可读性。

体验链接:https://alphacode.deepmind.com/

结论

这是一份包含10款广泛使用且流行的人工智能与机器学习产品清单,其中一些来自知名大公司的研发,而另一些则来自新近成立的初创企业。然而,需要注意的是,这份清单并不完全客观,因为每个人对于理想的人工智能与机器学习产品都有不同的期望和需求。正如俗话所说,千人千哈姆雷特,只要这款人工智能与机器学习产品能够帮助您降低成本、提高效率,它就是一款优秀的产品。

不久之前,中国工程院外籍院士、北京智源人工智能研究院学术顾问委员会主任张宏江表示,人工智能大模型作为基础平台,将会全面推动各个产业进入新的范式,成为下一个时代的“超级入口”,彻底改变所有软件应用和产业,提升每个领域的生产力。同时,新的产品、商业模式、盈利模式和创业机会也将随之而来。所有的软件公司都必须积极拥抱大模型,包括软件工具、应用服务等类型企业,都需要采用大模型来重新设计软件。

百度创始人、董事长李彦宏也表示,100多个基础大模型浪费社会资源,更多企业应该要去“开发”AI 原生应用,大模型对大多数人来说不是机会,应用才有价值。“今年绝大多数时候,全社会关注点都在大模型本身。但是我一直的观点都是,在基础模型之上要有千千万万的 AI 原生应用,大模型的价值才能被体现出来。”李彦宏表示。

2024年,随着AIGC应用和场景的不断涌现,我们将看到产业原生应用市场迎来更多机遇。这一趋势有望推动整个通用人工智能(AI)以及数字经济领域的蓬勃发展。

我们坚信,人工智能技术将无所不在,必将不断改变各行各业的发展。

0
分享到:
没有账号? 忘记密码?