上世纪80年代,如今的Meta AI首席科学家杨立昆还在读大学。
那时候,深度学习是一个“已被证伪”的技术路线,只有一小撮人在努力探索,这其中就包括了一批来自日本的科学家。
杨立昆发现,当时大部分的深度学习论文都是由日本的研究人员用英文撰写的。这些论文对杨立昆产生了很大的启发。
有趣的是,当2024年有人都在全力发展大型模型时,日本却在这场浪潮中几乎没有任何声音。
直到前几天,一家要做日语专用生成式AI的本土独角兽才冲了出来。据《朝日新闻》上周六报道,日本生成式AI初创公司SakanaAI即将获得一笔新的重大投资,本月底之前筹集约200亿日元资金(约1.27亿美元),这将使该公司估值达到1800亿日元(约11.42亿美元)。
这是日本增长最快的独角兽企业,至今它成立还不到一年。
那么,日本这家人工智能公司是什么背景?日语专用生成式人工智能的出现对大型模型的进展有什么启发?
/ 01 /
“黑魔法”模型合并,将日语理解与融合语言、数学和视觉相结合
“ChatGPT之父”阿尔特曼(Sam Altman)在5月末预测,中国将会产生具有独特特色的大型模型。这一预测引发了我们对于拥有民族文化专属大型模型的必要性的思考。
Sakana AI注意到要让AI生成物的文化属性与艺术质感贴近日本文化和用户价值观。”sakana”这个词在日语中的发音是さかな,读作萨嘎那,意思是鱼。而Sakana AI的logo采用了鱼的形状,在官网网站上可以看到各种由生成式AI绘制的鱼的作品。
3月,Sakana AI在Hugging Face和GitHub上开源了一种模仿生物进化机制的技术,通过结合多个AI来生成更高级的AI,其中包括视觉语言模型EvoVLM-JP。4月22日,Sakana AI宣布推出了一款面向教育和日语兼容的高速图像生成模型,名为EvoLLM-JP,它可以用日语解决数学问题。此外,他们还推出了一款名为EvoSDXL-JP的模型,它可以生成和理解日语图像和文本。截至目前,该公司已经推出了3个专门用于日语的生成式AI。
▲EvoSDXL-JP生成的图像示例。提示词:可爱的编织象、拉面和浮世绘、葛饰北斋、折纸便当、下町火箭、浮世绘等。(图源:SakanaAI官网)
SakanaAI在社交平台X的账号@hardmaru,我还发现模型不仅局限于日本风格,还可以生成多种电影风格,而且效果也非常出色。比如输入“马斯克”和“扎克伯格”等相关提示词,生成的图片立刻变成了《搏击俱乐部》中杰克和泰勒对垒的场景;学友的经典表情包也被扩展成了“和猫咪共进晚餐”的场景,这让我忍不住笑了出来。
▲在SDXL版本使用“电影效果”模式生成图片,马斯克和扎克伯格
▲SDXL对于香港电视场景扩展产生了一些有趣的结果
具体来看,Sakana AI三个模型精通日语,他们在理解复杂的问题时展现出了出色的能力,甚至可以用日本关西方言开玩笑。视觉语言模型EvoVLM-JP不仅了解日本文化的细微差别,还知道在日本通行灯实际上是蓝色,展现了对细节的敏感度;而EvoSDXL-JP模型则注重速度和精度,能够快速生成符合日本美学的作品。
Sakana AI提出一种进化算法混合和匹配人工智能模型的方法,对生成文本和图像的AI基本模型进行研究,他们将现有模型相互交叉组合。(进化算法借鉴了自然进化的概念,使人工智能能够随着时间的推移而进化、适应和改进。)
有趣的是,Sakana AI将模型合并比作为一种“黑魔法”,并在技术博客里放上了中国AI初创公司零一万物“套壳Llama”争议的“黑图”。
从Sakana AI的产品历程来看,今年早些时候,他们开始利用进化算法来开发更高效的方法来训练LLM等基础模型。最近,他们采用了LLM作为更先进的进化算法,使得“LLM能够创造出更优秀的方式来进行自身的训练”。
▲对于“具有大型语言模型的偏好优化算法”的演示(图源:SakanaAI)
Sakana AI探索了模型合并的两条主要途径,一是修改模型的数据流——可以将其视为基于个性的匹配;二是则侧重于混合其他模型的参数,例如将两个模型的最佳特征结合起来,创造出一个更加出色的模型。
进化算法与文化差异的融合是Sakana AI重点关注的方面,他们致力于利用日本本土文化叙事提供了AI可能的影响和错误的基本背景解释,在考虑文化细微差别和社会动态的情况下进行AI决策的研究,以改善此前缺乏AI可解释性的状况。
/ 02 /
日本系生成式人工智能独占鳌头,外国资本在话语权方面占据优势
在计算资源似乎非常丰富的时代,人们对扩大机器学习规模并在更大的数据集上训练越来越庞大的模型感到非常兴奋。
在大模型领域的激烈竞争中,日本AI模型的参与非常有限,无论是基础大模型还是应用层模型。在Sakana AI之前,Open Calm、Rinna等“日系”前沿模型在评测中的表现要远远不如GPT-3.5。
难道人工智能的未来就是由一个耗费大量能源进行训练、运行和维护,并且庞大、单一、无所不知的系统组成吗?日本东京大学哲学博士、谷歌知名研究者David Ha并不认为,他在博客中写到“智慧生命的出现并非仅仅依赖于丰富的资源,而是源于资源的匮乏……人工智能的发展将遵循集体发展路径”。
在上述理念的指引下,David Ha和另一位谷歌研究者Llion Jones,以及日本二手交易平台Mercari执行董事的伊藤錬,三人在去年7月共同在日本东京港区创立Sakana AI,这是一家人工智能公司。
▲Llion Jones(左)和David Ha(右)
生成人工智能(AI)已成为风险投资公司等资金集中的方向,这支技术背景强大、价值观特别的日本初创AI很快吸引了众多资本的目光。
1月,Sakana AI宣布从Khosla Ventures等公司、NTT集团以及索尼集团共计筹集约45亿日元的资金。2月,Sakana AI被日本政府列入七家获得赠款的公司和实验室之一,以获得使用配备最新图形处理单元的超级计算集群的权限。
就在上周,SakanaAI被推动到冲刺独角兽的位置。该公司在本月底之前将筹集约200亿日元资金(约1.27亿美元,9.23亿元人民币),由美国知名风投New Enterprise Associates(NEA)和现有投资者Lux Capital及Khosla Ventures共同主导,这将使该公司估值达到1800亿日元(约11.42亿美元,83亿元人民币)。
虽然融资形势是充满希望和潜力的,但是考虑到身处于AI产业相对薄弱的日本,Sakana AI不可避免地面临着管理结构和人才方面的问题。
首先是日系资本话语权的问题。从投资股东看,上一轮和这一轮领投的机构都是美国风投,尽管这些美国风投持股比例尚不清楚,但可以确定的是,美国风投在公司决策中的影响力应该相当大。
另外,Sakana AI成立在港区,这里以聚集诸多外国大使馆、国际气氛浓厚著称。港区是一个国际化程度很高的地区,拥有许多外国大使馆和国际机构,因此这里的气氛非常国际化。
联合创始人Ha表示,他们在湾区创立公司是一个错误的战略决策,因为这样很难实现与其他公司的差异化。然而,美国资本在日本开设办事处并投资日本初创公司,可能是最佳的选择,部分原因是美国资本对所有非日本基金支持者承担着信托责任。
另外是本土人才有限的问题。现在日本的人工智能研究非常依赖外国专家。
RIKEN(理化学研究所)是日本唯一的国家级科研机构,拥有世界顶级的科学家和研究人才。汤川秀树等日本诺奖得主,都曾在这里进行过重要的科研工作。RIKEN革新智慧综合研究中心负责人杉山将,曾进行了一项有关研究的统计:
那些被人工智能顶级会议收录的RIKEN论文,近一半的作者都隶属于外国大学,其中约一半的人来自中国。
根据最新消息显示,Sakana AI公司已经收到近1000份工作申请,其中约1/3来自日本本土,而约2/3来自海外。
/ 03 /
结语:“日本”会诞生具有独特特色的大型模型
AIGC(全球人工智能公司)的主导征地根植于欧美视角,在非欧美文化的情景中的适用性有限。然而,Sakana AI这只日本AI独角兽的诞生标志着人工智能大模型向具备全球能力且适应当地文化的方向迈出一步。
日本的人工智能(AI)产业发展迅速,正如晚开的花一样,日本作为世界第三大经济体,拥有巨大的市场体量、财力和人工智能发展空间。Khosla Ventures合伙人Jon Chu表示,如果Sakana AI能够成为日本的OpenAI,尽管其价值可能不及美国的OpenAI,但它仍然具有非常重要的价值。
或许可以仿写一下阿尔特曼的话,“中国”会诞生有自身特色的大模型。