在当下人工智能的热潮中,除了中美两大巨头,还有一个来自东方的大国,试图在人工智能的竞争中抢占先机——是的,它就是我们那个神奇的邻居,印度!
根据最新的Kantar研究报告,印度目前已经有7.24亿人已经开始使用人工智能(AI)技术(并非全部都是像GPT这样的大型模型)。
在官方层面,印度对于生成式人工智能产业表现出了极大的兴趣。
就在去年8月,印度联邦内阁批准了为人工智能、网络安全和数字技能发展投入1490.3亿卢比(约合130.7亿人民币)的计划。
就在去年8月,印度联邦内阁批准了为人工智能、网络安全和数字技能发展投入1490.3亿卢比(约合130.7亿人民币)的计划。
在这样的激励下,今年1月,印度终于诞生了一家自己的大型独角兽公司——Krutrim。推出大型模型仅一个月后,该公司就以10亿美元的估值融资5000万美元。
然而,印度人工智能这场盛宴,表面上热闹非凡,但一掀开锅盖,里面的“菜色”可就令人失望了。
先说说“参赛选手”吧,印度在人工智能企业数量上,跟中国一比,那差距可不是一星半点。
中国这边,不仅有百度、阿里、腾讯这些巨头推出了文心、盘古这样的大型语言模型,还有一些小而精悍的团队,比如月之暗面、智谱AI、百川智能和Minimax,也都研发出了令人满意的自主模型。
而印度呢,大规模模型相关的公司少得可怜,自主研发模型更是凤毛麟角。
根据Tracxn和印度人工智能协会的数据,印度在大模型领域的公司数量不到10家,而且这些公司主要忙着开发对话AI、智能助手和一些特定行业的应用,基本不涉及基础模型的研发。
至于印度目前唯一一个自研模型Krutrim AI ,也同样充满了“咖喱味”。
据报道,Krutrim AI不仅被指责存在套壳ChatGPT的嫌疑,而且根据用户的体验报告,其使用时限制了输入字符的数量,仅允许输入424个字符(不包括空格)。此外,有时在交互过程中,Krutrim AI还会突然陷入困惑,甚至忘记自己的身份。
实际上,对于印度人工智能的前景,去年早有人做了预测。
2023 年 6 月,Sam Altman 在印度被问及,如果印度团队投入1000万美元研发出一款庞大的模型,是否能与OpenAI竞争?Altman 回答:不可能。
01 搞不好人工智能的信息技术大国
印度,这个在信息技术领域声名显赫的大国,居然在人工智能方面表现不佳,确实让人感到有些意外。
咱们平时常常认为,这人工智能的大模型,简单来说就是一个更高级的程序,不像那些需要精密机械和复杂化工的产品,需要逐步爬升产业链的阶梯。
按理说,只要掌握了算法加数据结构,再凑上几个熟练的编程专家,理论上应该能够轻松解决问题。而印度人在代码、编程这方面,那可是出了名的非常有才能。
且不说当下谷歌、微软的CEO皮查伊、纳德拉都是印度人,就连当初写下名震人工智能界的那篇《Attention is All You Need》的硅谷八子中的两人,也是印度裔。
同样地,今年震撼人工智能领域的Sora,其核心研发人员中,就包括了一名来自印度的技术天才Aditya Ramesh。
Aditya Ramesh还参与开发了DALL-E人工智能项目
就连特斯拉的自动驾驶负责人Ashok Elluswamy,超级计算机Dojo前负责人Ganesh Venkataramanan也同样来自印度。
就连特斯拉的自动驾驶负责人Ashok Elluswamy和超级计算机Dojo前负责人Ganesh Venkataramanan也都是印度人。按理说,编程、软件方面的人才那么众多,从事人工智能领域应该具备很大的优势啊,那为何印度在大规模模型方面如此落后呢?
其实,这种“只需要几个聪明人”、“万事俱备只差一个程序员”就能搞出来的“低门槛”技术,某种程度上是一种产业上的错觉。
这种错觉就像:“在汽车领域实力强大的国家,应该能够轻松地创建出网约车平台”,但事实是,这些国家却无法实现这一点,比如德国、日本虽然是传统汽车强国,但你见过哪个非常成功的网约车平台是从他们那里兴起的呢?
在德国,Free Now这样本土的网约车APP,2023年的用户数只是仅有大约350万左右。
其实,无论是网约车,还是大模型,都不是表面上看起来那样,只需要几个聪明的程序员鼓捣几下,就能轻松地搭建起来的。
因为这背后涉及的东西,表面上看只是一堆程序、代码,但实质上却和一个国家的基础科研、基础设施建设,市场群体需求,以及数字化程度的提升有着千丝万缕的联系。
就拿网约车来说,基础科研方面,网约车涉及了全球定位系统(GPS)、定位算法等相关技术;在基础设施方面需要有覆盖范围广泛的高速网络;在市场端要有大量经常乘车出行且熟练使用互联网的人口来支撑。
同样地,人工智能(AI)领域虽然不像某些产业有复杂的供应环节,但依然有着自身的产业链。
这个旅游活动可以分为上游、中游和下游三个环节。每个环节都与科研、市场或数字化程度等因素密切相关。
具体来说,AI产业的上游,就是基础研究层面,例如机器学习算法、神经网络架构等等,这方面需要大量跨学科的,基础理论方面的人才;但可悲的是,当今的印度在AI领域,直接在最顶层就被抽掉了理论和科研的人才基础。
具体来说,AI产业的上游,就是基础研究层面,例如机器学习算法、神经网络架构等等,这方面需要大量跨学科的,基础理论方面的人才;但可悲的是,当今的印度在AI领域,直接在最顶层就被抽掉了理论和科研的人才基础。这意味着印度在AI领域的发展受到了限制,无法在理论和科研方面取得突破。02 巨额订单的诱惑
印度在人工智能基础科研人才方面的缺失,原因主要有两点:
1、IT外包带来的“毒蛋糕”效应;
IT外包带来的负面效应;2、国内拉胯的基础设施建设。
这里先说下第一点。
在1990年代那个时候,印度遭遇了严重的外汇危机,赤字占到了其国内生产总值(GDP)的8.5%左右。为了摆脱困境,印度政府不得不采取了一系列市场化的改革措施。
而改革中最重要的一点,就是积极推动私立教育机构的发展,特别是那些专注于工程、管理、信息技术等应用型学科的学院和大学。
这些以市场为导向的私立学校,很快就瞄准了一个特别有吸引力的领域——信息技术外包。
这是因为,从成本和收益比来看,印度当时的基础设施、工业能力相对较低,而且资本短缺,搞制造业属于投入大、回报较低的行业。
如果我们不加强对制造业技术人才的培养,那么毕业后的就业率可能会非常低。
相较之下,IT外包这种活,不仅属于轻资本,不需要大规模投资建设基础设施、建造工厂,并且由于印度人英语水平较高,劳动力成本又较低,做起来简直就是一本万利的绝佳买卖。
于是,从1990年代起,各种以信息技术为主的应用类专业,就开始在印度的学校中迅速发展壮大。
而这样的局面,也造就了今天印度科研“重视应用,轻视理论”的局面。
例如在2021年的一份报告中, 印度工程和技术专业的学生,占到了总招生人数的约70%。
例如在2021年的一份报告中,印度的工程和技术专业的学生人数占到了总招生人数的约70%。但在基础科研方面,根据《自然指数》(Nature Index)的数据,在2022年,中国在自然科学方面的成果约为20050项,美国是21473项,而印度只有1280项。
根据《自然指数》(Nature Index)的数据,在2022年,中国在自然科学方面的成果约为20050项,超过了印度的1280项,但略低于美国的21473项。来源:自然指数
虽然印度后来也意识到了这种模式的弊端,也想过要改变,但是,两个重要的原因,让印度放弃了“浪子回头”的打算。
首先一个原因,是美国人给得实在太慷慨了。
随着20世纪90年代美国的计算机巨头开始在全球范围内扩张业务,印度的IT人才通过接受大量的外包订单获得了丰厚的报酬。
到了1990年代中期,印度IT从业人员平均年薪大概是8000—12000美元左右,到2000年初期,进一步上升至3万—5万美元,同时期的印度普通农村家庭,年收入仅为300-500美元。而城市低收入阶层家庭的年收入,也仅为600-800美元。
到了1990年代中期,印度IT从业人员平均年薪大概是8000—12000美元左右,到2000年初期,进一步上升至3万—5万美元。与此同时,印度普通农村家庭的年收入仅为300-500美元。而城市低收入阶层家庭的年收入也仅为600-800美元。这显示出印度的收入差距非常大,IT行业的从业人员收入远远高于农村和城市低收入阶层家庭的收入水平。除了巨额的订单诱惑,另一个重要原因是印度在工业和基础设施建设方面的滞后,导致许多基础科研工作缺乏必要的硬件设备。
03 捉急的基础设施建设
这里一个很令人意外的现象是:人工智能方面的研究与实验,其实与其他基础科研一样,是非常依赖于硬件设施的一种研究。并不仅仅是依靠编程专家简单地调整算法。
要维持大模型的运转,就得有大量的图形处理器(GPU),以及相应的数据中心,而这背后,则必须有充足的电力、能源,以及稳定的、高速的网络基础设施,用来进行数据的传输。
可偏偏印度在这些基础设施方面,表现实在不太好。
一个明显的差距是,2023年,在超大规模数据中心数量上,印度只有大约18个超大规模数据中心,而中国的公开数据是有接近100个超大规模数据中心。
而超大规模数据中心,是评估人工智能算力的一个重要标准。
这样的差距背后,是支撑和维系数据中心运作的一系列配套设施,包括了电力供应、网络连接,以及冷却系统等等。
在这方面,印度同样被中国远远超过。
首先在能源方面,中国的超大规模数据中心的能耗,在2023年估计达到了约180-200太瓦时(TWh),而印度只有大约10-15太瓦时(TWh)。
之所以如此,是因为印度在电力方面的基础设施建设进展缓慢,存在着严重的紧迫性。
根据印度民意调查机构2022年对超过2万人的调查显示,有三分之二的家庭表示会突然遭遇停电,而有三分之一的家庭更是每天都会固定经历“小黑两小时”的停电。
这电都不够老百姓家里灯泡亮的,还想养人工智能这种电耗子?
除了电力,在网络基建方面,同样是在2023年,中国5G基站的总数已经超过了248万个,覆盖率也已经超过了96%。而相比之下,印度的5G基站数量仅有30万个,覆盖率仅达到了30~40%。
而在更为关键的冷却系统方面,中国在直接液冷、浸没式液冷等先进液冷技术方面处于领先地位(采用率30%)。相比之下,印度大多数数据中心仍采用传统的空气冷却系统,缺乏对液冷技术的广泛应用(采用率10%左右)。
以上各种拖延的基础设施建设,都让印度的计算机科学人才,即使想回国为人工智能事业做贡献,也会面临“巧妇难为无米之炊”的困境。
于是,印度聪明的年轻人,最后往往只能含泪打包行李,跨越大洋去美国实现他们的科研梦想。
2023年,约6万名印度计算机理论人才选择了海外发展,约占本土计算机理论人数的40%,相较之下,中国的流失率只有15%。
2023年,大约有6万名印度计算机理论人才选择了海外发展,约占本土计算机理论人数的40%。与此相比,中国的流失率仅为15%。一方面,印度面临着来自美国的大量IT外包订单,这对印度的科技行业来说是一个巨大的机遇。另一方面,国内的基础设施建设进展缓慢,这导致印度在科技领域的发展受到了一定的制约。因此,印度不得不加大在科技领域的投入,以满足外包订单的需求。然而,这种依赖外部订单的发展模式使得印度越陷越深,很难摆脱对外部市场的依赖。
而这种顶层理论人才的差距,直接决定了印度在人工智能领域所能达到的最高水平。
04 低数字化社会
如果说,印度在AI产业链上游的问题,主要是基础理论人才的缺失,那么在AI产业链的中游,也就是模型训练方面,印度的困境,主要是难以为大规模模型的优化和迭代提供足够的数据。
众所周知,目前大规模模型训练所需的数据,大部分都来自互联网。
而印度在这方面,有个最大的问题:就是社会的整体的数字化程度太低。
虽然印度网民人数听起来是挺庞大的,接近9亿人口,但需要注意的是,网民数量并不代表一个国家数字化的程度。
现在经常使用人工智能的朋友,估计可以感受到,目前ChatGPT这类人工智能,最大的应用领域,往往都是一些信息、数据特别丰富的场景。
例如像长篇报告总结、专业研报分析,或是帮忙处理一些庞杂的代码等等。
这样的场景,通常包含了大量的数据、信息,而数据或信息的量多到了一定地步,到了人脑觉得负担太大的时候,人们就会觉得人工智能(AI)很有必要了。
从这个角度上看,数字化程度越高的社会,和人工智能的结合程度就越高。
相反,在一个数字化程度较低的国家里,人们在日常活动中产生的数据量较少,或者即使产生了数据,这些数据大多以“线下”的形式存在,因此人工智能很难发挥作用。
从这个角度来看,所谓的数字化程度,绝不仅仅是“网民数量”这一表面的指标,而是指在日常生活中,人们能够通过互联网解决工作、购物、学习、就医等活动的程度;企业是否能够利用数字化的手段提高效率。
虽然现阶段,印度网民的数量是相当庞大了,但仔细深究起来,他们每天在互联网上都从事着哪些活动呢?
根据著名的会计和咨询公司KPMG在印度分布的统计,印度网民目前每天上网的主要活动中,社交网络、即时通讯和视频娱乐等领域最多,占到了总上网时间近90%左右。
但在娱乐化的内容之外,其他活动的频次明显减少了很多。
根据使用频率统计,印度只有56.3%的用户通过互联网进行了在线购物,而在中国,这一比例高达83%。
除此之外,在网约车平台这些生活服务方面,印度本土的网约车平台Ola在2022年全年的订单量约为3.7亿单,而同一时期,中国的网约车平台滴滴出行的订单量则达到了370亿单,是Ola的一百倍以上。
而在企业端,印度企业的互联网普及率仅为49%,而相较之下,中国企业的互联网普及率显著更高,达到了约95%。
而在企业端,印度企业的互联网普及率仅为49%,相对较低。而与之相比,中国企业的互联网普及率显著更高,达到了约95%。这种“低数字化”的现状,从表面上看,主要是落后的基建(5G普及率不足30%)导致的,但从更深层次的原因来看,这和目前印度固有的产业结构,有着密切的关系。
05 分工的重要性
在印度目前的产业结构中,服务业占了国内生产总值(GDP)的约60%左右。然而,这其中大部分是一些低端服务业,比如零售、酒店或餐饮等。
农业占据了国民经济的15%—18%的比例,而制造业的比例稍低,仅为12%。
这种以农业、服务业为主导的产业结构,实际上很难满足数字经济所需的复杂产业链和高附加值服务的要求。
农业和很多服务行业,产业链往往很短且较为单一,就像种植各种农作物、养殖各种动物,供应链相对较短。
还有那些日常的服务,比如餐馆提供餐饮服务、商店销售商品、家政公司提供卫生打扫服务,生产链也相对单一,去做就完成了呗,较少涉及复杂的上下游产业链整合或增值服务。
说白了,这样的产业,没有足够复杂的数据和信息管理需求。
这么少的信息,人类大脑其实完全可以处理,不需要依赖人工智能。
与农业、服务业主导的社会相比,工业社会的一个显著特点是,存在着广泛而紧密的分工与协作。
从最初的原材料采购和处理,再到设计全新的产品、进行研发、组装和测试,最后还需要进行品牌推广、营销活动,并确保提供优质的售后服务,这一系列流程形成了一个复杂而完整的产业链。
每增加一个环节,都能创造更多的数据和信息增量。
每当我们增加一个新的步骤或环节,都会产生更多的数据和信息。以新能源车的生产为例,在设计阶段,通过计算机辅助设计(CAD)和计算机辅助工程(CAE)软件进行车辆设计,以及进行仿真测试时,就会产生大量设计数据和模拟数据。
到了生产环节,生产线上的设备状态、物料流动、生产进度等,同样会产生大量的实时数据。
而除了制造环节本身创造的数据流外,由于产业辐射效应,一些工业活动还会给其他看似不相关的行业,带来意外的新的信息和数据。
例如,在金融和保险行业,有基于车辆行驶数据定制的保险费用。这意味着保险公司可以根据车辆的实际行驶情况来确定保险费用的金额。通过收集和分析车辆行驶数据,包括里程数、驾驶行为和路况等因素,保险公司可以更准确地评估风险,并为车主提供个性化的保险方案。这种定制化的保险费用可以帮助车主节省保险成本,并提供更好的保险保障。
在广告营销行业,为了实现更加精准的营销策略,企业需要利用大数据分析消费者的偏好、社交媒体互动数据等信息,以便更好地优化广告投放。
综上所述,如果没有工业化,社会就难以形成复杂的分工,没有复杂的分工,人们的生活中也就不会产生大量的数据和信息。
这也是为什么,现在的各个风投机构,都不怎么看好印度人工智能企业的原因。
去年,印度与大模型相关的人工智能企业,融资总额约为1.6亿美元。而在中国,仅仅一个月之内,一家企业的总融资额就已经达到了30亿美元。
如此巨大的差距背后,除了对印度人工智能实力的担忧外,一个更重要的原因,就是人工智能在印度并不真正具备市场规模和潜力。
毕竟,若是放在中国的环境下,即使大模型一时难以在C端打开局面,但至少在B端,由于数字化程度较高,因此在某些定制化的、垂直的场景(如金融、医疗)中,大模型仍然能够发挥重要作用。
而反观印度,在整个社会数字化程度相对较低的情况下,大型模型除了用于闲聊和娱乐之外,还能有哪些用途呢?
但如果只是闲聊和娱乐,上社交媒体和观看短视频不更有趣吗?
One More Thing
当前印度在AI方面的困境,属实表明了:当下的这场AI竞争,从表面上看,只是某一个具体技术的竞争,深入一点看,是一个国家总体科研实力的较量,再深入一点,就是不同国家之间,社会发展程度、产业结构、人口素质方面的一个综合比拼。
从总体上看,数字化程度越高的国家,人工智能(AI)在各个领域的应用和普及程度就越好。
而人工智能普及度越高的国家,就越能够通过收集用户的反馈数据,形成数据飞轮,进一步对模型进行优化和迭代。
而印度的尴尬之处就在于,明明自己身为一个尚未完成工业化的半农业国家,却在追求人工智能(AI)这样一种数字化时代的产物。
而更讽刺的是,印度越是追求人工智能,自己从前的“稳定工作”被取代的可能性就越大,因为当前的生成式人工智能,在很多方面,正努力取代某些高端服务行业。
例如5月21日的微软开发者大会上,微软不仅发布了搭载GPT-4o的最新版Copilot,并且还在会上演示了“帮助初学者学习编程”的GitHub Copilot Workspace。
这是一款通过使用聊天功能来完成程序编写的软件。这将使任何新手,即使对编程语言几乎没有了解,也能够开发自己的软件。
设想一下,如果将来编程、电话客服一类的岗位,全都能被人工智能取代了,印度之前赖以发家的“IT外包”这条路子,还能继续保持竞争力吗?
到了那时,由于工业基础薄弱,印度失去了IT行业的稳定工作机会,因此在人工智能时代如何生存将成为一个巨大的疑问。