谷歌与OpenAI展开激烈竞争,硅谷地区的科技巨头之间的竞争进一步升级。(谷歌派ggp项目合法吗)

一场激烈的科技竞赛正在美国硅谷如火如荼地进行。

5月16日,谷歌举办了2024年I/O开发者大会,人工智能是整个会议的核心议题,谷歌首席执行官桑达尔·皮查伊和他的团队发布了Gemini 1.5 Pro的新版本,在处理100万个Tokens的能力上,进一步提升至200万个Tokens,他们的最终目标是实现无限上下文的处理能力。

谷歌还展示了新的搜索产品,比如从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。此外,谷歌还推出了新的TPU,第六代TPU芯片Trillium,较上一代芯片的算力表现翻4.7倍。

谷歌还展示了新的搜索产品,比如从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,这个功能将会为用户提供搜索结果的直观总结和概述。此外,谷歌还推出了新的TPU,第六代TPU芯片Trillium,相较于上一代芯片,其算力表现提升了4.7倍。

就在这场发布会前一天,OpenAI举行了春季发布会,发布了最新的GPT-4o多模态大模型。与GPT-4 Trubo相比,GPT-4o不仅速度更快,而且价格更便宜。接下来的一个月里,硅谷还将迎来两家科技巨头的重磅大会——5月21日左右,微软将举行Build年度开发者大会;6月10日左右,苹果将举办全球开发者大会。这场关于人工智能的大比拼将在大洋彼岸上演。

随着OpenAI的崛起,以及谷歌在AR眼镜等领域的失败,外界一度评价谷歌已经变成了一家只追求“赚钱”的公司,失去了创新的激情。

不过,谷歌仍然拥有谷歌搜索、YouTube、云服务、Gmail、Android以及自动驾驶Waymo等业务,仅YouTube就有20亿月活用户,Android也拥有20亿月活用户,可以说,谷歌掌握着全球最多的用户场景、数据以及设备接口。

谷歌拥有众多业务,包括谷歌搜索、YouTube、云服务、Gmail、Android以及自动驾驶Waymo等。仅YouTube就拥有20亿月活用户,而Android也有20亿月活用户。可以说,谷歌在全球拥有最多的用户场景、数据以及设备接口。

谷歌发布更新产品后,谷歌-C股价微涨0.6%,收盘价为171.93美元,市值达到2.12万亿美元,股价较2024年开年上涨了23%。

在最近结束的财季中,谷歌展现出了强大的竞争力。2024年第一季度,谷歌的营收达到了805.39亿美元,同比增长了15%。根据非美国通用会计准则,谷歌的净利润为236.62亿美元,同比增长了57%。

谷歌艰难地坚守着自己的领地

大会一开场,皮查伊就介绍说,现在已经有超过150万开发者正在使用谷歌的原生多模态大模型Gemini。Gemini是谷歌于2023年12月上线的一款创新产品,它被认为超过了GPT-4

谷歌硬刚OpenAI,硅谷大战继续升级_图1

皮查伊宣布,Gemini 1.5 Pro现已向全球所有开发者开放,并且支持预览Gemini 1.5 Pro模型,该模型拥有200万个Tokens。他们的目标是实现“无限上下文”。

此次开发者大会,谷歌着墨最多的是搜索,这是谷歌的起家业务,现在谷歌要重新定义搜索,它要将搜索变得更加智能化,通过多轮对话的推理来满足用户的需求,用户只需要提问即可。

皮查伊以“重新定义搜索”的姿态,连续上线多款基于Gemini的产品,比如总结谷歌搜索引擎结果的“AI概览”功能,支持用户存储图片的AI搜索Ask Photos。

以练瑜伽为例,谷歌会帮用户找到更受欢迎的瑜伽工作室,并详细介绍他们提供的服务。用户可以查看每个门店的距离,以便选择最方便的地点。谷歌搜索会将用户的大问题分解为多个小问题,例如排名、用户评论、营业时间等等,以便用户进行更深入的研究。

然而,谷歌可能并不是唯一能够重新定义搜索的公司,OpenAI也有可能拥有这一主动权。今年年初有传言称,OpenAI计划推出AI搜索服务,但在5月14日的发布会上,并没有展示该服务,可能是因为算力成本的原因。

成熟大公司对待创新公司的崛起仍然束手无策。对标OpenAI,谷歌仍在努力展示自己的存在。

在此次发布会上,谷歌还展示了一个名为Astra的项目,这是谷歌开发的通用人工助理,在演示视频中,Astra通过手机摄像头能够识别真实环境中的物体,实现了能够看、能够说、能够听的功能。这与前一天OpenAI上线的GPT-4o功能类似,都实现了人机交互的新形式。但谷歌似乎不满足于此,Astra更强调指向人、机器与现实世界的三重交互。

大模型最大的挑战是解决响应时间的问题。谷歌介绍说,他们在Gemini模型的基础上,开发了一种代理,通过连续编码视频帧来更快地处理信息。这种代理还能将视频和语音输入结合到事件的时间线中,以便更好地理解用户所处的环境,并在对话中快速响应。这样一来,交互的速度和质量就会更加自然。

Gemini也将支持语音实时交互,同时今年晚些时候还将上线实时视频交互功能。未来几个月内,谷歌也将推出类似于GPTs的自定义AI助手Gems。它将能与谷歌旗下的各种产品进行交互。

“Gems易于创建,它们可以成为你的瑜伽伙伴,你的私人厨师,聪明的微积分导师,代码的同行评审员。”谷歌的相关负责人说。

谷歌发布会上还宣布了安卓生态的AI新进展,今年晚些时候,能够在本地运行的多模态Gemini Nano模型将登陆Pixel手机,它更智能,更注重隐私保护,比如,如果用户接到诈骗电话,将会提醒用户。

谷歌发布会上还宣布了安卓生态的AI新进展,今年晚些时候,能够在本地运行的多模态Gemini Nano模型将登陆Pixel手机,它更加智能,更加注重用户的隐私保护。例如,当用户接到诈骗电话时,Gemini Nano模型将会提醒用户注意。

如果没有OpenAI,上述谷歌的创新技术可以称得上令人瞩目,但可惜的是没有OpenAI的参与。

硅谷科技竞赛升级

在发布会上,谷歌只提到一家科技大公司,那就是英伟达。皮查伊发布了第六代TPU(张量处理器,谷歌为机器学习定制的专用芯片)芯片Trillium,较上一代芯片的算力表现翻4.7倍,TPU是谷歌自己研发的GPU芯片。

同时,谷歌首席执行官皮查伊表示,谷歌云计划在2025年初开始使用英伟达最新的Blackwell架构GPU。在过去几年中,谷歌已经投资了200万英里的地面和海底光纤网络。

今年3月,英伟达发布了基于“Blackwell”架构的B100芯片与B200 GPU加速器,英伟达创始人黄仁勋表示,这是迄今为止英伟达最强大的GPU芯片。在成功生产出首批服务器后,黄仁勋慷慨地将其中一台服务器赠送给了OpenAI。

GPU在过去一年多时间成为极其抢手的商品,各大科技公司不得不等待数月才能获得供应,这使得黄仁勋成为硅谷最受欢迎的首席执行官,人们纷纷排队等待与他见面,英伟达也是所有科技公司的重要合作伙伴。

而在图形处理器(GPU)大热的背后,硅谷正在进入新一轮的科技竞赛。

2022年底,OpenAI发布ChatGPT开始,整个硅谷进入兴奋的状态,这里甚至出现了AI一条街,只需要五六个人就可以组建一家公司,凭借一个创意就能够获得融资,比如斯坦福博士生郭文景和他的同学创办的Pika,仅仅几个月的时间就成功获得了5500万美元的融资,并且推出了视频生成器Pika1.0。

科技巨头之间的关系变得异常紧张,主要是人工智能技术重塑了行业边界,使得大公司重新燃起了雄心壮志:

微软重新关注了搜索领域,积极支持Bing的发展;Meta公司决定向第三方硬件制造商开放VR头显操作系统Meta Horizon OS,以进一步扩大其在市场上的份额,对苹果生态系统构成更大的竞争;为了应对OpenAI的崛起,苹果被迫放弃了数十年来的造车计划,将资源集中在人工智能领域。

进化以群体聚集的形式在硅谷上演,大公司你追我赶,它们之间的合纵连横也让人工智能竞赛变得更加复杂和激烈。

苹果公司计划与OpenAI合作,将OpenAI的技术应用于iPhone中,但微软是OpenAI的主要投资方;谷歌正在与OpenAI竞争,支持其开源系统Android的人工智能进化,以与苹果iOS系统展开竞争。

席卷全球的这次科技竞赛浪潮颇有点20世纪七八十年代硅谷的意味。那时,原生技术层出不穷,1968年,英特尔成立;1969年,AMD成立;1976年,乔布斯创办苹果电脑;1977年,甲骨文成立;1984年,思科公司成立。

只不过,50年前,是芯片等硬件技术的发展推动了创业潮,创造了财富;而现在,人工智能(AI)以及产品化成为了最新的动力。

在人工智能时代,中国互联网同样也迎来了新的发展机遇,但正如大部分中国人工智能创业者所说,虽然一家又一家公司会在这次浪潮中转型甚至退出市场,但是千万不要低估中国创业者的生命力。

0
分享到:
没有账号? 忘记密码?