AI硬件遭到字节偷窥?(ailab字节)

一则收购消息,让外界更加相信字节正在秘密筹备人工智能硬件的计划。

近期,彭博社报道字节以5000万美元(约合人民币3.62亿元),收购中国耳机制造商Oladance。彭博社援引知情人士称,此举是因为字节管理层看到了可穿戴设备成为人工智能与大数据服务平台的潜力。

字节在这场人工智能浪潮中非常积极参与。根据Sensor Tower的数据,截至今年4月,字节推出的豆包应用在苹果iOS平台上一年内的下载量接近900万次,超过了百度文心一言的800万次。

前不久,OpenAI发布了GPT-40,字节旗下火山引擎紧随其后发布了豆包大模型家族,并将价格降低到最低0.0008元/千tokens。这一举措立即引发了连锁反应,阿里云宣布将通义千问主力模型Qwen-Long的API输入价格降低到0.0005元/千tokens,降幅达到了97%。百度推出了两款主力大模型免费对外使用,腾讯也公布了大模型升级方案,其中主力模型之一的混元-Lite也调整为免费使用。

AI硬件遭到字节偷窥?_图1

此外,在OpenAI 2月公布文生视频大模型Sora之前一周,原抖音集团CEO张楠辞职,转而担任剪映的负责人。三个月后,剪映全面推出了AI作图和AI视频生成工具即梦。

然而,在大型软件商业化方面进展缓慢的情况下,硬件正成为许多大型模型用户输出人工智能能力的新方式。

手机厂商和PC厂商竞相将传统智能终端改造成人工智能硬件,推出了具备人工智能功能的手机和电脑。有传闻称苹果正在与OpenAI、谷歌等公司进行沟通,计划将大型人工智能模型应用于即将发布的新品中。微软也宣布了其Windows 11 AI PC计划,将Copilot全面引入操作系统,成为用户随时可用的全能助手。此外,OpenAI还宣布将开发并制造自己的人工智能硬件,但具体形态目前还没有公开。

包括智能眼镜在内的一些小众硬件产品也成为一些企业投注的品类。Meta和雷蒙合作的智能眼镜已经成功集成到了多模态版本的Llama3中,而华为智能眼镜则实现了与盘古大模型的连接。智能眼镜不仅轻便,还能同时满足视觉(镜片)和听觉(镜架扬声器)的需求。而Oladance在开放式耳机方面的技术,正好符合后者对于音频体验的需求。

然而,一些AI硬件的创新先驱者正面临着困境:曾经令人惊叹的AI Pin和没有APP的Rabbit 1在推出后曾经引起轰动,但很快就出现了问题——Rabbit R1被指责为套壳安卓系统,而AI Pin的使用体验也不尽如人意,背后的公司Humane据传已经在寻求出售。

被字节收入囊中的Oladance,在开放式耳机设备和出海两个领域都有丰富的经验。

Oladance主攻开放式耳机,也就是挂在耳朵上、不入耳的耳机。甚至现在常用的OWS(Open Wearable Stereo开放式穿戴立体声)概念本就是Oladance提出的。

这种耳机和传统入耳式耳机的最大区别在于,使用者在享受个人音频的同时,可以保持与外界的联系,可以与他人交谈、收听环境音等场景不受影响。

Oladance这家公司非常年轻,成立于2019年,总部位于深圳。公司的全名是深圳市大十未来科技有限公司,这个名字非常豪放。创始人李浩乾曾是BOSE的高管,在创业时还带来了几位BOSE工程师。

与先在本土推出产品再进军海外市场的常规路径不同,Oladance在2021年7月选择了通过众筹的方式在北美Kickstarter网站上推出了他们的第一款全开放式耳机。令人惊讶的是,仅仅一个小时内就获得了15万美元的资金支持(约合人民币105万元),最终众筹金额达到了39.7万美元(约合人民币278万元)。随后,Oladance才开始在中国销售这款耳机。在次年的6月,Oladance进军日本市场,同样选择了众筹网站Makuake作为第一站,仅仅2小时内就完成了众筹目标,最终众筹金额达到了1.05亿日元(约合人民币484万元)。

AI硬件遭到字节偷窥?_图2

自登陆北美市场后的两年时间,Oladance的产品已经迅速扩展到全球超过30个国家和地区,取得了令人瞩目的销售成绩。

顺带一提,Oladance的产品定价较高,属于中高档价位的耳机。目前Oladance京东自营旗舰店在售耳机中,最低价格为999元,最高价格为1499元(目前正是618期间,页面显示“直降400”),单独的充电仓价格在300元以上。用创始人李浩乾在36氪WISE2023未来消费大会上的话说就是“我们的产品比苹果卖得还贵”。

在国际市场上,Oladance已经取得了一定的知名度,其在YouTube网站上的评测视频观看量达到了数万甚至上百万次,同时还荣获了亚马逊2022年度创新品牌的评选。

AI硬件遭到字节偷窥?_图3

AI硬件遭到字节偷窥?_图4

到了2023年8月,Oladance传出天使轮融资的消息,规模千万美元,由蓝驰创投、黑蚁资本领投。据36氪,李浩乾曾透露Oladance预计2024年营收超10亿美元。

字节跳动收购一家耳机公司,可能并非出于进军音频市场的意图。

耳机市场已经是一片红海,传统TWS(True Wireless Stereo)真无线耳机的市场在经历高增长后已经开始萎缩,全球出货量增速从2021年的70%,降至2022年的25%,预计到2023年将只有8%。

开放式耳机(OWS)市场增长迅速,但规模相对较小。根据市场调研机构Canalys的数据,到2023年第四季度,开放式耳机在个人音频市场的份额增长了68%,但总体占比仅为2.9%。根据Global Information的报告,到2023年,全球开放式耳机市场的规模约为19亿美元。

相比之下,Oladance在字节更有可能的用武之地在人工智能硬件领域。

字节是这一波人工智能浪潮中受到很大影响的科技巨头之一。去年8月,字节发布了名为豆包的ChatGPT应用。而在本月(2024年5月),OpenAI公布了GPT-4o,紧接着字节旗下的火山引擎也发布了豆包大模型家族,并将价格降低到了0.0008元/千tokens,一时间引发了国内大模型价格战的热潮。

此外,抖音前首席执行官张楠现在担任剪映的负责人,并且最近推出了名为“即梦”的AI作图和AI视频生成工具,这一举措与OpenAI的视频模型Sora保持了一致。

在核心技术大语言模型、落地应用之外,承载AI的硬件也成了科技企业的圣杯——谁都不能准确说出未来的AI硬件到底是什么形态,但是谁都不敢不去尝试。

AI硬件遭到字节偷窥?_图5

传统智能终端纷纷智能化,智能手机和智能电脑已经成为厂商的必备新品。微软前不久才在新品发布会上宣布推出“更快、更智能”的Windows PC品类:Windows 11智能PC。其内置OpenAI的GPT-4o,并且将智能助手Copilot全面引入系统。微软CEO萨蒂亚·纳德拉(Satya Nadella)更是直接挑战苹果,称期待Windows与Mac能够“重新展开真正意义上的对决”。

XR设备也是人工智能领域的热门战场,其中以智能眼镜最为引人注目。

Meta早在2021年就和雷朋眼镜合作,推出过智能眼镜。去年9月,双方再次合作推出Ran-Ban Meta智能眼镜,最大的亮点是内置Meta AI,今年还升级支持多模态版本Llama 3大模型。

这意味着用户不仅可以使用“Hey Meta”来唤起一个助理,而且这个助理除了语音交互之外,还可以通过眼镜摄像头来识别环境,并与用户进行沟通。Meta的CEO马克·扎克伯格(Mark Zuckerberg)自己在Instagram上发布了一段视频宣传,视频中他戴着智能眼镜,拿起一件衬衫,并询问Meta AI如何搭配裤子。

就连谷歌联合创始人谢尔盖·布林都感叹,智能眼镜是最新公布的Project Astra的“完美硬件”。可惜谷歌发布智能眼镜是在10年前:“不幸的是,我们搞错了时间。我真希望实际能把握得更好一些。”

如今,已经有许多企业进入智能眼镜领域,并将大型模型应用于其中。例如,华为将盘古大型模型集成到华为智能眼镜2中,虽然不支持XR功能,但可以被视为智能音频眼镜。另外,前天猫精灵产品总经理茹忆创业创办的李未可科技有限公司也已经推出了首款AI智能眼镜,搭载了自主研发的大型模型WAKE-AI。

智能眼镜通常会在镜架上安装扬声器,以便在使用时能够提供音频输出。为了确保音频质量,需要采取措施来减少漏音并提高通话时的降噪能力。这与开放式耳机的技术目标是一致的。

但人工智能硬件的研发并不容易,或者说各家公司都还在探索阶段,试错可能是不可避免的。

这几天还有另一个关于AI硬件的消息,不过是个不太好的消息:Humane正在寻求出售。

Humane这个公司名本身不出圈,但要说其产品AI Pin,相信很多人都不陌生。这款可穿戴AI设备没有屏幕,配有传感器、生成式AI和小型投影仪,用户把它挂在胸前进行语音交互,还可以直接将信息投影在手心。

Humane这个公司名本身并不太有名气,但是他们的产品AI Pin却非常知名。这款可穿戴的人工智能设备没有屏幕,而是配备了各种传感器、生成式人工智能和小型投影仪。用户可以将AIPin挂在胸前,通过语音进行交互,并且还可以将信息直接投影在手心上。

新颖的交互方式让AI Pin一经推出就备受瞩目,毕竟大家都在谈论AI硬件,但真正能够开发出一款与手机、PC不同的产品的公司并不多。然而,AIPin的实际使用体验却不尽如人意,例如在户外日光下无法清晰地看到投影内容,以及语音交互存在延迟等问题。

据彭博社报道,5月份,Humane公司开始寻找新的买家,希望以7.5亿美元到10亿美元的价格出售。目前,这一交易正处于早期阶段。虽然初创企业寻求出售并不罕见,但令人惊讶的是,在“下一代iPhone”刚刚发布一个月后,Humane公司就决定离场,这对于AI硬件创新来说无疑是一次打击。

虽然字节在硬件方面有一定的经验,但并没有取得大获全胜的经验。

去年11月,字节跳动旗下虚拟现实(VR)部门PICO宣布进行人员裁员,涉及员工超过300人,占比约为23%。字节跳动在2021年以数十亿元的价格收购了PICO,并致力于发展VR头显业务。在最高峰时期,PICO的员工总数曾超过2000人。经过裁员后,PICO将维持千人规模的运营。

AI硬件遭到字节偷窥?_图6

在内部发言中,PICO CEO周宏伟表示“之前我们对行业和市场的发展做出了相对乐观的预测,但实际情况发展得比我们预期的要快。”

字节PICO头显刚开始尝到了增长的甜头。根据Wellsenn XR的数据,2022年第二季度PICO头显的出货量达到26万台,同比增长近8倍。然而,很快甜头就变成了苦果。根据IDC的估计,2023年上半年PICO头显的出货量仅为14万台,远低于上一年。随着元宇宙的热度消散,整个VR赛道还没有真正迎来爆发式增长,而是转为平静。

除此之外,字节还曾涉足教育硬件,从2020年开始推出了一系列产品,包括大力智能学习灯、智能写字板等。其中,学习灯在一年多的时间里累计销量突破了100万台。然而,2022年6月教育业务大幅裁员后,字节不再发布新的学习灯产品。随后,字节教育硬件业务负责人杨康转岗,业务首任负责人阳陆育离职,字节在教育硬件方面的动态较少。

如今人工智能的竞争激烈,各大公司都希望能够在下一代智能终端领域占据先机。走得太慢可能会错过机会,走得太快又有可能冒进导致失败,所以字节跟其他公司一样只能谨慎前行。

0
分享到:
没有账号? 忘记密码?