百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。(百川自动化设备有限公司怎么样)

二十多年前,搜索引擎的发明极大地方便了人们获取信息,很快搜索引擎便成为互联网时代最主要的信息获取途径,谷歌、百度更是凭借搜索引擎在 PC 互联网时代占据统治地位,成为两大巨头,多年以来,两者在搜索领域的地位无人能撼动。

ChatGPT 问世后,OpenAI 背后的主要投资方微软率先将 GPT 模型整合到旗下的Bing搜索引擎中,从而引发了对搜索方式重塑的警示。

看到机会,国内外很快便出现了一批人工智能搜索产品,例如此前大火的Perplexity、秘塔、360 搜索、天工AI……可以说 2023 年是人工智能搜索的元年。

Perplexity、秘塔这些人工智能搜索产品他们应该都有一个共同的目标:彻底改变传统搜索的方式。

近日,大模型明星创业公司百川智能也发布了一款号称“懂搜索”的 AI 助手「百小应」。让人颇受关注的是,百川智能创始人王小川,在上个互联网时代因为做出了搜狗搜索而声名大噪,此番入局大模型创业,首款产品跟搜索相关,完全在情理之中,在大家的认知里,如果在国内选两个最能做好AI搜索的人,其中一个必然是王小川。

近日,大型人工智能创业公司百川智能也发布了一款被称为“懂搜索”的AI助手「百小应」。引人关注的是,百川智能的创始人王小川在互联网时代因为开发了搜狗搜索而声名大噪。这次他进军大模型创业领域,推出的首款产品与搜索有关,这完全符合大家的预期。在大家的认知中,如果要选出国内最擅长AI搜索的两个人,其中一个必然是王小川。

但意料之外的是,王小川表示,百度小程序并不是对传统搜索的升级,他不打算做搜索 2.0。

“大型模型的创造是为了创造新的物种,旨在将人工智能从工具转变为伙伴。而百小应则是一款在模型能力有限的情况下,实现从人工智能工具到人工智能伙伴的过渡型产品。”

在实践中,他也非常注重将知识与行动结合起来。与使用大型模型来提升AI搜索体验的产品Perplexity和秘塔不同,百小应定位为一种AI助手,将搜索视为提高回答准确性和丰富性的工具。

百小应,一个懂搜索引擎的人工智能助手

搜索不仅能让大规模模型实时获取最新信息,还能有效解决大规模模型的幻觉问题,是大规模模型落地应用的关键技术之一。

然而,在AI应用中如何充分利用搜索功能,尤其是在AI助手类产品中,不同企业对此有不同的理解。在百川智能看来,如今的AI搜索产品更多是搜索结果的聚合,即将搜索结果进行总结。然而,仅仅做到这一点是不够的。从用户体验的角度来看,AI助手需要具备像人一样掌握专业搜索技能的能力,能够充分利用搜索工具,也就是具备“懂搜索”的能力。

在此基础上,还需要具备“会提问”的能力,让模型能够清晰引导用户表达自己的需求。传统的搜索更多是通过关键词去搜索,无法理解关键词背后用户获取信息的意图。今天通过大模型用自然语言去对话、交流,让机器具备了理解我们的意图的能力,但这个过程中很多时候用户表达不清晰、不准确,导致用户对一些搜索结果仍然不满意。对此「百小应」可以通过提问、反问的方式去引导用户将需求表达得更具体、清晰,进而得到更准确的结果。

为了能够更好地利用搜索工具,百川智能为「百小应」开发了定向搜索和多轮搜索等功能,这不仅使得「百小应」能够在与用户的对话中自主判断是否需要使用搜索工具,还能主动选择使用何种搜索方式。

例如问「百小应」“帮我找下《斗罗大陆IV终极斗罗》的资源?”,它能精准定位你的问题领域——电子书、有声书、视频领域,能直接访问权威网站,在网站中产生搜索,最后定位到拉看书网、有声听书网、哔哩哔哩,点链接就能进入到网站:

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图1

这是「百小应」采用了定向搜索的策略,它搜索的时候不是泛泛的查找,而是直接查找与《斗罗大陆IV终极斗罗》资源最相关的网站。

面对复杂的问题,人会根据之前的搜索经验,进行第二次、第三次甚至更多轮次的搜索,百小应也具备这种能力,针对用户提出的问题,「百小应」在获取搜索结果后会结合用户的问题进行思考,自主判断当前资料是否足够详尽,进而自主决策是否需要进行更多轮次搜索以获取更多信息。

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图2

相比于仅进行一次搜索,多轮搜索在市场调研、产业分析等复杂场景下能够更有效地获取更专业、更深入的信息。

在搜索结果呈现方面,「百小应」同样与其他在单次搜索后“简单总结网页信息”的应用不同,它是将搜索结果作为问答的参考资料,将“搜索结果嵌入回答”,从而使回答更加清晰、详细。

例如让「百小应」分析“新能源汽车市场格局,小米入场后有什么影响”,它便会将搜索到的数据直接引用到回答当中作为数据支撑的一部分:

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图3

在会提问方面,百小应能够在用户问题的基础上通过一系列提问来帮助用户明确自身需求。例如问「百小应」“车门打不开了怎么办?”,它会先问你车的品牌以及型号,是车内打不开还是车外打不开?你告诉它车的品牌型号和车内打不开之后,它会针对性地告诉你正确的开锁方法:

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图4

「百小应」还非常具有“理科”思维,很擅长将结果结构化呈现,如下图所示:

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图5

除了具备搜索和反问功能之外,用户还可以在「百小应」中上传PDF、word文档,或者直接输入网页链接(URL),以便阅读和分析书籍、报告、学术论文等长篇内容。使用「百小应」只需一分钟即可完成对上市公司财报的阅读。

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图6

用户在提问的同时还可以同步上传图片,对图片内容进行解读,或者将图片作为补充材料,获取更精准的回答;并且,它还支持用户通过语音的方式进行交互。

王小川认为,像Perplexity、秘塔这些产品所做的工作都是对搜索结果的总结和归纳,而这种工作搜索引擎公司自身就能够完成。如果只是对搜索结果进行总结,那么这只是对传统搜索的一种升级,无法在价值创造和竞争力方面与传统搜索巨头相抗衡。因此,对于今天的创业公司或者朝着AI伙伴前进的AI助手来说,这并不是他们应该从事的工作。

“AI 助手正确的路径是将搜索结果嵌入到内容中,而不是简单总结搜索结果。它应该将搜索结果作为观点、论点和论证的一部分,并与模型的结果融合在一起。”

这种判断背后是王小川对大模型时代的超级应用的深入思考,他认为,要让大模型具备类似人类思考的能力,超级应用应该朝着与人类成为伙伴的方向发展。

在大模型时代,王小川眼中的超级应用是什么?

从创立之初,王小川就一直强调百川需要拥有自己独特的超级应用。

相比互联网时代动辄上亿用户的应用,当下一个拥有 100 亿日活跃用户(DAU)的人工智能产品就能引起轰动,但王小川认为现在还没有出现超级应用,从用户体量上看还需要再提升两个数量级,即DAU需要达到3千万到3亿之间才能称之为超级应用。

“当下最火的两款应用,微信拥有13亿+日活跃用户(DAU),抖音拥有4亿+日活跃用户(DAU),大模型时代的超级应用应该是如抖音这样的一个产品。”

过去在开发输入法、搜索引擎和浏览器方面的经验,让百川智能了解了一个应用需要达到什么程度才能成为一个被广泛使用的产品。

如果「百小应」要成为一个超级应用,王小川认为应该具备以下特点:

首先,模型的可靠性可以达到60%至80%。未来,模型必须与搜索结合起来,因为模型是一个推理引擎,通过与搜索的结合,它的知识广度和真实性都能得到提升。

第二,作为助手能充分理解用户的意图,变成某个行业的专业人士一样。AI 能像人一样思考、工作、学习,最后就会变成一个职业人士,例如法律助手、医疗助手。

接下来,对于「百小应」王小川表示,他不会采用营销战术来宣传该产品。他认为一些厂商发布产品可能是为了吸引投资,这种方式并不健康。相反,百川将把精力集中在产品的打磨和发掘产品价值上,致力于打造真正优秀的产品。

百川的“双轮驱动”战略

“超级模型+超级应用”的双轮驱动一直是百川智能的发展理念。而此次「百小应」发布,正好填补了应用方面的空白,百川智能可以说是真正实现了“双轮驱动”的目标。

虽然现在既没到超级模型,也没到超级应用,即便「百小应」还只是一个过渡型的产品,但王小川称团队心中有超级应用的画面感,尤其是从去年4月份工作到今年5月份这一年的时间,团队有足够的手感。

超级应用的诞生,最根本还是要看模型的能力。

在模型基础能力层面,百川智能一直在不断提升。此次与「百小应」一起发布的是Baichuan 4大模型,作为百川智能发布的最新一代基座大模型,Baichuan 4在各项能力上都有显著提升。其中通用能力提升超过10%,指令跟随能力提升20%,信息理解能力提升9%,知识问答能力提升15%,创作能力提升16%,逻辑推理能力提升15%;专项能力方面,数学能力提升14%,代码能力提升9%。

此外,在国内权威大模型评测机构SuperCLUE的评测中,Baichuan 4模型展现出了国内领先的能力。而此前,在 SpuerCLUE 发布的“中文大模型基准测评2024年4月报告中”,Baichuan 3以73.32分的成绩超越了文心一言4.0、通义千问2.1、GLM 4、Moonshot等大模型,成为国内大模型排名的第一名。

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图7

不仅如此,与国外主流大模型对比,百川4在知识百科、长文本、生成创作等文科类中文任务上明显优于国外大模型。

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图8

「雷峰网」Baichuan 4能在短时间内取得模型能力的突破,源于其在训练过程中引入了诸多业内领先的技术优化手段。例如,在预训练阶段采用了基于模型和人工协同的数据筛选优化方法,以及对长文本建模位置编码科学的Scaling Law,有效提升了模型对数据的利用;在对齐阶段重点优化了模型的推理、规划和指令遵循能力,通过损失驱动的数据选取与训练,多阶段爬坡,多模型参数融合等方式有效提升了模型的关键指标和稳定性。同时突破了RLHF和RLAIF融合的RLxF强化学习对齐技术,大幅提升了模型的指令遵循等能力。

此外,Baichuan 4在多模态领域也取得了令人满意的成绩,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等评测基准上表现出色,明显超过Gemini Pro、Claude3-sonnet等其他多模态模型。

百川智能的首款AI应用专注于搜索,但王小川不支持搜索2.0。_图9

同时,为了让更多开发者、企业用户能够像「百小应」一样更好地利用百川大模型的能力,百川智能推出了全新的 MaaS+AaaS 服务。

MaaS(移动即服务)版块由基座模型组成,并且在综合了成本和性能的考量下将API分为旗舰版和专业版。旗舰版将全量开放Baichuan 4的各项能力。此前,在SuperCLUE的金融知识百科能力上,Baichuan 3已经取得了A+的最高评级,升级之后的Baichuan 4则更加强大。

专业版包含 Baichuan3-Turbo 和 Baichuan3-Turbo-192K 两款模型,在价格方面相比旗舰版 Baichuan 4 更经济实惠,且均专注于满足企业使用的高频场景需求,综合测试结果显示相比 GPT3.5 整体效果提升了8.9%。

百川还在 Baichuan 4 基础上针对 Agent 构建推出 Assitant API,随着大模型的应用在各领域持续深入,Agent 已经成为企业的关注重点。在此背景下,百川智能对模型的工具调用能力进行了特殊强化,不仅支持 Code interpreter、RAG 内建工具,还支持自定义工具调用,方便企业接入各种丰富复杂的 API。评测结果显示其工具调用能力接近Open AI assistant API。

0
分享到:
没有账号? 忘记密码?