AI Agent 是一种融合感知、分析、决策和执行能力的智能体,具有自主决策和行动能力,能够理解并适应复杂环境,根据目标自主思考、制定计划并执行相应任务。
相较于 Copilot 的工具型辅助能力,Agent 更注重对环境的实时感知和判断,更像人类一样形成独立的决策和行动方案。目前,50%的企业已经在某项工作中进行了 AI Agent 的试点,另有 34%的企业正在制定应用计划,主要应用于智能终端、智能座舱、汽车自动驾驶、工业机器人和人形机器人等领域。
AI Agent 基于大型语言模型(LLM)和其他技术实现,其包括几个重要概念:
Chain:通常一个 AI Agent 可能由多个 Chain 组成,每个 Chain 可视为一个步骤,能接受输入变量并产生输出变量,大部分 Chain 由大语言模型完成。 Router:通过一些判定(甚至可用 LLM 判定)让 Agent 走向不同的 Chain。 Tool:Agent 上的一次工具调用,如对互联网的搜索或对数据库的检索。此外,还需要三个 Agent:
Responser Agent:主 agent,用于回复用户(伪多模态)。 Background Agent:背景 agent,用于推进角色当前状态,如进入下一个剧本,抽检生成增长的记忆体等。 Daily Agent:每日 agent,用于生成剧本、配套图片以及每日朋友圈。这三个 Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系、反感度等,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,并有概率主动聊天(与亲密度正相关,跳过夜间时间)。随着全球 AI 市场快速升温,新的 AI 应用不断涌现,AI Agent 被认为是当下大模型最激动人心的发展主线,在满足企业智能化需求、强化内外部协同效能等方面发挥着重要作用,让“人机协同”成为新常态。