Ag

AgentCPM-Explore

推理大模型

AgentCPM-Explore

发布时间: 2026-01-12

23
模型参数(Parameters)
40.0
最高上下文长度(Context Length)
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度
暂无数据
最长输出结果

2048 tokens

模型类型

推理大模型

发布时间

2026-01-12

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0 - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

API接口信息

接口速度(满分5分)
接口价格
暂无公开的 API 定价信息。

AgentCPM-Explore模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

AgentCPM-Explore模型解读

AgentCPM-Explore — 简要说明

AgentCPM-Explore 是由 OpenBMB 组织(AgentCPM 团队,合作单位包括清华 NLP、小批次高校/研究机构等)开源的一个面向“深度探索 / agent”能力的基础模型与端到端训练/评测/部署流水线。该资源以完整的训练与推理基础设施一并开源,包含用于训练的 AgentRL 框架、AgentDock 工具沙箱管理平台以及用于评测的 AgentToLeaP(或等价评测组件)。

发布时间与定位

发布机构:OpenBMB(AgentCPM 团队)。
发布时间(仓库/公告):2026-01-12(见官方仓库与模型卡的发布公告)。

核心目标与特点

  • 目标:面向长期、多步、需在线检索/验证/多源交叉校验的复杂 agent 任务,提升“深度探索(deep exploration)”能力,使得较小参数规模也能在长程 agent 基准上表现出色。
  • 关键能力亮点:支持 100+ 轮的连续环境交互,具备多源信息交叉验证、动态搜索策略调整与实时信息核验等能力;并且随模型一并开源训练与评估的端到端工具链,便于复现与二次开发。

架构与技术规格

  • 参数规模:4B 参数(模型卡与仓库均标注为 4B)。
  • 激活参数:未在官方材料中披露(留空)。
  • 上下文窗口:官方模型卡/仓库未明确给出上下文窗口大小或 token 上限(未公开信息)。
  • 训练数据与架构细节:官方模型卡/README 强调模型与训练/评测流水线的设计思想与能力验证,具体训练语料构成、去重/过滤策略与精确训练步骤在仓库文档中以代码和脚本形式呈现,但未在单页 README 给出可直接复述的完整训练集统计。

能力与模态支持

  • 模态:以文本/agent 工具调用为主(模型卡以长程文本交互与工具/检索/环境交互作为评测核心)。
  • 能力说明:优化用于持续交互、在线检索与多轮规划执行的场景;适合需要多轮工具调用、网页/环境浏览与信息核验的任务。

性能与基准评测(官方公布的结果)

官方模型卡列出了在若干长程 agent 基准(如 GAIA、BrowseComp、HLE、Xbench-DeepSearch 等)上的分数。示例(模型卡表格中的部分条目):GAIA 63.9%、BrowseComp (某项) 25.0%、Xbench-DeepSearch 70.0% 等(详见模型卡中的实验结果表)。这些分数由模型卡公开展示,用于横向对比闭源与开源模型在长程 agent 基准上的表现。

应用场景与限制

  • 推荐用例:长期多步骤任务、需要在线检索/验证与工具调用的自动化代理(如网页浏览/爬取、复杂信息整合、交互式问题求解等)。
  • 已知局限:官方未完全披露上下文窗口和所有训练细节;模型在实际部署时仍需结合工具与上下文管理策略以规避“上下文瓶颈”。

访问方式与许可

  • 代码与模型均开源:仓库与模型卡均采用 Apache-2.0 许可(模型卡与 GitHub 仓库中标注)。
  • 模型权重与 card:可通过 Hugging Face 的 openbmb/AgentCPM-Explore 页面下载;代码仓库在 GitHub(OpenBMB/AgentCPM)。

(以上内容基于 OpenBMB 官方 GitHub 仓库与 Hugging Face 模型卡的公开信息整理,未包含任何主观评价。)

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat