模型评测对比最新基准汇总

DataLearner AI 大模型基准对比
GPT-5与Gemini 2.5-Pro、Grok 4模型能力评测结果

本页面提供GPT-5,Gemini 2.5-Pro,Grok 4模型的对比，包括参数、开源情况、API价格等。同时，页面也会展示GPT-5,Gemini 2.5-Pro,Grok 4模型在ARC-AGI,HLE,GPQA Diamond,ARC-AGI-2,Simple Bench等评测基准中的详细对比数据，评测数据来自系统收录结果汇总。

模型概览 Model Overview

快速浏览本次参与对比的模型关键信息。

OpenAI

GPT-5

OpenAI 发布的基础大模型模型。

发布时间: 2025-08-07
上下文长度: 400K
模型类型: 基础大模型

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）深度思考（Deeper Thinking Mode）

规格详情在线体验

Google Deep Mind

Gemini 2.5-Pro

Google Deep Mind 发布的推理大模型模型。

发布时间: 2025-06-05
上下文长度: 1000K
模型类型: 推理大模型

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）深度思考（Deeper Thinking Mode）

规格详情在线体验

xAI

Grok 4

xAI 发布的推理大模型模型。

发布时间: 2025-07-10
上下文长度: 256K
模型类型: 推理大模型

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）深度思考（Deeper Thinking Mode）

规格详情在线体验

特性明细对比

技术规格、API 能力与生态细节，一眼看清差异。

📊 左右滑动可查看更多模型数据 →

对比项	G GPT-5 OpenAI	G Gemini 2.5-Pro Google Deep Mind	G Grok 4 xAI
核心信息
开发机构	OpenAI	Google Deep Mind	xAI
发布时间	2025-08-07	2025-06-05	2025-07-10
模型类型	基础大模型	推理大模型	推理大模型
MoE 架构
性能与规格
总参数量	未公开	未公开	未公开
激活参数量	未公开	未公开	未公开
模型大小
推理能力
推理速度
思考模式
深度思考
最大上下文	400K	1000K	256K
最大输出	131072	65536	262144
支持模态
文本输入
图片输入
音频输入
视频输入
Embedding 输入
输出能力
文本输出
图片输出
音频输出
视频输出
Embedding 输出
开源与许可
代码开源	--	--	--
权重开源	--	--	--
商业授权	不开源	不开源	不开源
资源与链接
GitHub	--	--	--
Hugging Face	--	--	--
论文/报告	查看	查看	查看
官方介绍	阅读	阅读	阅读
在线体验
Playground	体验入口	体验入口	体验入口

GPT-5与Gemini 2.5-Pro、Grok 4模型各评测基准得分对比表

评测基准	GPT-5 default	Gemini 2.5-Pro default	Grok 4 default
ARC-AGI 综合评估	65.7	37	66.7
HLE 综合评估	35.2	21.6	38.6
GPQA Diamond 综合评估	87.3	86.4	87
ARC-AGI-2 综合评估	9.9	4.9	15.9
Simple Bench 常识推理	56.7	62.4	60.5

GPT-5与Gemini 2.5-Pro、Grok 4模型评测结果汇总对比图

按评测类别查看各模型/模式的得分差异。

蓝色柱状系列表示选定模型 GPT-5 在不同模式下的表现

GPT-5与Gemini 2.5-Pro、Grok 4模型的 API 价格对比 Pricing Comparison

输入/输出单价、不同模式费用一览，快速找到性价比。

GPT-5与Gemini 2.5-Pro、Grok 4模型评测基准详表 Benchmark Details

逐个榜单查看各模型表现，支持点击跳转原始链接。

模型概览 Model Overview

特性明细对比

GPT-5与Gemini 2.5-Pro、Grok 4模型各评测基准得分对比表

GPT-5与Gemini 2.5-Pro、Grok 4模型 评测结果汇总对比图

GPT-5与Gemini 2.5-Pro、Grok 4模型 的 API 价格对比 Pricing Comparison

GPT-5与Gemini 2.5-Pro、Grok 4模型 评测基准详表 Benchmark Details

GPT-5与Gemini 2.5-Pro、Grok 4模型评测结果汇总对比图

GPT-5与Gemini 2.5-Pro、Grok 4模型的 API 价格对比 Pricing Comparison

GPT-5与Gemini 2.5-Pro、Grok 4模型评测基准详表 Benchmark Details