Gr

Grok 4

推理大模型

Grok 4

发布时间: 2025-07-10

1,924
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
256K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

256K tokens

最长输出结果

262144 tokens

模型类型

推理大模型

发布时间

2025-07-10

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode) 深度思考(Deeper Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 3 美元/100 万tokens 15 美元/100 万tokens
图片 3 美元/100 万tokens --

Grok 4模型在各大评测榜单的评分

综合评估

共 8 项评测
MMLU Pro thinking
87
7 / 107
GPQA Diamond thinking
87
9 / 135
LiveBench normal
72.84
11 / 51
ARC-AGI thinking
66.70
6 / 34
HLE thinking + 使用工具
38.60
7 / 72
HLE thinking + 使用工具+联网
38.60
7 / 72
HLE thinking
25.40
17 / 72
ARC-AGI-2 thinking
15.90
6 / 24

编程与软件工程

共 2 项评测
LiveCodeBench thinking
82
10 / 98
58.60
44 / 68

数学推理

共 9 项评测
AIME2025 thinking + 使用工具
98.80
9 / 95
AIME2025 thinking
91.70
27 / 95
IMO-ProofBench thinking
46.70
4 / 16
IMO 2025 thinking
29.20
1 / 9
IMO-ProofBench deeper_thinking
23.30
10 / 16
IMO 2024 thinking
23.20
1 / 10
18.60
3 / 8
FrontierMath normal
12.10
12 / 50
2.10
13 / 27

AI Agent - 工具使用

共 1 项评测
Terminal-Bench thinking + 使用工具
38
13 / 35

常识推理

共 1 项评测
Simple Bench thinking
60.50
5 / 25

Agent能力评测

共 2 项评测
Aider-Polyglot thinking
79.60
4 / 22
τ²-Bench - Telecom thinking + 使用工具
75
11 / 17

Grok 4模型解读

-------------2025年8月9日Grok4最新消息------------

1. Grok 4 向免费用户开放(不含联网搜索)

自 2025 年 7 月初起,xAI 发布了升级版 Grok 4,带来了更强的性能、原生工具调用以及实时搜索等功能。此前该版本仅面向付费订阅(如 SuperGrok 或 Premium+)开放,而现在免费用户也可以使用 Grok 4,但不支持联网搜索功能。虽然官方公告细节不多,但已有大量用户反馈这一功能已实际开放

2. PDF 处理能力大幅增强

Grok 4 现在可以轻松处理上百页的大型 PDF 文件,并且在内容识别和理解方面有了显著提升。这项功能在网页端和移动端均可使用,对于研究人员、学生以及需要阅读长文档的专业人士来说是重大利好。

3. Grok Imagine 上线图片与视频生成

在创作能力方面,xAI 将 Grok Imagine 集成到 iOS 与 Android 的 Grok 应用中,带来了一系列视觉生成能力:

  • 支持从文本或图像生成图片和视频
  • 视频最长可达 15 秒,并支持音频同步
  • 提供 普通(Normal)、趣味(Fun)、自定义(Custom)、Spicy(成人) 四种模式
  • 目前在移动端免费向所有用户开放,且使用量激增——单日生成图片 4400 万张,是前一天的两倍

该功能详情参考:  xAI发布Grok Imagine功能,一条文本命令即可生成图片和最长达15秒的视频,也可以基于现有照片生成视频,免费用户也可以使用~ 


---------原始介绍

马斯克旗下大模型企业xAI发布的第四代大模型。各项评测结果都超过了当前现有的大模型,API接口价格和上一代一样,但是网页版不再免费,需要SuperGrok的会员,300美元一年,或者30美元一个月。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat