Gr

Grok 4 Fast

聊天大模型

Grok 4 Fast

发布时间: 2025-09-19

285
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
2000K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

2000K tokens

最长输出结果

4096 tokens

模型类型

聊天大模型

发布时间

2025-09-19

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 0.2 美元/100万 tokens 0.5 美元/100万 tokens
图片 0.2 美元/100万 tokens --

Grok 4 Fast模型在各大评测榜单的评分

综合评估

共 3 项评测
GPQA Diamond thinking
85.70
12 / 135
LiveBench normal
68.09
25 / 51
HLE thinking
20
28 / 72

常识问答

共 1 项评测
SimpleQA thinking + 使用工具
95
3 / 43

编程与软件工程

共 1 项评测
LiveCodeBench thinking
80
13 / 98

数学推理

共 1 项评测
AIME2025 thinking
92
26 / 95

Grok 4 Fast模型解读

关于Grok 4 Fast更深度分析可以参考我们的博客: https://www.datalearner.com/blog/1051758459872078 


xAI 于 2025 年 9 月 19 日发布了 Grok-4 Fast 模型。该模型是一种高效的推理模型,旨在提供高性能的同时降低成本。

模型特性

Grok-4 Fast 支持 2M 令牌的上下文窗口,能够处理较长的对话或复杂数据集。其架构统一,支持通过系统提示在推理模式和非推理模式之间切换。模型通过端到端的工具使用强化学习训练,能够根据需要调用工具,如代码执行或网页浏览。此外,它具备代理搜索功能,可浏览网页和 X(前 Twitter),并处理图像和视频等媒体,以获取实时数据。

基准测试结果

Grok-4 Fast 在多项基准测试中表现出色,与前代模型 Grok 3 Mini 相比,使用了平均 40% 更少的思考令牌。以下是部分测试结果(均为 pass@1,无工具,除非注明):

基准测试Grok-4 Fast 分数备注

GPQA Diamond85.7%高难度推理

AIME 202592.0%数学竞赛级问题

HMMT 202593.3%高级数学挑战

HLE (Human Level Eval)20.0%人类水平评估

LiveCodeBench (Jan-May)80.0%实际编码任务

在搜索相关评估中,其分数为:BrowseComp 44.9%、SimpleQA 95.0%、Reka Research Eval 66.0%。在 LMSYS Arena 中,启用搜索的变体(grok-4-fast-search,代号“menlo”)Elo 分数为 1163,排名第一;基础模型(“tahoe”)在 Text Arena 中排名第八。

性能与成本比较

根据 Artificial Analysis 的独立评估,Grok-4 Fast 在价格与智能指数的比率上处于领先地位,其性能接近 Grok-4,但成本降低了 98%。在智能指数与价格图表中,该模型优于 Gemini 2.5 Flash 和 DeepSeek V3.1 等模型,适用于实时应用,具有较低的延迟和令牌成本。

可用性和定价

Grok-4 Fast 现已可用,用户可通过 grok.com、iOS 和 Android 应用访问,选择“Fast”或“Auto”模式。对于 API 用户,xAI 提供 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 变体,定价如下:

  • 输入令牌:小于 128k 时 $0.20 / 1M,大于等于 128k 时 $0.40 / 1M
  • 输出令牌:小于 128k 时 $0.50 / 1M,大于等于 128k 时 $1.00 / 1M
  • 缓存输入:$0.05 / 1M

未来发展

xAI 计划根据 X 上的反馈持续改进模型,包括增强多模态功能和代理工具支持。截至 2025 年 9 月 21 日,该模型已准备用于企业和消费者应用。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat