Grok 4 Fast

聊天大模型

Grok 4 Fast

发布时间: 2025-09-19

590

GitHub Hugging Face 在线体验

模型参数（Parameters）

未披露

最高上下文长度（Context Length）

2000K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

2000K tokens

最长输出结果

4096 tokens

模型类型

聊天大模型

发布时间

2025-09-19

模型预文件大小

暂无数据

思考模式

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源 - 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://grok.com/

官方介绍与博客

官方论文

Grok 4 Fast Pushing the Frontier of Cost-Efficient Intelligence

DataLearnerAI博客

大模型速度、效果与价格的完美结合？xAI发布Grok 4 Fast：性能接近Grok 4，成本降 98%，生成速度翻倍！

API接口信息

接口速度（满分5分）

接口价格

默认单位：$/100万 tokens；若计费单位不同，则以供应商公开的原始标注为准。

标准计费 Standard

模态	输入	输出
文本	0.2 美元/100万 tokens	0.5 美元/100万 tokens
图片	0.2 美元/100万 tokens	--

Grok 4 Fast模型在各大评测榜单的评分

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

GPQA Diamond default

85.70

28 / 158

LiveBench default

68.09

25 / 51

HLE default

62 / 111

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

SimpleQA default

3 / 44

编程与软件工程

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

LiveCodeBench default

20 / 105

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

AIME2025 default

34 / 106

发布机构

xAI

查看发布机构详情

Grok 4 Fast模型解读

关于Grok 4 Fast更深度分析可以参考我们的博客： https://www.datalearner.com/blog/1051758459872078

xAI 于 2025 年 9 月 19 日发布了 Grok-4 Fast 模型。该模型是一种高效的推理模型，旨在提供高性能的同时降低成本。

模型特性

Grok-4 Fast 支持 2M 令牌的上下文窗口，能够处理较长的对话或复杂数据集。其架构统一，支持通过系统提示在推理模式和非推理模式之间切换。模型通过端到端的工具使用强化学习训练，能够根据需要调用工具，如代码执行或网页浏览。此外，它具备代理搜索功能，可浏览网页和 X（前 Twitter），并处理图像和视频等媒体，以获取实时数据。

基准测试结果

Grok-4 Fast 在多项基准测试中表现出色，与前代模型 Grok 3 Mini 相比，使用了平均 40% 更少的思考令牌。以下是部分测试结果（均为 pass@1，无工具，除非注明）：

基准测试Grok-4 Fast 分数备注

GPQA Diamond85.7%高难度推理

AIME 202592.0%数学竞赛级问题

HMMT 202593.3%高级数学挑战

HLE (Human Level Eval)20.0%人类水平评估

LiveCodeBench (Jan-May)80.0%实际编码任务

在搜索相关评估中，其分数为：BrowseComp 44.9%、SimpleQA 95.0%、Reka Research Eval 66.0%。在 LMSYS Arena 中，启用搜索的变体（grok-4-fast-search，代号“menlo”）Elo 分数为 1163，排名第一；基础模型（“tahoe”）在 Text Arena 中排名第八。

性能与成本比较

根据 Artificial Analysis 的独立评估，Grok-4 Fast 在价格与智能指数的比率上处于领先地位，其性能接近 Grok-4，但成本降低了 98%。在智能指数与价格图表中，该模型优于 Gemini 2.5 Flash 和 DeepSeek V3.1 等模型，适用于实时应用，具有较低的延迟和令牌成本。

可用性和定价

Grok-4 Fast 现已可用，用户可通过 grok.com、iOS 和 Android 应用访问，选择“Fast”或“Auto”模式。对于 API 用户，xAI 提供 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 变体，定价如下：

输入令牌：小于 128k 时 $0.20 / 1M，大于等于 128k 时 $0.40 / 1M
输出令牌：小于 128k 时 $0.50 / 1M，大于等于 128k 时 $1.00 / 1M
缓存输入：$0.05 / 1M

未来发展

xAI 计划根据 X 上的反馈持续改进模型，包括增强多模态功能和代理工具支持。截至 2025 年 9 月 21 日，该模型已准备用于企业和消费者应用。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯