Grok 4 Fast
支持
2000K tokens
4096 tokens
聊天大模型
2025-09-19
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0.2 美元/100万 tokens | 0.5 美元/100万 tokens |
| 图片 | 0.2 美元/100万 tokens |
xAI 于 2025 年 9 月 19 日发布了 Grok-4 Fast 模型。该模型是一种高效的推理模型,旨在提供高性能的同时降低成本。
Grok-4 Fast 支持 2M 令牌的上下文窗口,能够处理较长的对话或复杂数据集。其架构统一,支持通过系统提示在推理模式和非推理模式之间切换。模型通过端到端的工具使用强化学习训练,能够根据需要调用工具,如代码执行或网页浏览。此外,它具备代理搜索功能,可浏览网页和 X(前 Twitter),并处理图像和视频等媒体,以获取实时数据。
Grok-4 Fast 在多项基准测试中表现出色,与前代模型 Grok 3 Mini 相比,使用了平均 40% 更少的思考令牌。以下是部分测试结果(均为 pass@1,无工具,除非注明):
基准测试Grok-4 Fast 分数备注
GPQA Diamond85.7%高难度推理
AIME 202592.0%数学竞赛级问题
HMMT 202593.3%高级数学挑战
HLE (Human Level Eval)20.0%人类水平评估
LiveCodeBench (Jan-May)80.0%实际编码任务
在搜索相关评估中,其分数为:BrowseComp 44.9%、SimpleQA 95.0%、Reka Research Eval 66.0%。在 LMSYS Arena 中,启用搜索的变体(grok-4-fast-search,代号“menlo”)Elo 分数为 1163,排名第一;基础模型(“tahoe”)在 Text Arena 中排名第八。
根据 Artificial Analysis 的独立评估,Grok-4 Fast 在价格与智能指数的比率上处于领先地位,其性能接近 Grok-4,但成本降低了 98%。在智能指数与价格图表中,该模型优于 Gemini 2.5 Flash 和 DeepSeek V3.1 等模型,适用于实时应用,具有较低的延迟和令牌成本。
Grok-4 Fast 现已可用,用户可通过 grok.com、iOS 和 Android 应用访问,选择“Fast”或“Auto”模式。对于 API 用户,xAI 提供 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 变体,定价如下:
xAI 计划根据 X 上的反馈持续改进模型,包括增强多模态功能和代理工具支持。截至 2025 年 9 月 21 日,该模型已准备用于企业和消费者应用。
关注DataLearnerAI微信公众号,接受最新大模型资讯