De

DeepSeek V3.2-Exp

推理大模型

DeepSeek-V3.2-Exp

发布时间: 2025-09-29

693
模型参数(Parameters)
6710.0
最高上下文长度(Context Length)
128K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

64000 tokens

模型类型

推理大模型

发布时间

2025-09-29

模型预文件大小

1342GB

推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
MIT License - 免费商用授权
GitHub 源码
Hugging Face
在线体验

官方介绍与博客

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 0.28 美元 / 100万 tokens 0.42 美元 / 100万 tokens
缓存计费 Cache
模态 输入 Cache 输出 Cache
文本 0.028 美元 / 100万 tokens --

DeepSeek V3.2-Exp模型在各大评测榜单的评分

综合评估

共 9 项评测
MMLU Pro thinking
85
11 / 107
MMLU Pro normal
84
22 / 107
GPQA Diamond thinking
79.90
39 / 135
GPQA Diamond normal
74
56 / 135
LiveBench thinking
71.64
14 / 51
LiveBench normal
66.64
28 / 51
HLE thinking + 使用工具
20.30
27 / 72
HLE thinking
19.80
29 / 72
HLE normal
8.60
55 / 72

常识问答

共 1 项评测
SimpleQA thinking + 使用工具
97.10
1 / 43

编程与软件工程

共 3 项评测
LiveCodeBench thinking
74.10
21 / 98
SWE-bench Verified thinking + 使用工具
67.80
33 / 68
LiveCodeBench normal
55
63 / 98

数学推理

共 2 项评测
AIME2025 thinking
89.30
29 / 95
AIME2025 normal
58
73 / 95

AI Agent - 工具使用

共 2 项评测
Terminal-Bench thinking + 使用工具
37.70
14 / 35
Terminal-Bench normal + 使用工具
23
30 / 35

Agent能力评测

共 4 项评测
Aider-Polyglot thinking + 使用工具
74.50
7 / 22
τ²-Bench thinking + 使用工具
66.70
13 / 26
τ²-Bench - Telecom normal + 使用工具
34
16 / 17
τ²-Bench - Telecom thinking + 使用工具
34
16 / 17

指令跟随

共 1 项评测
IF Bench thinking
54.10
11 / 14

AI Agent - 信息收集

共 1 项评测
BrowseComp thinking + 使用工具
40.10
8 / 10

发布机构

DeepSeek-V3.2-Exp模型解读

概述

DeepSeek-V3.2-Exp 是 DeepSeek 在 2025-09-29 发布的 v3.2 实验版子型号,基于 V3.1-Terminus 持续训练并首次引入 DeepSeek Sparse Attention (DSA),旨在提升长上下文训练与推理效率,同时维持与 V3.1-Terminus 相当的输出质量。该模型已在 App、Web 与 API 同步上线,且 API 定价整体下调 50%+。

来源:发布新闻Models & PricingHugging Face 模型页

架构与规格

  • 核心机制:DSA(稀疏注意力),用于在长上下文场景降低算力与显存开销。
  • 上下文窗口:官方定价页标注 128K tokens。
  • 最大输出:非思考模式默认/上限 4K/8K;思考模式默认/上限 32K/64K。
  • 开源情况与许可:模型权重与仓库以 MIT License 发布;TileLang/CUDA 等关键算子开源。

能力与模态

  • 文本对话:支持 JSON 输出、前缀补全(Beta)、FIM(非思考)、函数调用(非思考)。
  • 多模态:该子型号官方定价/文档未提供图像、音频、视频或 embedding 的计费与接入说明。

性能与对比

官方公开信息显示,V3.2-Exp 在公开基准上的表现整体与 V3.1-Terminus 持平(用于验证 DSA 引入对质量的影响有限)。

访问与集成

  • API:deepseek-chat(非思考模式)与 deepseek-reasoner(思考模式)已升级对应到 V3.2-Exp。
  • 在线体验:官方 Web 聊天支持该子型号。
  • 开源权重:Hugging Face 提供权重与使用示例。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat