DeepSeek V3.2-Exp

推理大模型

DeepSeek-V3.2-Exp

发布时间: 2025-09-29

1,295

GitHub Hugging Face 在线体验

模型参数（Parameters）

6710.0

最高上下文长度（Context Length）

128K

是否支持中文

不支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

64000 tokens

模型类型

推理大模型

发布时间

2025-09-29

模型预文件大小

1342GB

思考模式

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License - 免费商用授权

GitHub 源码

https://github.com/deepseek-ai/DeepSeek-V3.2-Exp

Hugging Face

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

在线体验

https://chat.deepseek.com

官方介绍与博客

官方论文

DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

接口价格

默认单位：$/100万 tokens；若计费单位不同，则以供应商公开的原始标注为准。

标准计费 Standard

模态	输入	输出
文本	0.28 美元 / 100万 tokens	0.42 美元 / 100万 tokens

缓存计费 Cache

模态	输入 Cache	输出 Cache
文本	0.028 美元 / 100万 tokens	--

DeepSeek V3.2-Exp模型在各大评测榜单的评分

综合评估

共 9 项评测

评测名称 / 模式

得分

排名/总模型数

MMLU Pro default

28 / 114

MMLU Pro default

28 / 114

GPQA Diamond default

79.90

78 / 158

GPQA Diamond default

78 / 158

LiveBench default

71.64

28 / 51

LiveBench default

66.64

28 / 51

HLE default

20.30

93 / 111

HLE default

19.80

93 / 111

HLE default

8.60

93 / 111

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

SimpleQA default

97.10

1 / 44

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

LiveCodeBench default

74.10

70 / 105

SWE-bench Verified default

67.80

52 / 90

LiveCodeBench default

70 / 105

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

AIME2025 default

89.30

84 / 106

AIME2025 default

84 / 106

AI Agent - 工具使用

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

Terminal-Bench default

37.70

30 / 35

Terminal-Bench default

30 / 35

Agent能力评测

共 4 项评测

评测名称 / 模式

得分

排名/总模型数

Aider-Polyglot default

74.50

7 / 26

τ²-Bench default

66.70

25 / 39

τ²-Bench - Telecom default

30 / 31

τ²-Bench - Telecom default

30 / 31

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

IF Bench default

54.10

22 / 25

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

BrowseComp default

40.10

29 / 33

发布机构

DeepSeek-AI

查看发布机构详情

DeepSeek-V3.2-Exp模型解读

概述

DeepSeek-V3.2-Exp 是 DeepSeek 在 2025-09-29 发布的 v3.2 实验版子型号，基于 V3.1-Terminus 持续训练并首次引入 DeepSeek Sparse Attention (DSA)，旨在提升长上下文训练与推理效率，同时维持与 V3.1-Terminus 相当的输出质量。该模型已在 App、Web 与 API 同步上线，且 API 定价整体下调 50%+。

来源：发布新闻；Models & Pricing；Hugging Face 模型页。

架构与规格

核心机制：DSA（稀疏注意力），用于在长上下文场景降低算力与显存开销。
上下文窗口：官方定价页标注 128K tokens。
最大输出：非思考模式默认/上限 4K/8K；思考模式默认/上限 32K/64K。
开源情况与许可：模型权重与仓库以 MIT License 发布；TileLang/CUDA 等关键算子开源。

能力与模态

文本对话：支持 JSON 输出、前缀补全（Beta）、FIM（非思考）、函数调用（非思考）。
多模态：该子型号官方定价/文档未提供图像、音频、视频或 embedding 的计费与接入说明。

性能与对比

官方公开信息显示，V3.2-Exp 在公开基准上的表现整体与 V3.1-Terminus 持平（用于验证 DSA 引入对质量的影响有限）。

访问与集成

API：deepseek-chat（非思考模式）与 deepseek-reasoner（思考模式）已升级对应到 V3.2-Exp。
在线体验：官方 Web 聊天支持该子型号。
开源权重：Hugging Face 提供权重与使用示例。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯