De

DeepSeek-V3-0324

聊天大模型

DeepSeek-V3-0324

发布时间: 2025-03-24

948
模型参数(Parameters)
6710.0
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

128K tokens

最长输出结果
暂无数据
模型类型

聊天大模型

发布时间

2025-03-24

模型预文件大小

1442GB

推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
MIT License - 免费商用授权
GitHub 源码
Hugging Face
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 0.27 美元/100万 tokens 1.1 美元/100万 tokens

DeepSeek-V3-0324模型在各大评测榜单的评分

综合评估

共 6 项评测
MMLU normal
86.50
24 / 59
MMLU Pro normal
81.20
34 / 107
GPQA Diamond normal
68.40
77 / 135
GPQA normal
68.40
1 / 13
ARC-AGI normal
9
30 / 34
HLE normal
5.20
65 / 72

数学推理

共 7 项评测
GSM8K normal
96.30
3 / 24
MATH-500 normal
94
27 / 42
AIME 2024 normal
59.40
44 / 62
AIME2025 normal
47.70
78 / 95
4.30
15 / 16
IMO 2024 normal
1.70
9 / 10
IMO 2025 normal
1.70
9 / 9

阅读理解

共 1 项评测
DROP normal
89.70
3 / 6

常识问答

共 1 项评测
SimpleQA normal
27.20
24 / 43

编程与软件工程

共 2 项评测
LiveCodeBench normal
49.20
72 / 98
38.80
62 / 68

写作和创作

共 1 项评测
81.60
15 / 22

AI Agent - 工具使用

共 1 项评测
13.30
34 / 35

常识推理

共 1 项评测
Simple Bench normal
27.20
20 / 25

Agent能力评测

共 2 项评测
55.10
18 / 22
τ²-Bench normal + 使用工具
38.80
22 / 26

发布机构

DeepSeek-V3-0324模型解读

DeepSeek-AI开源的DeepSeekV3更新版本,版本号是0324,是2025年3月24日上传到HuggingFace上并以MIT协议开源。


根据模型提供的配置信息,DeepSeekV3-0324依然是MoE大模型,包含256个路由专家和1个共享专家,每个token使用8个专家推理。DeepSeekV3-0324通过RoPE可以扩展到最高163840上下文长度(160K)。模型词汇表大小是129280个。与DeepSeekV3相比,这些参数都没有变化,这意味着大概率是原有模型继续训练或者后训练的结果~


集成 LoRA 机制,支持轻量级微调。


目前暂无其它信息披露。



2025年3月25日,官方更新了更多的升级内容。总结如下:

DeepSeekV3-0324模型的升级很多

尽管模型架构等技术方面没有变化,但是相比较DeepSeek V3,DeepSeek V3-0324升级却很多,核心是推理能力显著增强。主要总结如下:

前端开发能力优化

针对开发者关心的代码生成质量方面,DeepSeekV3-0324的能力显著增强,主要包括:

  • 生成代码的可执行性明显改善
  • 网页和游戏前端界面的视觉美观度提升
  • 更符合现代Web开发实践要求

在第二点中,已经有多人一句话生成了800行前端网页,很美观。如下图所示:



内容生成质量提升

在官方的介绍中,DeepSeek V3-0324在文本生成质量方面也有明显提示,看介绍应该是用了R1生成的结果做了后训练:

  • 严格对齐R1写作风格标准
  • 中长篇内容的结构完整性和内容深度增强
  • 文学性和专业性表达更加自然流畅

此外,在多轮对话和交互方面也有提升:

  • 多轮对话的上下文连贯性改善
  • 支持更精准的交互式内容重写
  • 翻译质量和正式信函写作能力提升
中文搜索增强

为了支持更好的联网生成效果,DeepSeek V3-0324在报告类请求的分析深度和输出细节方面也有增强,具体来说有如下2点提升:

  1. 搜索结果整合能力优化
  2. 支持更复杂的商业分析场景
函数调用改进

最后,DeepSeek V3-0324在函数调用方面也有了优化,主要修复了此前V3版本中的函数调用准确性问题,这意味着在构建AI Agent应用中,DeepSeek V3-0324可能会有更好的效果,具体包含:

  • API响应稳定性和可靠性提升
  • 复杂参数处理能力增强


DeepSeek V3-0324的评测结果

DeepSeek-V3-0324在多个权威基准测试中展现出突破性进步,相比较DeepSeek V3,DeepSeek V3-0324在多个评测指标中都有显著提升:

  • MMLU-Pro:从75.9提升至81.2(+5.3)
  • GPQA:从59.1跃升至68.4(+9.3)
  • AIME:实现最大幅度提升,从39.6飙升至59.4(+19.8)
  • LiveCodeBench:从39.2进步到49.2(+10.0)

而根据DataLearnerAI的大模型官方评测排行榜,以MMLU Pro这种高难度综合知识评测为例,DeepSeek V3-0324已经是仅次于GPT-4.5的非推理大模型。

数据来源: https://www.datalearner.com/ai-models/ai-benchmarks-tests/benchmarks-for-all 


甚至,在AIME2024的评测中,DeepSeekV3-0324甚至超过了Grok3,成为仅次于DeepSeek-R1的模型。


数据来源DataLearnerAI大模型对比评测工具: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,32,36,37,40&modelInputString=543,515,488,492,496,508 

而在LiveCodeBench的编程方面也是非常强悍!


关于DeepSeek V3-0324更多的介绍参考DataLearner博客: https://www.datalearner.com/blog/1051742900777784 

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat