大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型代码编程能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/leaderboards/category/code

筛选条件

大模型排名数据表格

排名
模型
SWE-bench Verified
LiveCodeBench
HumanEval
参数(亿)
开源情况
1 Anthropic Logo 82.00 71.00 未公布 未知 不开源
2 Anthropic Logo
Claude Sonnet 5
default
82.00 未公布 未公布 未知 不开源
3 Anthropic Logo
Claude Opus 4.5
default
80.90 87.00 未公布 未知 不开源
4 Anthropic Logo
Claude Opus 4.6
深度思考模式(工具)
80.80 未公布 未公布 未知 不开源
5 Google Deep Mind Logo
Gemini 3.1 Pro Preview
思考模式 High(工具)
80.60 2887.00 未公布 未知 不开源
6 Anthropic Logo
Claude Sonnet 4
default
80.20 66.00 未公布 未知 不开源
7 MiniMaxAI Logo
MiniMax M2.5
default
80.20 未公布 未公布 2,290 免费商用授权
8 OpenAI Logo
GPT-5.2
深度思考模式(工具)
80.00 未公布 未公布 未知 不开源
9 Anthropic Logo 79.60 未公布 未公布 未知 不开源
10 Anthropic Logo
Claude Opus 4.1
default
79.40 65.00 未公布 未知 不开源
11 智谱AI Logo
GLM-5
default
77.80 未公布 未公布 7,440 免费商用授权
12 Moonshot AI Logo
Kimi K2.5
default
76.80 85.00 未公布 10,000 免费商用授权
13 OpenAI Logo 76.80 未公布 未公布 未知 不开源
14 阿里巴巴 Logo
Qwen3.5-397B-A17B
思考模式(工具)
76.40 未公布 未公布 397 免费商用授权
15 阿里巴巴 Logo 76.40 83.60 未公布 397 免费商用授权
16 OpenAI Logo
GPT-5.1
思考模式 High(工具)
76.30 未公布 未公布 未知 不开源
17 OpenAI Logo
GPT-5.1
default
76.30 未公布 未公布 未知 不开源
18 Google Deep Mind Logo 76.20 92.00 未公布 未知 不开源
19 阿里巴巴 Logo 75.30 85.90 未公布 10,000 不开源
20 OpenAI Logo
o3-pro
default
75.00 未公布 未公布 未知 不开源
21 MiniMaxAI Logo
M2.1
default
74.80 未公布 未公布 2,300 免费商用授权
22 OpenAI Logo
GPT-5 Codex
default
74.50 未公布 未公布 未知 不开源
23 StepFunAI Logo
Step 3.5 Flash
default
74.40 86.40 未公布 1,960 免费商用授权
24 智谱AI Logo
GLM-4.7
default
73.80 84.90 未公布 3,580 免费商用授权
25 xAI Logo
Grok 4 Heavy
default
73.50 未公布 未公布 未知 不开源
26 Anthropic Logo
Haiku 4.5
default
73.30 62.00 未公布 未知 不开源
27 DeepSeek-AI Logo
DeepSeek V3.2
default
73.10 83.30 未公布 6,710 免费商用授权
28 OpenAI Logo
GPT-5
default
72.80 未公布 未公布 未知 不开源
29 Anthropic Logo
Claude Opus 4
default
72.50 56.60 未公布 未知 不开源
30 阿里巴巴 Logo
Qwen3.5-27B
思考模式(无工具)
72.40 未公布 未公布 270 免费商用授权
31 xAI Logo
Grok 4 Code
default
72.00 未公布 未公布 未知 不开源
32 Moonshot AI Logo 71.30 83.10 未公布 10,400 免费商用授权
33 xAI Logo 70.80 未公布 未公布 未知 不开源
34 阿里巴巴 Logo 70.60 未公布 未公布 80 免费商用授权
35 OpenAI Logo
GPT-5.1 Codex
default
70.40 85.50 未公布 未知 不开源
36 Anthropic Logo 70.30 未公布 未公布 未知 不开源
37 阿里巴巴 Logo 69.60 57.50 未公布 未知 不开源
38 MiniMaxAI Logo
MiniMax M2
default
69.40 83.00 未公布 2,300 免费商用授权
39 Moonshot AI Logo
Kimi K2 0905
default
69.20 未公布 未公布 10,000 免费商用授权
40 OpenAI Logo
OpenAI o3
default
69.10 75.80 未公布 未知 不开源
41 Google Deep Mind Logo 68.70 未公布 未公布 未知 不开源
42 DeepSeek-AI Logo 68.40 80.00 未公布 6,710 免费商用授权
43 OpenAI Logo 68.10 未公布 未公布 未知 不开源
44 智谱AI Logo
GLM-4.6
default
68.00 84.50 未公布 3,550 免费商用授权
45 DeepSeek-AI Logo 67.80 74.10 未公布 6,710 免费商用授权
46 Google Deep Mind Logo
Gemini 2.5-Pro
default
67.20 77.10 未公布 未知 不开源
47 阿里巴巴 Logo 67.00 未公布 未公布 4,800 免费商用授权
48 DeepSeek-AI Logo
DeepSeek-V3.1
default
66.00 74.80 未公布 6,710 免费商用授权
49 智谱AI Logo
GLM-4.5
default
64.20 72.90 未公布 3,550 免费商用授权
50 Google Deep Mind Logo 63.80 70.40 未公布 未知 不开源
51 Google Deep Mind Logo 63.20 77.10 未公布 未知 不开源
52 MistralAI Logo
Devstral Medium
default
61.60 未公布 未公布 未知 不开源
53 OpenAI Logo
GPT OSS 120B
default
60.10 未公布 未公布 117 免费商用授权
54 智谱AI Logo
GLM-4.7-Flash
default
59.20 未公布 未公布 310 免费商用授权
55 xAI Logo
Grok 4
default
58.60 82.00 未公布 未知 不开源
56 DeepSeek-AI Logo 57.60 73.30 未公布 6,710 免费商用授权
57 智谱AI Logo
GLM-4.5-Air
default
57.60 70.70 未公布 1,060 免费商用授权
58 MiniMaxAI Logo
MiniMax-M1-80k
default
56.00 65.00 未公布 4,560 免费商用授权
59 MiniMaxAI Logo
MiniMax-M1-40k
default
55.60 62.30 未公布 4,560 免费商用授权
60 OpenAI Logo
GPT-4.1
default
54.60 40.50 未公布 未知 不开源
61 Google Deep Mind Logo 54.00 未公布 未公布 未知 不开源
62 MistralAI Logo 53.60 未公布 未公布 240 免费商用授权
63 Moonshot AI Logo
Kimi K2
default
51.80 53.70 未公布 10,000 免费商用授权
64 阿里巴巴 Logo 51.60 未公布 未公布 305 免费商用授权
65 Google Deep Mind Logo 50.00 55.40 未公布 未知 不开源
66 OpenAI Logo 49.30 69.50 97.60 未知 不开源
67 DeepSeek-AI Logo
DeepSeek-R1
default
49.20 65.90 未公布 6,710 免费商用授权
68 Anthropic Logo 49.00 38.70 93.70 未知 不开源
69 OpenAI Logo
OpenAI o1
default
48.90 71.00 未公布 未知 不开源
70 MistralAI Logo 46.80 未公布 未公布 240 免费商用授权
71 OpenAI Logo
OpenAI o3-mini
default
40.80 未公布 未公布 未知 不开源
72 DeepSeek-AI Logo 38.80 49.20 未公布 6,710 免费商用授权
73 OpenAI Logo
GPT-4.5
default
38.00 46.40 未公布 未知 不开源
74 阿里巴巴 Logo
Qwen3-235B-A22B
default
34.40 70.70 未公布 2,350 免费商用授权
75 OpenAI Logo
GPT OSS 20B
default
34.00 未公布 未公布 210 免费商用授权
76 OpenAI Logo
GPT-4o
default
31.00 35.10 90.00 未知 不开源
77 Google Deep Mind Logo 27.60 34.30 未公布 未知 不开源
78 OpenAI Logo
GPT-4.1 mini
default
23.60 未公布 未公布 未知 不开源
79 阿里巴巴 Logo 22.00 43.20 未公布 305 免费商用授权
80 DeepMind Logo 21.40 29.10 未公布 未知 不开源
81 xAI Logo
Grok 3
default
未公布 70.60 未公布 未知 不开源
82 Moonshot AI Logo
Kimi-k1.6-IOI
default
未公布 65.90 未公布 未知 不开源
83 OpenAI Logo 未公布 67.40 未公布 未知 不开源
84 华为 Logo
Pangu Embedded
default
未公布 67.10 未公布 70 免费商用授权
85 StepFunAI Logo
Step3
default
未公布 67.10 未公布 3,210 免费商用授权
86 阿里巴巴 Logo
Qwen3-32B
default
未公布 65.70 未公布 320 免费商用授权
87 Moonshot AI Logo 未公布 73.80 未公布 未知 不开源
88 阿里巴巴 Logo 未公布 74.10 未公布 305 免费商用授权
89 阿里巴巴 Logo 未公布 74.10 未公布 2,350 免费商用授权
90 xAI Logo 未公布 79.40 未公布 未知 不开源
91 xAI Logo
Grok 4 Fast
default
未公布 80.00 未公布 未知 不开源
92 Google Deep Mind Logo 未公布 80.40 未公布 未知 不开源
93 智谱AI Logo
GLM-4-9B-Chat
default
未公布 51.80 未公布 90 免费商用授权
94 阿里巴巴 Logo
QwQ-32B
default
未公布 未公布 19.00 325 免费商用授权
95 DeepMind Logo 未公布 28.90 未公布 未知 不开源
96 阿里巴巴 Logo
Qwen3-30B-A3B
default
未公布 29.00 未公布 305 免费商用授权
97 Facebook AI研究实验室 Logo 未公布 32.80 未公布 1,090 免费商用授权
98 阿里巴巴 Logo
Qwen3-4B-2507
default
未公布 35.10 未公布 40 免费商用授权
99 OpenAI Logo 未公布 35.80 未公布 未知 不开源
100 百度 Logo 未公布 38.80 未公布 3,000 免费商用授权
101 百度 Logo 未公布 38.80 未公布 4,240 免费商用授权
102 Facebook AI研究实验室 Logo 未公布 43.40 未公布 4,000 免费商用授权
103 Facebook AI研究实验室 Logo 未公布 49.40 未公布 20,000 免费商用授权
104 阿里巴巴 Logo 未公布 51.80 未公布 2,350 免费商用授权
105 Google Deep Mind Logo 未公布 24.60 未公布 120 免费商用授权
106 OpenAI Logo
GPT-5-mini
default
未公布 55.00 未公布 未知 不开源
107 阿里巴巴 Logo 未公布 55.20 未公布 40 免费商用授权
108 MistralAI Logo 未公布 55.84 未公布 240 免费商用授权
109 阿里巴巴 Logo
Qwen3-Next
default
未公布 56.60 未公布 800 免费商用授权
110 Tencent ARC Logo
Hunyuan-7B
default
未公布 57.00 未公布 70 免费商用授权
111 MistralAI Logo 未公布 59.36 未公布 未知 不开源
112 华为 Logo
Pangu Pro MoE
default
未公布 59.60 未公布 719 免费商用授权
113 阿里巴巴 Logo
Qwen3-8B
default
未公布 61.80 未公布 80 免费商用授权
114 腾讯AI实验室 Logo 未公布 63.90 未公布 800 免费商用授权
115 腾讯AI实验室 Logo
Hunyuan-T1
default
未公布 64.90 未公布 未知 不开源
116 阿里巴巴 Logo
QwQ-Max-Preview
default
未公布 65.60 未公布 未知 免费商用授权
117 CohereAI Logo 未公布 未公布 62.20 320 不可以商用
118 MistralAI Logo
Codestral 25.01
default
未公布 37.90 86.60 未知 不开源
119 Anthropic Logo
Claude3-Opus
default
未公布 未公布 84.90 未知 不开源
120 MistralAI Logo
Codestral
default
未公布 31.50 81.10 220 不可以商用
121 Facebook AI研究实验室 Logo 未公布 33.30 80.50 700 免费商用授权
122 Microsoft Azure Logo 未公布 未公布 74.40 38 免费商用授权
123 xAI Logo
Grok-1.5
default
未公布 未公布 74.10 未知 不开源
124 阿里巴巴 Logo
Qwen2.5-Max
default
未公布 未公布 73.20 未知 不开源
125 Facebook AI研究实验室 Logo 未公布 未公布 66.50 80 免费商用授权
126 OpenAI Logo
GPT-4o mini
default
未公布 未公布 87.20 未知 不开源
127 阿里巴巴 Logo
Qwen2.5-72B
default
未公布 未公布 59.10 727 免费商用授权
128 阿里巴巴 Logo
Qwen2.5-7B
default
未公布 未公布 57.90 70 免费商用授权
129 Moonshot AI Logo 未公布 未公布 48.10 160 免费商用授权
130 阿里巴巴 Logo
Qwen2.5-3B
default
未公布 未公布 42.10 30 免费商用授权
131 Google Research Logo
Gemma 2 - 9B
default
未公布 未公布 37.80 90 免费商用授权
132 Facebook AI研究实验室 Logo
Llama3.1-8B
default
未公布 未公布 33.50 80 免费商用授权
133 MistralAI Logo 未公布 未公布 29.30 70 免费商用授权
134 Facebook AI研究实验室 Logo
Llama-3.2-3B
default
未公布 未公布 28.00 32 免费商用授权
135 亚马逊 Logo
Amazon Nova Pro
default
未公布 未公布 89.00 未知 不开源
136 阿里巴巴 Logo
Qwen3.5-397B-A17B
思考模式(无工具)
未公布 83.60 未公布 397 免费商用授权
137 Google Deep Mind Logo 未公布 87.60 未公布 未知 不开源
138 OpenAI Logo
OpenAI o1-mini
default
未公布 52.00 92.40 未知 不开源
139 Anthropic Logo 未公布 未公布 92.00 未知 不开源
140 腾讯AI实验室 Logo
Hunyuan-TurboS
default
未公布 32.00 91.00 未知 不开源
141 OpenAI Logo 未公布 未公布 90.20 未知 不开源
142 Google Deep Mind Logo
Gemini 1.5 Pro
default
未公布 未公布 89.00 未知 不开源
143 Facebook AI研究实验室 Logo 未公布 30.20 89.00 4,050 免费商用授权
144 xAI Logo
Grok 4.1 Fast
default
未公布 82.00 未公布 未知 不开源
145 DeepSeek-AI Logo
DeepSeek-V3
default
未公布 34.60 89.00 6,810 免费商用授权
146 MistralAI Logo 未公布 未公布 88.41 240 免费商用授权
147 阿里巴巴 Logo
Qwen2.5-32B
default
未公布 51.20 88.40 320 免费商用授权
148 Facebook AI研究实验室 Logo 未公布 33.30 88.40 700 免费商用授权
149 xAI Logo
Grok 2
default
未公布 未公布 88.40 2,690 免费商用授权
150 Anthropic Logo 未公布 未公布 88.10 未知 不开源
151 Google Deep Mind Logo 未公布 29.70 87.80 270 免费商用授权
SWE-bench Verified (编程与软件工程) 82.00
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 82.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.90
LiveCodeBench (编程与软件工程) 87.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.60
LiveCodeBench (编程与软件工程) 2887.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.20
LiveCodeBench (编程与软件工程) 66.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,290
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 80.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 79.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 79.40
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 77.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 7,440
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 85.00
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 397
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 76.40
LiveCodeBench (编程与软件工程) 83.60
HumanEval (编程与软件工程) 未公布
参数(亿) 397
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 76.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.20
LiveCodeBench (编程与软件工程) 92.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.30
LiveCodeBench (编程与软件工程) 85.90
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.40
LiveCodeBench (编程与软件工程) 86.40
HumanEval (编程与软件工程) 未公布
参数(亿) 1,960
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 73.80
LiveCodeBench (编程与软件工程) 84.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,580
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 73.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.30
LiveCodeBench (编程与软件工程) 62.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.10
LiveCodeBench (编程与软件工程) 83.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 72.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.50
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 270
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 72.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 71.30
LiveCodeBench (编程与软件工程) 83.10
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.40
LiveCodeBench (编程与软件工程) 85.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.60
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.40
LiveCodeBench (编程与软件工程) 83.00
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.10
LiveCodeBench (编程与软件工程) 75.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.40
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 84.50
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.80
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.20
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 67.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 4,800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 66.00
LiveCodeBench (编程与软件工程) 74.80
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 64.20
LiveCodeBench (编程与软件工程) 72.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 63.80
LiveCodeBench (编程与软件工程) 70.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 63.20
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 61.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 59.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 310
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 58.60
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 73.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 1,060
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 56.00
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 55.60
LiveCodeBench (编程与软件工程) 62.30
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 54.60
LiveCodeBench (编程与软件工程) 40.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 54.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 53.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.80
LiveCodeBench (编程与软件工程) 53.70
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 50.00
LiveCodeBench (编程与软件工程) 55.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.30
LiveCodeBench (编程与软件工程) 69.50
HumanEval (编程与软件工程) 97.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.20
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 49.00
LiveCodeBench (编程与软件工程) 38.70
HumanEval (编程与软件工程) 93.70
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 46.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 40.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 38.80
LiveCodeBench (编程与软件工程) 49.20
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 38.00
LiveCodeBench (编程与软件工程) 46.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 34.40
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 34.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 31.00
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 90.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 27.60
LiveCodeBench (编程与软件工程) 34.30
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 23.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 22.00
LiveCodeBench (编程与软件工程) 43.20
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 21.40
LiveCodeBench (编程与软件工程) 29.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 3,210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.70
HumanEval (编程与软件工程) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 73.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 79.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 19.00
参数(亿) 325
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 28.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.00
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.80
HumanEval (编程与软件工程) 未公布
参数(亿) 1,090
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 4,240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.40
HumanEval (编程与软件工程) 未公布
参数(亿) 4,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 49.40
HumanEval (编程与软件工程) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 24.60
HumanEval (编程与软件工程) 未公布
参数(亿) 120
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.20
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.84
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.00
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.36
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.60
HumanEval (编程与软件工程) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 61.80
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 63.90
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 64.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 62.20
参数(亿) 320
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 37.90
HumanEval (编程与软件工程) 86.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 84.90
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 31.50
HumanEval (编程与软件工程) 81.10
参数(亿) 220
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 80.50
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.40
参数(亿) 38
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 73.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 66.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 87.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 59.10
参数(亿) 727
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 57.90
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 48.10
参数(亿) 160
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 42.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 37.80
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 33.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 29.30
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 28.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.60
HumanEval (编程与软件工程) 未公布
参数(亿) 397
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 52.00
HumanEval (编程与软件工程) 92.40
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 92.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.00
HumanEval (编程与软件工程) 91.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 90.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 30.20
HumanEval (编程与软件工程) 89.00
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 34.60
HumanEval (编程与软件工程) 89.00
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.41
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.20
HumanEval (编程与软件工程) 88.40
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 88.40
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.40
参数(亿) 2,690
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.70
HumanEval (编程与软件工程) 87.80
参数(亿) 270
开源情况 免费商用授权
查看模型详情