大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型代码编程能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/leaderboards/category/code

筛选条件

大模型排名数据表格

排名
模型
SWE-bench Verified
LiveCodeBench
HumanEval
参数(亿)
开源情况
1 Anthropic Logo
Claude Sonnet 4.5
parallel_thinking + 使用工具
82.00 未公布 未公布 未知 不开源
2 Anthropic Logo
Claude Opus 4.5
thinking
80.90 未公布 未公布 未知 不开源
3 Anthropic Logo
Claude Sonnet 4
parallel_thinking + 使用工具
80.20 未公布 未公布 未知 不开源
4 OpenAI Logo
GPT-5.2
thinking
80.00 未公布 未公布 未知 不开源
5 Anthropic Logo
Claude Opus 4.1
parallel_thinking + 使用工具
79.40 未公布 未公布 未知 不开源
6 Anthropic Logo
Claude Sonnet 4.5
thinking + 使用工具
77.20 未公布 未公布 未知 不开源
7 OpenAI Logo
GPT-5.1-Codex-Max
high + 使用工具
76.80 未公布 未公布 未知 不开源
8 OpenAI Logo
GPT-5.1
high
76.30 未公布 未公布 未知 不开源
9 Google Deep Mind Logo 76.20 92.00 未公布 未知 不开源
10 OpenAI Logo
o3-pro
high
75.00 未公布 未公布 未知 不开源
11 OpenAI Logo 74.50 未公布 未公布 未知 不开源
12 Anthropic Logo
Claude Opus 4.1
thinking + 使用工具
74.50 65.00 未公布 未知 不开源
13 Anthropic Logo
Claude Opus 4.1
thinking
74.50 未公布 未公布 未知 不开源
14 MiniMaxAI Logo
M2.1
thinking
74.00 未公布 未公布 2,300 免费商用授权
15 智谱AI Logo
GLM-4.7
thinking + 使用工具
73.80 未公布 未公布 3,580 免费商用授权
16 xAI Logo
Grok 4 Heavy
parallel_thinking + 使用工具
73.50 未公布 未公布 未知 不开源
17 Anthropic Logo
Haiku 4.5
thinking + 使用工具
73.30 未公布 未公布 未知 不开源
18 DeepSeek-AI Logo
DeepSeek V3.2
thinking + 使用工具
73.10 未公布 未公布 6,710 免费商用授权
19 OpenAI Logo
GPT-5
high
72.80 未公布 未公布 未知 不开源
20 Anthropic Logo
Claude Sonnet 4
thinking + 使用工具
72.70 未公布 未公布 未知 不开源
21 Anthropic Logo 72.50 56.60 未公布 未知 不开源
22 xAI Logo 72.00 未公布 未公布 未知 不开源
23 Moonshot AI Logo
Kimi K2 Thinking
thinking + 使用工具
71.30 未公布 未公布 10,400 免费商用授权
24 xAI Logo
Grok Code Fast 1
thinking
70.80 未公布 未公布 未知 不开源
25 OpenAI Logo
GPT-5.1 Codex
high + 使用工具
70.40 85.50 未公布 未知 不开源
26 Anthropic Logo 70.30 未公布 未公布 未知 不开源
27 阿里巴巴 Logo 69.60 57.50 未公布 未知 不开源
28 MiniMaxAI Logo
MiniMax M2
thinking + 使用工具
69.40 未公布 未公布 2,300 免费商用授权
29 Moonshot AI Logo 69.20 未公布 未公布 10,000 免费商用授权
30 Moonshot AI Logo
Kimi K2 0905
thinking + 使用工具
69.20 未公布 未公布 10,000 免费商用授权
31 OpenAI Logo
OpenAI o3
thinking
69.10 未公布 未公布 未知 不开源
32 Google Deep Mind Logo
Gemini 3.0 Flash
thinking
68.70 未公布 未公布 未知 不开源
33 DeepSeek-AI Logo 68.40 74.90 未公布 6,710 免费商用授权
34 OpenAI Logo
OpenAI o4 - mini
thinking
68.10 未公布 未公布 未知 不开源
35 智谱AI Logo 68.00 56.00 未公布 3,550 免费商用授权
36 智谱AI Logo
GLM-4.6
thinking + 使用工具
68.00 84.50 未公布 3,550 免费商用授权
37 DeepSeek-AI Logo
DeepSeek V3.2-Exp
thinking + 使用工具
67.80 未公布 未公布 6,710 免费商用授权
38 Google Deep Mind Logo
Gemini 2.5-Pro
thinking
67.20 未公布 未公布 未知 不开源
39 阿里巴巴 Logo 67.00 未公布 未公布 4,800 免费商用授权
40 DeepSeek-AI Logo 66.00 56.40 未公布 6,710 免费商用授权
41 Anthropic Logo 64.80 59.00 未公布 未知 不开源
42 智谱AI Logo
GLM-4.5
thinking
64.20 72.90 未公布 3,550 免费商用授权
43 Google Deep Mind Logo 63.80 70.40 未公布 未知 不开源
44 Google Deep Mind Logo 63.20 77.10 未公布 未知 不开源
45 MistralAI Logo 61.60 未公布 未公布 未知 不开源
46 Anthropic Logo 60.60 51.00 未公布 未知 不开源
47 OpenAI Logo
GPT OSS 120B
thinking
60.10 未公布 未公布 117 免费商用授权
48 智谱AI Logo
GLM-4.7-Flash
thinking
59.20 未公布 未公布 310 免费商用授权
49 xAI Logo
Grok 4
thinking
58.60 82.00 未公布 未知 不开源
50 DeepSeek-AI Logo
DeepSeek-R1-0528
thinking
57.60 73.30 未公布 6,710 免费商用授权
51 智谱AI Logo
GLM-4.5-Air
thinking
57.60 70.70 未公布 1,060 免费商用授权
52 MiniMaxAI Logo 56.00 65.00 未公布 4,560 免费商用授权
53 MiniMaxAI Logo 55.60 62.30 未公布 4,560 免费商用授权
54 OpenAI Logo 54.60 40.50 未公布 未知 不开源
55 Google Deep Mind Logo 54.00 未公布 未公布 未知 不开源
56 MistralAI Logo 53.60 未公布 未公布 240 免费商用授权
57 Moonshot AI Logo 51.80 53.70 未公布 10,000 免费商用授权
58 阿里巴巴 Logo 51.60 未公布 未公布 305 免费商用授权
59 Google Deep Mind Logo 50.00 41.10 未公布 未知 不开源
60 OpenAI Logo 49.30 69.50 97.60 未知 不开源
61 DeepSeek-AI Logo 49.20 65.90 未公布 6,710 免费商用授权
62 Anthropic Logo 49.00 38.70 93.70 未知 不开源
63 OpenAI Logo 48.90 71.00 未公布 未知 不开源
64 Google Deep Mind Logo
Gemini 2.5 Flash
thinking
48.90 55.40 未公布 未知 不开源
65 MistralAI Logo 46.80 未公布 未公布 240 免费商用授权
66 OpenAI Logo
OpenAI o3-mini
thinking
40.80 未公布 未公布 未知 不开源
67 DeepSeek-AI Logo 38.80 49.20 未公布 6,710 免费商用授权
68 OpenAI Logo 38.00 46.40 未公布 未知 不开源
69 阿里巴巴 Logo 34.40 70.70 未公布 2,350 免费商用授权
70 OpenAI Logo
GPT OSS 20B
thinking
34.00 未公布 未公布 210 免费商用授权
71 OpenAI Logo 31.00 35.10 90.00 未知 不开源
72 Google Deep Mind Logo 27.60 34.30 未公布 未知 不开源
73 OpenAI Logo 23.60 未公布 未公布 未知 不开源
74 阿里巴巴 Logo 22.00 未公布 未公布 305 免费商用授权
75 DeepMind Logo 21.40 29.10 未公布 未知 不开源
76 DeepSeek-AI Logo 未公布 74.10 未公布 6,710 免费商用授权
77 MiniMaxAI Logo
MiniMax M2
thinking
未公布 83.00 未公布 2,300 免费商用授权
78 阿里巴巴 Logo 未公布 65.70 未公布 320 免费商用授权
79 Moonshot AI Logo 未公布 65.90 未公布 未知 不开源
80 Anthropic Logo
Claude Sonnet 4
thinking
未公布 66.00 未公布 未知 不开源
81 StepFunAI Logo 未公布 67.10 未公布 3,210 免费商用授权
82 OpenAI Logo 未公布 75.80 未公布 未知 不开源
83 DeepSeek-AI Logo
DeepSeek-V3.1
thinking
未公布 74.80 未公布 6,710 免费商用授权
84 阿里巴巴 Logo 未公布 74.10 未公布 2,350 免费商用授权
85 阿里巴巴 Logo 未公布 74.10 未公布 305 免费商用授权
86 OpenAI Logo 未公布 67.40 未公布 未知 不开源
87 Moonshot AI Logo 未公布 73.80 未公布 未知 不开源
88 Anthropic Logo 未公布 71.00 未公布 未知 不开源
89 阿里巴巴 Logo
Qwen3-235B-A22B
thinking
未公布 70.70 未公布 2,350 免费商用授权
90 xAI Logo 未公布 70.60 未公布 未知 不开源
91 Google Deep Mind Logo 未公布 77.10 未公布 未知 不开源
92 华为 Logo 未公布 67.10 未公布 70 免费商用授权
93 智谱AI Logo 未公布 51.80 未公布 90 免费商用授权
94 Google Deep Mind Logo 未公布 24.60 未公布 120 免费商用授权
95 DeepMind Logo 未公布 28.90 未公布 未知 不开源
96 阿里巴巴 Logo 未公布 29.00 未公布 305 免费商用授权
97 Facebook AI研究实验室 Logo 未公布 32.80 未公布 1,090 免费商用授权
98 阿里巴巴 Logo 未公布 35.10 未公布 40 免费商用授权
99 OpenAI Logo 未公布 35.80 未公布 未知 不开源
100 百度 Logo 未公布 38.80 未公布 3,000 免费商用授权
101 百度 Logo 未公布 38.80 未公布 4,240 免费商用授权
102 阿里巴巴 Logo 未公布 43.20 未公布 305 免费商用授权
103 Facebook AI研究实验室 Logo 未公布 43.40 未公布 4,000 免费商用授权
104 Anthropic Logo 未公布 48.50 未公布 未知 不开源
105 Facebook AI研究实验室 Logo 未公布 49.40 未公布 20,000 免费商用授权
106 阿里巴巴 Logo 未公布 51.80 未公布 2,350 免费商用授权
107 阿里巴巴 Logo 未公布 65.60 未公布 未知 免费商用授权
108 DeepSeek-AI Logo 未公布 55.00 未公布 6,710 免费商用授权
109 OpenAI Logo
GPT-5-mini
thinking
未公布 55.00 未公布 未知 不开源
110 阿里巴巴 Logo 未公布 55.20 未公布 40 免费商用授权
111 MistralAI Logo 未公布 55.84 未公布 240 免费商用授权
112 阿里巴巴 Logo 未公布 56.60 未公布 800 免费商用授权
113 Tencent ARC Logo 未公布 57.00 未公布 70 免费商用授权
114 阿里巴巴 Logo
Qwen3-8B
thinking
未公布 57.50 未公布 80 免费商用授权
115 MistralAI Logo 未公布 59.36 未公布 未知 不开源
116 华为 Logo 未公布 59.60 未公布 719 免费商用授权
117 阿里巴巴 Logo 未公布 61.80 未公布 80 免费商用授权
118 Anthropic Logo
Haiku 4.5
thinking
未公布 62.00 未公布 未知 不开源
119 腾讯AI实验室 Logo 未公布 63.90 未公布 800 免费商用授权
120 腾讯AI实验室 Logo 未公布 64.90 未公布 未知 不开源
121 阿里巴巴 Logo 未公布 未公布 73.20 未知 不开源
122 xAI Logo 未公布 未公布 88.40 2,690 免费商用授权
123 Anthropic Logo 未公布 未公布 88.10 未知 不开源
124 Google Deep Mind Logo 未公布 29.70 87.80 270 免费商用授权
125 OpenAI Logo 未公布 未公布 87.20 未知 不开源
126 MistralAI Logo 未公布 37.90 86.60 未知 不开源
127 Anthropic Logo 未公布 未公布 84.90 未知 不开源
128 MistralAI Logo 未公布 31.50 81.10 220 不可以商用
129 Facebook AI研究实验室 Logo 未公布 33.30 80.50 700 免费商用授权
130 Microsoft Azure Logo 未公布 未公布 74.40 38 免费商用授权
131 xAI Logo 未公布 未公布 74.10 未知 不开源
132 Facebook AI研究实验室 Logo 未公布 33.30 88.40 700 免费商用授权
133 Facebook AI研究实验室 Logo 未公布 未公布 66.50 80 免费商用授权
134 CohereAI Logo 未公布 未公布 62.20 320 不可以商用
135 阿里巴巴 Logo 未公布 未公布 59.10 727 免费商用授权
136 阿里巴巴 Logo 未公布 未公布 57.90 70 免费商用授权
137 Moonshot AI Logo 未公布 未公布 48.10 160 免费商用授权
138 阿里巴巴 Logo 未公布 未公布 42.10 30 免费商用授权
139 Google Research Logo 未公布 未公布 37.80 90 免费商用授权
140 Facebook AI研究实验室 Logo 未公布 未公布 33.50 80 免费商用授权
141 MistralAI Logo 未公布 未公布 29.30 70 免费商用授权
142 Facebook AI研究实验室 Logo 未公布 未公布 28.00 32 免费商用授权
143 Google Deep Mind Logo
Gemini 2.5 Deep Think
deeper_thinking
未公布 87.60 未公布 未知 不开源
144 DeepSeek-AI Logo 未公布 80.00 未公布 6,710 免费商用授权
145 xAI Logo
Grok 4 Fast
thinking
未公布 80.00 未公布 未知 不开源
146 Google Deep Mind Logo 未公布 80.40 未公布 未知 不开源
147 xAI Logo
Grok 4.1 Fast
thinking
未公布 82.00 未公布 未知 不开源
148 智谱AI Logo
GLM-4.6
thinking
未公布 82.80 未公布 3,550 免费商用授权
149 阿里巴巴 Logo 未公布 未公布 19.00 325 免费商用授权
150 Moonshot AI Logo
Kimi K2 Thinking
thinking
未公布 83.10 未公布 10,400 免费商用授权
151 DeepSeek-AI Logo
DeepSeek V3.2
thinking
未公布 83.30 未公布 6,710 免费商用授权
152 智谱AI Logo
GLM-4.7
thinking
未公布 84.90 未公布 3,580 免费商用授权
153 Anthropic Logo
Claude Opus 4.5
thinking + 使用工具
未公布 87.00 未公布 未知 不开源
154 xAI Logo 未公布 79.40 未公布 未知 不开源
155 OpenAI Logo 未公布 52.00 92.40 未知 不开源
156 Anthropic Logo 未公布 未公布 92.00 未知 不开源
157 腾讯AI实验室 Logo 未公布 32.00 91.00 未知 不开源
158 OpenAI Logo 未公布 未公布 90.20 未知 不开源
159 Google Deep Mind Logo 未公布 未公布 89.00 未知 不开源
160 Facebook AI研究实验室 Logo 未公布 30.20 89.00 4,050 免费商用授权
161 亚马逊 Logo 未公布 未公布 89.00 未知 不开源
162 DeepSeek-AI Logo 未公布 34.60 89.00 6,810 免费商用授权
163 MistralAI Logo 未公布 未公布 88.41 240 免费商用授权
164 阿里巴巴 Logo 未公布 51.20 88.40 320 免费商用授权
SWE-bench Verified (编程与软件工程) 82.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.90
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 79.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 77.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.20
LiveCodeBench (编程与软件工程) 92.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 73.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 3,580
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 73.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 72.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.50
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 71.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.40
LiveCodeBench (编程与软件工程) 85.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.60
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.40
LiveCodeBench (编程与软件工程) 74.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 56.00
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 84.50
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 67.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 4,800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 66.00
LiveCodeBench (编程与软件工程) 56.40
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 64.80
LiveCodeBench (编程与软件工程) 59.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 64.20
LiveCodeBench (编程与软件工程) 72.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 63.80
LiveCodeBench (编程与软件工程) 70.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 63.20
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 61.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.60
LiveCodeBench (编程与软件工程) 51.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 59.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 310
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 58.60
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 73.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 1,060
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 56.00
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 55.60
LiveCodeBench (编程与软件工程) 62.30
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 54.60
LiveCodeBench (编程与软件工程) 40.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 54.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 53.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.80
LiveCodeBench (编程与软件工程) 53.70
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 50.00
LiveCodeBench (编程与软件工程) 41.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.30
LiveCodeBench (编程与软件工程) 69.50
HumanEval (编程与软件工程) 97.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.20
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 49.00
LiveCodeBench (编程与软件工程) 38.70
HumanEval (编程与软件工程) 93.70
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 55.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 46.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 40.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 38.80
LiveCodeBench (编程与软件工程) 49.20
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 38.00
LiveCodeBench (编程与软件工程) 46.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 34.40
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 34.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 31.00
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 90.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 27.60
LiveCodeBench (编程与软件工程) 34.30
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 23.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 22.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 21.40
LiveCodeBench (编程与软件工程) 29.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.00
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.70
HumanEval (编程与软件工程) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 66.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 3,210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 75.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.80
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 73.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 24.60
HumanEval (编程与软件工程) 未公布
参数(亿) 120
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 28.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.00
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.80
HumanEval (编程与软件工程) 未公布
参数(亿) 1,090
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 4,240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.20
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.40
HumanEval (编程与软件工程) 未公布
参数(亿) 4,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 48.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 49.40
HumanEval (编程与软件工程) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.20
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.84
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.00
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.36
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.60
HumanEval (编程与软件工程) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 61.80
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 62.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 63.90
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 64.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 73.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.40
参数(亿) 2,690
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.70
HumanEval (编程与软件工程) 87.80
参数(亿) 270
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 87.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 37.90
HumanEval (编程与软件工程) 86.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 84.90
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 31.50
HumanEval (编程与软件工程) 81.10
参数(亿) 220
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 80.50
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.40
参数(亿) 38
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 88.40
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 66.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 62.20
参数(亿) 320
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 59.10
参数(亿) 727
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 57.90
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 48.10
参数(亿) 160
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 42.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 37.80
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 33.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 29.30
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 28.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 19.00
参数(亿) 325
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.10
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 84.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,580
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 79.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 52.00
HumanEval (编程与软件工程) 92.40
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 92.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.00
HumanEval (编程与软件工程) 91.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 90.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 30.20
HumanEval (编程与软件工程) 89.00
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 34.60
HumanEval (编程与软件工程) 89.00
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.41
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.20
HumanEval (编程与软件工程) 88.40
参数(亿) 320
开源情况 免费商用授权
查看模型详情