St

StarCoder

编程大模型

StarCoder

发布时间: 2023-05-05

534
模型参数(Parameters)
155.0
最高上下文长度(Context Length)
2K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

2K tokens

最长输出结果
暂无数据
模型类型

编程大模型

发布时间

2023-05-05

模型预文件大小

64GB

开源和体验地址

代码开源状态
预训练权重开源
BigCode OpenRAIL-M v1 - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
暂无数据
接口价格
暂无公开的 API 定价信息。

StarCoder模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

StarCoder模型解读

💫 StarCoder是一种基于源代码和自然语言文本训练的语言模型(LM)。它的训练数据包含了80多种不同的编程语言,以及从GitHub问题和提交以及notebook中提取的文本数据。


StarCoder简介


StarCoder是基于GitHub数据训练的一个代码补全大模型。可以实现一个方法或者补全一行代码。模型训练的数据来自Stack v1.2,这是一个收集自GitHub的包含很多代码的数据集。StarCoder的context长度是8192个tokens。


需要注意的是,这个模型不是一个指令模型(instruction model),因此,如果你输入“写一个求平方根的方法”这样的文本是无法获得正确结果的。它所做的主要是代码补全。不过,你也可以使用Tech Assistant prompt来让它有类似的能力。这是一个可以让StarCoder变成类似助理的数据集。


StarCoder使用方法

StarCoder生成代码实例


# pip install -q transformers
                        
                        
                    
                

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat