首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Stability AI 推出 StableCode,一款用于写代码的大型语言模型

IT之家 8 月 9 日消息,Stability AI 以其 Stable Diffusion 文本生成图像模型而闻名,但这并不是其感兴趣的唯一领域,该公司现在也开始涉足代码生成领域。今天,Stability AI 发布了其新的开放大型语言模型(LLM)StableCode ,该模型旨在帮助用户生成编程语言代码,基于 transformer 神经网络打造 。

StableCode 将提供三个不同级别:一个基础模型用于一般用途,一个指令模型,以及一个能够支持多达 16,000 个词元(token)的长上下文窗口模型。

StableCode 模型受益于开源 BigCode 项目的初始编程语言数据集,同时还经过了 Stability AI 的额外过滤和微调,StableCode 将首先支持 Python、Go、Java、JavaScript、C、markdown 和 C++ 等编程语言的开发。

训练任何 LLM 都依赖于数据,StableCode 的数据来自 BigCode 项目。IT之家注意到,HuggingFace 和 ServiceNow 在 5 月份也曾推出了基于 BigCode 的开放 StarCoder LLM。Stability AI 的首席研究科学家 Nathan Cooper 称,StableCode 的训练涉及了对 BigCode 数据进行大量的过滤和清理。

StableCode 的长上下文窗口版本具有 16,000 个词元的上下文窗口,Stability AI 声称比任何其他模型都要大,更长的上下文窗口使得可以使用更专业和复杂的代码生成提示,还意味着用户可以让 StableCode 查看一个包含多个文件的中等大小的代码库,以帮助理解和生成新代码。

StableCode 目前还处于早期阶段,现在官方的目标是看看开发者会如何接受和使用该模型。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OhcJq7M_J_lEmkbTiIQy5Rqw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券