首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AMD开源3B参数语言模型Instella,性能直追Llama与Qwen

AMD近日在其官方平台上宣布了一项重大举措,正式向开源社区推出了Radeon RX 9070系列的Linux驱动程序。这一行动不仅彰显了AMD对于开源生态的支持,同时也为Linux用户提供了更为丰富的硬件选择。

不仅如此,AMD还带来了一个令人瞩目的开源项目——Instella。Instella是一个拥有30亿参数的完全开源语言模型,代表了AMD在人工智能领域的最新探索成果。AMD强调,Instella是在其Instinct MI300X GPU上进行训练的,性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等模型相当,显示出强大的竞争力。

据AMD介绍,Instella模型是从头开始在Instinct MI300X硬件上训练的,其开源的特性意味着模型权重、训练超参数、数据集和代码都将完全公开。这一举措旨在促进人工智能社区内的创新与合作,鼓励开发者们基于Instella进行二次开发和优化。

AMD表示,Instella的开源发布是AMD对开源文化承诺的又一体现。通过开放Instella的源代码和数据集,AMD希望激发更多创新火花,推动人工智能技术的不断前行。同时,这也为开发者们提供了一个学习和研究先进语言模型的宝贵机会。

对于对Instella感兴趣的开发者们,AMD提供了详细的开源地址。通过访问(链接已移除),开发者们可以下载Instella的源代码、数据集和训练脚本等相关资源,开始他们的探索之旅。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OdXxzQKLSdZiuToQyINwQRmQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券