首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta发布全新大型语言模型LLaMA:比OpenAI的GPT3还要好

Meta首席执行官扎克伯格在Instagram上说,LLaMA可以帮助研究人员在很多复杂的任务上取得进步,比如生成文本、对话、总结文章、证明数学定理或预测蛋白质结构等。

Meta官网上有一篇文章介绍了LLaMA。LLaMA有4种不同大小的模型,分别是70亿、130亿、330亿和650亿参数。其中最小的LLaMA7B也用了超过1万亿个tokens来训练。Meta说,在很多基准测试中,只有十分之一参数的LLaMA-13B比OpenAI的GPT3(175B)还要好。GPT3是ChatGPT所用的GPT3.5的前身。LLaMa-65B也可以和业界最好的Chinchilla-70B和PaLM-540B比拼。

去年5月,Meta曾发布过一个叫OPT-175B的大型语言模型给研究人员用。去年底还有一个叫Galactica的模型,但后者因为经常说出有偏见或不正确的信息,在48小时内被迅速下架。

Meta公司说,我们认为,负责任地使用人工智能和大型语言模型需要全社会–包括学者、民间组织、政策制定者和行业–共同努力,并制定清晰的准则。我们期待看到社区能从LLaMA中学到什么–并最终创造什么。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230228A006UP00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券