前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >性能与效率比拼:开源大语言模型竞逐 | 开源专题 No.76

性能与效率比拼:开源大语言模型竞逐 | 开源专题 No.76

作者头像
小柒
发布2024-05-17 17:56:24
2070
发布2024-05-17 17:56:24
举报
文章被收录于专栏:开源服务指南

THUDM/ChatGLM3https://github.com/THUDM/ChatGLM3

Stars: 1.9k License: NOASSERTION

ChatGLM3 是智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型。其主要功能包括更强大的基础模型、更完整的功能支持以及全面开源序列。具体特点如下:

  • 更强大的基础模型:ChatGLM3-6B 采用了更多样化、充分训练步数和合理训练策略,在不同角度数据集上表现出最佳性能。
  • 更完整的功能支持:引入全新设计 Prompt 格式,并原生支持工具调用、代码执行和 Agent 任务等复杂场景。
  • 全面开源序列:除了对话模型外,还提供了基础模型 ChatGLM3-6B-base 和长文本对话模型 ChatGLM3-6B32K。

apple/ml-ferrethttps://github.com/apple/ml-ferret

Stars: 6.0k License: NOASSERTION

Ferret 是一个端到端的 MLLM (多模态语言和视觉学习) 模型,可以接受任何形式的指代,并在响应中对任何内容进行定位。其主要功能包括 FERRET 模型、GRIT 数据集以及 Ferret-Bench 评估基准。该项目的关键优势和核心特点包括:

  • FERRET 模型采用混合区域表示+空间感知视觉采样器,实现了细粒度且开放词汇表范围内的指称与定位。
  • GRIT 数据集规模大、层次化且稳健,在调整指令方面具有重要意义。
  • Ferret-Bench 是一个多模态评估基准,同时需要涵盖指称/定位、语义理解、知识获取和推理等能力。

01-ai/Yihttps://github.com/01-ai/Yi

Stars: 4.7k License: Apache-2.0

Yi 系列模型是由 01.AI 的开发人员从头开始训练的大型语言模型。第一个公开发布版本包含两个双语 (英文/中文) 基础模型,参数大小分别为 6B 和 34B。它们都使用 4K 序列长度进行训练,并在推理时可以扩展到 32K。

  • 支持多种任务评估
  • 提供了不同规模和上下文长度的预训练模型
  • 可以通过 Docker 或本地环境来使用该项目

ise-uiuc/magicoderhttps://github.com/ise-uiuc/magicoder

Stars: 1.6k License: MIT

Magicoder 是一个由 🪄OSS-Instruct 提供支持的模型系列,它采用一种新颖的方法来启发 LLMs 使用开源代码片段生成低偏差和高质量指令数据。🪄OSS-Instruct 通过赋予 LLM 丰富的开源参考资料,以产生更多样化、真实和可控制的数据,从而减轻了 LLM 合成指令数据固有的偏见。

QwenLM/Qwenhttps://github.com/QwenLM/Qwen

Stars: 4.3k License: NOASSERTION

Qwen 是一个开源项目,主要功能是提供强大的基础语言模型和聊天模型。它们经过稳定预训练,并使用多达 3 万亿个标记的跨领域、多语种数据进行了广泛覆盖。这些模型能够在基准数据集上取得竞争性表现。Qwen-Chat 还具有与人类偏好相一致的对话能力,可以用于聊天、内容创作、信息提取等任务,并且可以使用工具、扮演代理角色甚至充当代码解释器等功能。 以下是该项目的关键特点和核心优势:

  • 提供强大而稳定的基础语言模型
  • 聊天模型与人类偏好保持一致
  • 可以执行各种任务,如聊天、创建内容、信息提取等
  • 支持工具使用和代理角色操作
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • THUDM/ChatGLM3https://github.com/THUDM/ChatGLM3
  • apple/ml-ferrethttps://github.com/apple/ml-ferret
  • 01-ai/Yihttps://github.com/01-ai/Yi
  • ise-uiuc/magicoderhttps://github.com/ise-uiuc/magicoder
  • QwenLM/Qwenhttps://github.com/QwenLM/Qwen
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档