腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
混元生文
混元生文目前已上线7个版本,以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型名称 | 能力和特征 | 分支版本 | 输入输出 |
hunyuan-turbo | 混元全新一代大语言模型的预览版,采用全新的混合专家模型(MoE)结构,相比hunyuan-pro推理效率更快,效果表现更强。 | / | 最大输入28k 最大输出4k。 |
hunyuan-pro | 万亿级参数规模 MOE-32K 长文模型。在各种 benchmark 上达到绝对领先的水平,复杂指令和推理,具备复杂数学能力,支持 functioncall,在多语言翻译、金融法律医疗等领域应用重点优化。 | / | 最大输入28k 最大输出4k。 |
hunyuan-standard | 采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。长文方面,大海捞针指标达到99.9%。 MOE-32K 性价比相对更高,在平衡效果、价格的同时,可对实现对长文本输入的处理。 MOE-256K 在长度和效果上进一步突破,极大的扩展了可输入长度。 | hunyuan-standard-32K (默认) | 最大输入30k 最大输出2k。 |
| | hunyuan-standard-256K | 最大输入250k
最大输出6k。 |
hunyuan-lite | 升级为 MOE 结构,上下文窗口为 256k ,在 NLP,代码,数学,行业等多项评测集上领先众多开源模型。 | / | 最大输入250k
最大输出6k。 |
hunyuan-role | 混元最新版角色扮演模型,混元官方精调训练推出的角色扮演模型,基于混元模型结合角色扮演场景数据集进行增训,在角色扮演场景具有更好的基础效果。 | / | 最大输入4k 最大输出4k。 |
hunyuan-functioncall | 混元最新 MOE 架构 FunctionCall 模型,经过高质量的 FunctionCall 数据训练,上下文窗口达 32K,在多个维度的评测指标上处于领先。 | / | 最大输入28k 最大输出4k。 |
hunyuan-code | 混元最新代码生成模型,经过 200B 高质量代码数据增训基座模型,迭代半年高质量 SFT 数据训练,上下文长窗口长度增大到 8K,五大语言代码生成自动评测指标上位居前列;五大语言10项考量各方面综合代码任务人工高质量评测上,性能处于第一梯队 | / | 最大输入4k 最大输出4k。 |
混元多模态模型
混元多模态模型重磅发布,支持图片生文,包括图片基础识别、图片内容创作、图片多轮对话、图片知识问答、图片分析推理、图片OCR等能力。以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型名称 | 能力和特征 | 分支版本 | 输入输出 |
hunyuan-vision | 混元最新多模态模型,支持图片+文本输入生成文本内容。 图片基础识别:对图片中主体、元素、场景等进行识别 图片内容创作:对图片进行概述、创作广告文案、朋友圈、诗词等 图片多轮对话:输出单张图片进行多轮交互问答 图片分析推理:对图片中逻辑关系、数学题、代码、图表进行统计分析 图片知识问答:对图片包含的知识点进行问答,例如历史事件、电影海报 图片 OCR:对自然生活场景、非自然场景的图片识别文字 | / |
最大输入4k
最大输出4k。 |
腾讯元器平台
腾讯元器平台是一款基于混元大模型开发的一站式智能体创作与分发平台,用户无需编程经验即可轻松创建属于自己的智能体。在这个平台上,用户可以通过描述来设定智能体的角色和流程,利用丰富的插件和知识库资源让智能体更加智能化。平台还提供基于 AI 大模型的智能对话功能,以及智能体商店,汇聚了众多富有创意和趣味性的智能体玩法,为用户带来全新的智能体验。
混元生图
混元生图提供文生图 API 技术服务,基于混元文生图大模型,可结合输入的文本描述智能创作出与输入相关的图像内容,提供更高质量的图像创作、更强大的中文语义理解能力以及更广泛的应用场景。