腾讯混元大模型(Tencent Hunyuan)由腾讯公司全链路自研,在高质量内容创作、数理逻辑、代码生成和多轮对话上性能表现卓越,处于业界领先水平。混元 API 支持 AI 搜索联网插件,通过整合腾讯优质的内容生态,提供强大的时效、深度内容获取和 AI 问答能力。
混元生文
以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型类型 | 模型名称(API 调用名) | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
文生文-推理模型 | hunyuan-t1-latest | 2025-08-22 | 【官方推荐使用】【推理模型】【最新版本】 业内首个超大规模 Hybrid-Transformer-Mamba 推理模型,扩展推理能力,超强解码速度,进一步对齐人类偏好。 | 最大输入32k 最大输出64k | |
| hunyuan-t1-20250822 | 2025-08-22 | 【最新版本】 一、发布特性: 大幅提升主模型慢思考模型的高难数学、复杂推理、高难代码、指令遵循、文本创作质量等能力。 二、效果指标: 通用能力上,相比线上版本,数学难题提升5pp,逻辑推理提升1.8pp,科学提升3pp,代码竞赛提升4pp,文创写作质量提升3pp,知识问答提升4.8pp。 | 最大输入32k 最大输出64k | |
| hunyuan-a13b | 2025-06-25 | 1. 适用场景:绝大部分场景,同时兼顾效果及推理性能。 2. 模型能力和特征:混元第一个混合推理模型,hunyuan-standard-256K 的升级版本,总参数80B,激活13B,默认是慢思考模式,支持通过参数或者指令进行快慢思考模式切换,快慢思考切换方式为 query 前加/ no_think ;整体能力相对上一代全面提升,特别是数学、科学、长文理解和 Agent 能力提升显著。 3. 模型结构:混元 MoE 结构。 | 最大输入224k 最大输出32k | |
通用文生文 | hunyuan-turbos-latest | 2025-07-16 | 【最新版本】【效果最优】【官方推荐使用】 hunyuan-TurboS 混元旗舰大模型最新版本,具备更强的思考能力,更优的体验效果,已更新至最新版本。 | 最大输入32k 最大输出16k | |
| hunyuan-turbos-20250716 | 2025-07-16 | 【最新版本】 1. 训练策略:升级post-training训练策略,大幅提升模型的文理能力。 2. 通用优化:提升文创的内容质量和丰富度,提升文科通用的理解能力、专业知识能力和指令遵循能力,提升理科的推理能力,解题能力。 3. 产品特性:文创-优化讲稿体裁。 | 最大输入32k 最大输出16k | |
| hunyuan-turbos-longtext-128k-20250325 | 2025-03-25 | 擅长处理长文任务如文档摘要和文档问答等,同时也具备处理通用文本生成任务的能力。在长文本的分析和生成上表现优异,能有效应对复杂和详尽的长文内容处理需求。 | 最大输入128k 最大输出6k | |
| hunyuan-large | 2025-02-10 | Hunyuan-large 模型总参数量约 389B,激活参数量约 52B,是当前业界参数规模最大、效果最好的 Transformer 架构的开源 MoE 模型。 | 最大输入28k 最大输出4k | |
| hunyuan-standard-256K | 2024-02-10 | 采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。长文方面,大海捞针指标达到99.9%。 MOE-256K 在长度和效果上进一步突破,极大地扩展了可输入长度。 | 最大输入250k 最大输出6k | |
| hunyuan-standard | 2025-02-10 | 采用更优的路由策略,同时缓解了负载均衡和专家趋同的问题。 MOE-32K 性价比相对更高,在平衡效果、价格的同时,可实现对长文本输入的处理。 | 最大输入30k 最大输出2k | |
| hunyuan-lite | 2024-10-30 | 升级为 MOE 结构,上下文窗口为 256k ,在 NLP,代码,数学,行业等多项评测集上领先众多开源模型。 | 最大输入250k 最大输出6k | |
机器翻译 | hunyuan-translation | 2025-10-14 | 支持语种齐全,33种语言互译和5种民族语言互译; 同尺寸模型中效果最优,WMT25比赛30种语言获得第一,开源测试集Flores200效果领先; 支持语种:中文,英语,法语,葡萄牙语,西班牙语,日语,土耳其语,俄语,阿拉伯语,韩语,泰语,意大利语,德语,越南语,马来语,印尼语,菲律宾语,印地语,中文繁体,波兰语,捷克语,荷兰语,高棉语,缅甸语,波斯语,古吉拉特语,乌尔都语,泰卢固语,马拉地语,希伯来语,孟加拉语,泰米尔语,乌克兰语,藏语,哈萨克语,蒙古语,维吾尔语,粤语。 | 最大输入4k 最大输出4k | |
| hunyuan-translation-lite | 2025-06-06 | 混元翻译专项模型,基于混元2B-Dense模型进行翻译能力专项优化,通过迭代高质量多语言SFT数据,强化多语种翻译能力。支持简体中文、繁体中文、粤语、日语、法语、葡萄牙语、西班牙语、土耳其语、俄语、阿拉伯语、韩语、意大利语、德语、越南语、马来语、印尼语等语言互译。 | 最大输入4k 最大输出4k | |
角色扮演 | hunyuan-large-role-latest | 2025-09-24 | 1. 适用场景:AI 数字分身、AI 角色扮演、AI情感陪聊等 2. 特性说明:显著提升了角色一致性与对话深度。通过在大规模高质量角色对话数据上的强化训练,模型能深度理解并稳定维持角色设定,有效减少 OOC(脱离角色)问题。不仅在多轮互动中保持上下文连贯,更大幅提升了聊天的趣味性和沉浸感,使每次对话都生动而富有深度。 | 最大输入28k 最大输出4k | |
| hunyuan-role | 2024-07-04 | 混元最新版角色扮演模型,混元官方精调训练推出的角色扮演模型,基于混元模型结合角色扮演场景数据集进行增训,在角色扮演场景具有更好的基础效果。 | 最大输入28k 最大输出4k | |
Function Call | hunyuan-functioncall | 2025-04-22 | 混元最新 MOE 架构 FunctionCall 模型,经过高质量的 FunctionCall 数据训练,上下文窗口达 32K,增强了复杂指令和多轮理解能力,增强了开源 BenchMark 的效果,在多个维度的评测指标上处于领先。 | 最大输入28k 最大输出4k | |
代码生成 | hunyuan-code | 2024-11-12 | 混元最新代码生成模型,经过 200B 高质量代码数据增训基座模型,迭代半年高质量 SFT 数据训练,上下文长窗口长度增大到 8K,五大语言代码生成自动评测指标上位居前列;五大语言10项考量各方面综合代码任务人工高质量评测上,性能处于第一梯队。 | 最大输入4k 最大输出4k | |
混元多模态模型
混元多模态模型重磅发布,支持图片生文,包括图片基础识别、图片内容创作、图片多轮对话、图片知识问答、图片分析推理、图片 OCR 等能力。以下为模型特性的简要介绍,可作为业务接入时版本选择的参考依据。
模型类型 | 模型名称 | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
混元图生文 | hunyuan-t1-vision | 2025-06-19 | 混元多模态理解深度思考模型,支持多模态原生长思维链,擅长处理各种图片推理场景,在理科难题上相比快思考模型全面提升。 | 最大输入16k 最大输出24k | |
| hunyuan-t1-vision-20250916 | 2025-09-16 | 混元最新版 t1-vision 视觉深度思考模型,相比上一版模型在通用图文问答、视觉定位、OCR、图表、拍题解题、看图创作等任务上全面提升,显著优化了英文和小语种能力。 | 最大输入28k 最大输出20k | |
| hunyuan-turbos-vision | 2025-05-26 | 此模型适用于图文理解场景,是基于混元最新 turbos 的新一代视觉语言旗舰大模型,聚焦图文理解相关任务,包括基于图片的实体识别、知识问答、文案创作、拍照解题等方面,相比前一代模型全面提升。 | 最大输入16k 最大输出16k | |
| hunyuan-turbos-vision-20250619 | 2025-06-19 | 混元最新版turbos-vision视觉语言旗舰大模型,在图文理解相关的任务上,包括基于图片的实体识别、知识问答、文案创作、拍照解题等方面相比上一代默认版本模型全面提升。 | 最大输入16k 最大输出16k | |
| hunyuan-large-vision | 2025-08-01 | 此模型适用于图文理解场景,是基于混元Large训练的视觉语言大模型,支持任意分辨率多张图片+文本输入,生成文本内容,聚焦图文理解相关任务,在多语言图文理解能力上有显著提升。 | 最大输入24k 最大输出8k | |
| hunyuan-vision | 2025-01-03 | 混元最新多模态模型,支持图片+文本输入生成文本内容。 图片基础识别:对图片中主体、元素、场景等进行识别 图片内容创作:对图片进行概述、创作广告文案、朋友圈、诗词等 图片多轮对话:输出单张图片进行多轮交互问答 图片分析推理:对图片中逻辑关系、数学题、代码、图表进行统计分析 图片知识问答:对图片包含的知识点进行问答,例如历史事件、电影海报 图片 OCR:对自然生活场景、非自然场景的图片识别文字。 | 最大输入6k 最大输出16k | |
混元生图
混元生图提供文生图 API 技术服务,基于混元文生图大模型,可结合输入的文本描述智能创作出与输入相关的图像内容,提供更高质量的图像创作、更强大的中文语义理解能力以及更广泛的应用场景。
模型类型 | 模型名称 | 版本更新时间 | 能力和特征 | 输入输出 | 相关文档 |
混元生图 | 混元生图 | 2024-09-11 | 输入 prompt 文本,生成图像。 prompt 扩写:支持 prompt 自动扩写优化。 绘画风格:支持18种预置风格选项 + prompt 自定义风格。 分辨率:支持8种分辨率。 生成数量:支持1 - 4张。 随机种子:支持随机种子生成或自定义固定种子生成。 | 最大输入1024字符文本 最大输出4张图片 | |
| 混元生图 (多轮对话) | 2024-08-28 | 输入 prompt 文本,生成图像,支持通过多轮对话的方式不断调整图像内容。 | 最大输入100轮对话文本 输出图片 | |
| 文生图轻量版 | 2024-07-15 | 输入 prompt 文本,生成图像,支持更轻量的同步请求方式和更高的性能。 | 最大输入256字符文本 输出图片 | |
腾讯元器
腾讯元器平台是一款基于混元大模型开发的一站式智能体创作与分发平台,用户无需编程经验即可轻松创建属于自己的智能体。在这个平台上,用户可以通过描述来设定智能体的角色和流程,利用丰富的插件和知识库资源让智能体更加智能化。平台还提供基于 AI 大模型的智能对话功能,以及智能体商店,汇聚了众多富有创意和趣味性的智能体玩法,为用户带来全新的智能体验。