首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

腾讯自研推理新高度,混元T1正式版震撼发布!

腾讯近日隆重推出了其自主研发的深度思考模型——混元T1正式版本,这一创新成果标志着腾讯在人工智能领域的又一重大突破。作为腾讯自研的最强推理模型,混元T1以其卓越的性能和多样化的功能吸引了业界的广泛关注。

混元T1不仅在响应速度上达到了极致,能够迅速回复用户的问题,还尤其擅长处理超长文本内容。这得益于其背后的大规模强化学习技术,以及对数学、逻辑推理、科学和编程等领域的深度优化。这些努力使得混元T1的推理能力得到了显著提升。

在多项基准测试中,混元T1的表现尤为亮眼。例如,在大语言模型评估增强数据集MMLU-PRO中,它取得了87.2分的高分,仅次于另一顶级模型o1。在Ceval、AIME、Zebra Logic等涵盖中英文知识和竞赛级数学、逻辑推理的公开测试中,混元T1也展现出了业界领先的水平。这些成绩充分证明了其强大的推理能力。

混元T1在多项任务中均表现出了极高的适应性。这包括对齐任务、指令跟随任务和工具利用任务等。其正式版继承了混元Turbo S的创新架构,并采用了Hybrid-Mamba-Transformer融合模式。这一创新架构首次在工业界实现了将混合Mamba架构无损应用于超大型推理模型,从而有效降低了传统Transformer结构的计算复杂度和KV-Cache的内存占用,显著减少了训练和推理的成本。

混元T1的长文捕捉能力同样令人瞩目。它能够有效解决长文本推理过程中常见的上下文丢失和长距离信息依赖问题。这得益于混合Mamba架构对长序列处理的专门优化。通过高效的计算方式,该架构在保证长文本信息捕捉能力的同时,显著降低了资源消耗。在参数激活量相近的情况下,解码速度提升了两倍,进一步提升了模型的实用性。

目前,腾讯已经向公众开放了混元T1的体验,并上线了相关API服务。用户可以通过这些服务体验混元T1的强大功能。收费标准为输入每百万tokens 1元,输出每百万tokens 4元,为用户提供了灵活且经济的使用选择。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O_TbUQVo4ln10kgUVJ7DkNmg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券