新京报贝壳财经讯(记者韦英姿)3月21日晚间,腾讯正式推出深度思考模型混元T1正式版。此前元宝已上线T1预览版。腾讯混元团队在发布会上透露,近期有推进一款中小规模模型的开源计划,性能预期能够接近新建模型,在部署和推理成本上有所下降。
混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。据腾讯混元团队介绍,这一架构降低了传统Transformer结构的计算复杂度,减少了KV-Cache的内存占用,从而降低了训练和推理成本。现场资料显示,混元T1吐字速度达60至80token/s。
混元T1支持API使用,输入价格为1元/百万tokens,输出价格为4元/百万tokens。输入价格与行业差距不大,但输出价格为DeepSeek-R1标准时段的1/4。
目前,DeepSeek-R1标准时段(即:北京时间8时30分至0时30分)API使用定价为:在输入价格方面,缓存命中为1元/百万tokens,缓存未命中为4元/百万tokens;输出价格为16元/百万tokens。非标准时段(即:北京时间0时30分至8时30分),DeepSeek-R1在输入价格方面,缓存命中为0.25元/百万tokens,缓存未命中为1元/百万tokens;输出价格为4元/百万tokens。
此外,文心大模型X1的API使用定价为输入0.002元/千tokens,输出0.008元/千tokens。
编辑 王真真
校对 赵琳
领取专属 10元无门槛券
私享最新 技术干货