观点网讯:9月22日,美团旗下LongCat团队正式发布新一代高效推理模型LongCat-Flash-Thinking,并同步在HuggingFace与GitHub开源。该模型在保持前代极速响应的同时,于逻辑、数学、代码、智能体及形式化定理证明五大领域全面刷新开源模型SOTA纪录。
技术层面,团队采用“领域并行强化学习”将STEM、代码与智能体任务解耦训练,配合异步弹性共卡系统DORA实现万卡级集群稳定运行,训练效率较同步框架提升3倍。
实测显示,在AIME25数据集上,模型以90%准确率的智能体工具调用方案将Token消耗从1.97万降至6965,节省64.5%。此外,其MiniF2F-test pass@1得分67.6,大幅领先现有开源模型。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。