首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Gemini 2.5 Flash-Lite:低成本高效率AI模型正式发布

Gemini 2.5 Flash-Lite:低成本高效率AI模型正式发布

原创
作者头像
用户11764306
发布2026-02-03 17:35:03
发布2026-02-03 17:35:03
370
举报

今天,某中心发布了Gemini 2.5 Flash-Lite的稳定版本,这是Gemini 2.5模型家族中最快且成本最低的模型(每百万输入令牌0.10美元,每百万输出令牌0.40美元)。构建2.5 Flash-Lite旨在推动单位成本智能的前沿,其原生的推理能力可为要求更高的用例选择性地开启。基于2.5 Pro和2.5 Flash的良好势头,该模型完善了我们已准备就绪、可用于规模化生产的2.5模型系列。

Gemini 2.5 Flash-Lite在性能和成本之间取得了平衡,同时不牺牲质量,特别适用于翻译和分类等对延迟敏感的任务。其突出特点如下:

  • 顶级速度:在广泛的提示样本测试中,Gemini 2.5 Flash-Lite的延迟低于2.0 Flash-Lite和2.0 Flash。
  • 成本效益:它是目前成本最低的2.5模型,定价为每百万输入令牌0.10美元,输出令牌0.40美元,使用户能够经济地处理大量请求。与预览版相比,音频输入定价也降低了40%。
  • 智能小巧:在包括编程、数学、科学、推理和多模态理解在内的广泛基准测试中,其整体质量均高于2.0 Flash-Lite。
  • 功能齐全:使用2.5 Flash-Lite进行构建时,您将获得100万令牌的上下文窗口、可控的思维预算,以及对“通过某中心搜索进行信息溯源”、“代码执行”和“URL上下文”等原生工具的支持。

自2.5 Flash-Lite推出以来,已经出现了一些非常成功的部署案例,以下是一些示例:

  • Satlyt正在构建一个去中心化的空间计算平台,旨在改变卫星数据处理和利用方式,用于在轨遥测数据的实时摘要、自主任务管理和卫星间通信解析。与他们的基线模型相比,2.5 Flash-Lite的速度已将关键机载诊断的延迟降低了45%,功耗降低了30%。
  • HeyGen利用AI为视频内容创建虚拟形象,并借助Gemini 2.5 Flash-Lite来自动化视频规划、分析和优化内容,以及将视频翻译成180多种语言。这使他们能够为用户提供全球化的个性化体验。
  • DocsHound通过使用Gemini 2.5 Flash-Lite以低延迟处理长视频并提取数千张截图,将产品演示转化为文档。这比传统方法更快地将素材转化为全面的文档和AI代理的训练数据。
  • Evertune帮助品牌了解其在各种AI模型中的呈现方式。Gemini 2.5 Flash-Lite对他们而言是一项变革性技术,显著加快了分析和报告生成速度。其快速的性能使他们能够快速扫描和综合分析大量模型输出,从而为客户提供动态、及时的洞察。

您可以在代码中指定 gemini-2.5-flash-lite 来开始使用2.5 Flash-Lite。如果您正在使用预览版本,可以切换到 gemini-2.5-flash-lite,这是相同的底层模型。我们计划在8月25日移除Flash-Lite的预览版别名。

准备好开始构建了吗?立即在Google AI Studio和Vertex AI中试用Gemini 2.5 Flash-Lite的稳定版本。FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档