谷歌推出Gemini 2.5 Flash:引入"思考预算"的混合推理AI
谷歌刚刚发布了Gemini 2.5 Flash预览版,这是一款混合推理AI模型,其性能与o4-mini相当,在推理和STEM基准测试上超越了Claude 3.5 Sonnet,并引入了全新的"思考预算"功能,以优化成本与质量的平衡。
具体细节:
Gemini 2.5 Flash相比其前身(2.0 Flash)展现出显著的推理能力提升,具有可控的思考过程,允许用户开启或关闭该功能。
该模型在推理、STEM和视觉推理基准测试中表现强劲,尽管其成本仅为竞争对手的一小部分。
开发者还可以设置"思考预算"(最高24k tokens),精细调整响应质量、成本和速度之间的平衡。
该模型已通过Google AI Studio和Vertex AI的API提供使用,同时也作为实验性选项出现在Gemini应用中。
虽然OpenAI本周可能主导了行业讨论,但谷歌也在紧随其后推出新产品。可控且有预算的推理功能是一个有趣的定制化选择,用户可以仅在任务需要时激活此功能——既能支持经济实惠的高容量使用场景,又能为更复杂的工作保留思考能力。
谷歌此次更新体现了AI技术朝着更加灵活且经济的方向发展。通过"思考预算"这一创新设计,用户可以根据实际需求调整AI的表现,这意味着AI服务将更加个性化,资源分配也更加合理。
Profluent发现蛋白质设计AI的扩展规律
Profluent宣布了ProGen3,这是一个能够从零开始设计复杂蛋白质的AI模型家族——其结果标志着首次在生物学领域发现AI扩展规律的证据,证明更大的模型和更多的数据能创造更强的结果。
具体细节:
这家生物科技公司的460亿参数模型接受了34亿蛋白质序列的训练,超越了以往的数据集,展示了改进的蛋白质生成能力。
它成功设计出与已获批疗法在性能上相当的新抗体,同时足够独特以避免专利冲突。
该平台还创建了比CRISPR-Cas9小不到一半的基因编辑蛋白,可能为基因治疗开启新的递送方法。
Profluent正通过免版税或预付授权方式提供20种"开放抗体",针对影响700万患者的疾病。
如果扩展趋势持续,Profluent的方法可能将药物和基因编辑器设计从耗时数年的实验室工作转变为更快速、更可预测的工程问题——重写治疗方法的发现方式。这些趋势也表明,我们才刚刚开始看到AI对药物发现和医学的影响。
从个人角度看,这是生物医学领域的一个重大突破。AI在蛋白质设计中的应用不仅可能加速新药研发,还有望大幅降低研发成本,使更多患者能够获得负担得起的治疗方案。这种技术革新可能会彻底改变制药行业的格局。
Meta的FAIR分享新的AI感知研究
Meta的FAIR研究部门刚刚发布了五个新的开源AI研究项目,专注于感知和推理,展示了计算机视觉、3D理解和协作AI能力方面的进展。
具体细节:
感知编码器在视觉理解方面展示了最先进的性能,擅长识别伪装动物或跟踪移动等任务。
Meta还推出了开源的Meta感知语言模型(PLM)和PLM-VideoBench基准测试,专注于视频理解。
Locate 3D实现了AI对物体的精确理解,Meta发布了包含13万个空间语言注释的数据集用于训练。
最后,一个新的协作推理框架测试了AI系统如何协同工作,显示比单独工作提高了近30%的性能。
这批研究专注于AI的基础构建模块,如感知、3D理解和推理——朝着更强大的具身代理和机器智能迈出的关键步骤。我们正式进入新领域,系统终于能够以先进方式理解并与物理世界互动。
领取专属 10元无门槛券
私享最新 技术干货