
DRUGONE
人工智能在医疗领域的应用正以前所未有的速度加速推进,医疗行业采用 AI 的速度已达到整体经济体系的两倍。顺应这一趋势,Google 去年通过 Health AI Developer Foundations(HAI-DEF)计划发布了开放医疗生成模型系列 MedGemma,为开发者提供可扩展、可定制的医疗 AI 基础模型。
自发布以来,MedGemma 在社区获得了巨大反响,在 Hugging Face 上已累计数百万次下载,并衍生出数百个社区版本。

在此基础上,Google 近日正式推出 MedGemma 1.5 4B 模型,并同步发布专为医疗语音转写优化的 MedASR 模型,全面升级医学影像解析与医疗多模态智能能力。
MedGemma 1.5:面向真实医疗场景的多模态基础模型升级
MedGemma 从设计之初便定位为多模态医学模型,以适配医学数据天然的多模态特性。
MedGemma 1 支持内容包括:
MedGemma 1.5 新增关键能力:
高维医学影像解析
纵向医学影像分析
解剖结构定位
医疗文档结构化理解
开发者可将多个 CT/MRI 切片或病理图像块与任务提示同时输入模型,实现复杂医学影像任务建模。

高维影像性能显著提升
在内部评测中:
研究人员指出,MedGemma 1.5 是首个公开发布的开放多模态大模型,能够同时处理高维医学影像、二维图像与文本信息。

其他医学影像任务表现提升
此外,Google Cloud 已原生支持 DICOM 医学影像格式,极大简化临床系统集成。


文本医疗能力同步增强
通过新增训练数据与优化训练策略,MedGemma 1.5 在医学文本任务上同样取得显著进步:
这使得 MedGemma 在临床知识理解与医疗记录分析方面更加可靠。

MedASR:面向医疗场景的专业语音转写模型
在医疗实践中,语音仍是核心交互方式之一,包括:
为适配医疗专业术语密集场景,研究人员推出 MedASR 医疗语音识别模型。
与通用语音模型对比表现:

MedASR 可无缝连接 MedGemma,实现:医疗语音 → 文本 → 智能推理的一体化工作流

真实医疗应用案例
🇲🇾 马来西亚临床指南智能助手
Qmed Asia 将 MedGemma 集成至 askCPG 系统,构建可对话式临床指南查询平台,显著提升临床决策效率,并扩展医学影像理解功能。
🇹🇼 台湾肺癌术前评估分析
台湾健保机构利用 MedGemma 自动解析超过 30,000 份病理报告,提取关键医学指标,用于术前风险分析与政策制定优化。
学术研究支持
MedGemma 已被广泛应用于:
并在多项研究中作为基础模型展现出优越性能。

MedGemma Impact Challenge:推动医疗AI创新
Google 同步启动 MedGemma Impact Challenge 黑客松竞赛:
💰 奖金总额:100,000 美元
🌍 面向全球开发者
🎯 鼓励构建医疗与生命科学创新应用
整理 | DrugOne团队
参考资料
内容为【DrugOne】公众号原创|转载请注明来源