首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nano Banana Pro图像生成与编辑技术解析

Nano Banana Pro图像生成与编辑技术解析

原创
作者头像
用户11764306
发布2026-04-04 14:14:10
发布2026-04-04 14:14:10
2120
举报

介绍 Nano Banana Pro

不久前,发布了Nano Banana(Gemini 2.5 Flash图像模型)。从修复旧照片到生成微型模型,Nano Banana在图像编辑领域迈出了一大步,让普通创作者能够表达自己的创造力。今天,推出Nano Banana Pro(Gemini 3 Pro Image),这是一种新型的图像生成与编辑模型。Nano Banana Pro 基于 Gemini 3 Pro 构建,利用 Gemini 的先进推理和现实世界知识,比以往更好地可视化信息。

Nano Banana Pro 如何帮助实现任何创意或设计

Nano Banana Pro 可以帮助可视化任何想法并设计任何东西 —— 从原型、将数据表示为信息图,到将手写笔记转换为图表。

基于增强的推理、世界知识和实时信息生成更准确、上下文丰富的视觉内容

借助 Gemini 3 的先进推理能力,Nano Banana Pro 不仅能创建精美的图像,还能帮助创建更有用的内容。可以获得准确的教育说明以学习新主题,例如基于提供的内容或现实世界事实的上下文丰富的信息图和图表。Nano Banana Pro 还可以连接到某搜索的庞大知识库,帮助为食谱创建快速摘要,或可视化天气或体育等实时信息。

(示例图片说明:常见室内植物“乌龟弦”的信息图,包含起源、护理要点和生长模式。) (示例图片说明:制作Elaichi Chai(豆蔻茶)的分步信息图,展示了可视化食谱和现实世界信息的能力。) (示例图片说明:通过搜索 grounding 拉取实时天气,构建了一幅波普艺术信息图。)

直接在图像中生成更准确、更清晰的多语言文本

Nano Banana Pro 是创建图像时能够直接在图像中正确渲染清晰文本的最佳模型,无论是短标语还是长段落。Gemini 3 非常擅长理解深度和细微差别,这为图像编辑和生成(尤其是文本)开启了许多可能性。现在可以在模型图或海报中创建更详细的文本,具有更丰富的纹理、字体和书法。借助 Gemini 增强的多语言推理能力,可以生成多种语言的文本,或者本地化和翻译内容,以便在国际上扩展规模或更轻松地与朋友和家人分享内容。

(示例图片说明:电影场景的黑白分镜草图,包含定场镜头、中景、特写和主观视角镜头。) (示例图片说明:“BERLIN”一词融入城市街区的建筑中,横跨多栋建筑。) (示例图片说明:基于含义启发的书法,展示了使用更丰富的纹理和字体生成富有表现力的文本的能力。) (示例图片说明:饮料宣传活动概念,展示了英文文本准确翻译并渲染为韩文的能力。) (示例图片说明:图形设计,包含“TYPOGRAPHY”一词,具有复古丝网印刷纹理。) (示例图片说明:将短语融入伐木场景,创造性地混合了文本和纹理。)

通过升级的创意能力创建高保真视觉内容

设计上的一致性:使用 Nano Banana Pro,可以比以往融合更多元素,最多使用 14 张图像,并保持最多 5 个人的一致性和相似度。无论是将草图转化为产品,还是将蓝图转化为逼真的 3D 结构,现在都可以弥合概念与创作之间的差距。轻松将所需的视觉外观和感觉应用到模型中,确保品牌在每个接触点保持无缝和一致。

(示例图片说明:在复杂构图中保持最多 14 个输入(包括多个角色)的一致性。) (示例图片说明:通过组合多个元素制作生活场景。) (示例图片说明:通过组合多个输入元素创建超现实景观。) (示例图片说明:沙漠景观中的高级时尚编辑照片,保持了 6 张输入照片中人物的一致性和相似度。)

工作室级创意控制:借助 Nano Banana Pro 的新功能,高级创意控制能力直接掌握在手中。通过改进的局部编辑,选择、细化和转换图像的任何部分。调整相机角度、改变焦点、应用复杂的调色,甚至转换场景光照(例如,白天改夜晚或创建散景效果)。由于提供多种宽高比以及 2K 和 4K 分辨率,创作内容可以适配任何平台,从社交媒体到印刷品。

(示例图片说明:通过调整宽高比,改变图像的外观以适应多种平台。) (示例图片说明:应用光照和焦点控制,将场景从白天转换为夜晚。) (示例图片说明:通过光照控制使图像的某部分变暗或变亮,以实现特定的戏剧效果。) (示例图片说明:通过调整景深或焦点(例如,聚焦于花朵)来突出构图的细节。)

如何立即尝试 Nano Banana Pro

在产品和服务的各个领域,现在有两种选择:原始 Nano Banana 用于快速有趣的编辑,或者 Nano Banana Pro 用于需要最高质量和视觉复杂结果的高级合成。

  • 消费者和学生:在 Gemini 应用中选择“Thinking”模型下的“创建图像”时,全球范围内逐步推出。免费用户将获得有限的免费配额,之后将恢复为原始 Nano Banana 模型。某 AI Plus、Pro 和 Ultra 订阅者将获得更高的配额。对于搜索中的 AI 模式,Nano Banana Pro 在美国面向某 AI Pro 和 Ultra 订阅者提供。对于 NotebookLM,Nano Banana Pro 也面向全球订阅者提供。
  • 专业人士:正在将某广告中的图像生成升级为 Nano Banana Pro,将尖端的创意和编辑能力直接交到全球广告商手中。从今天开始,它还向某 Workspace 客户在 Slides 和 Vids 中推出。
  • 开发者和企业:开始在 Gemini API 和某 AI Studio 以及某 Antigravity 中推出,以创建丰富的 UX 布局和模型;企业可以立即开始在 Vertex AI 中进行规模化创建,并即将在某 Enterprise 中推出。
  • 创意人士:开始向某 AI Ultra 订阅者在 Flow(AI 电影制作工具)中推出,为创意人士、电影制作人和营销人员提供对画面和场景更精确的控制。

如何识别 Gemini 应用中的 AI 生成图像

了解图像是否为 AI 生成至关重要。因此,所有由某工具生成的媒体都嵌入了不可察觉的 SynthID 数字水印。现在,将强大的验证工具直接交到消费者手中:借助 SynthID 技术,可以将图像上传到 Gemini 应用并直接询问它是否由某 AI 生成。从英语提示词开始,将很快扩展到更多语言、音频和视频。

除了 SynthID,还将在免费和某 AI Pro 层级用户生成的图像上保留可见水印(Gemini sparkle),使图像更容易被识别为某 AI 生成。认识到专业工作对干净视觉画布的需求,将移除某 AI Ultra 订阅者和某 AI Studio 开发者工具内生成图像上的可见水印。FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 介绍 Nano Banana Pro
  • Nano Banana Pro 如何帮助实现任何创意或设计
    • 基于增强的推理、世界知识和实时信息生成更准确、上下文丰富的视觉内容
    • 直接在图像中生成更准确、更清晰的多语言文本
    • 通过升级的创意能力创建高保真视觉内容
  • 如何立即尝试 Nano Banana Pro
  • 如何识别 Gemini 应用中的 AI 生成图像
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档