你有没有想过,有一天,你能用嘴巴就能“画图”?听起来像是科幻小说的情节,却在今天变成了现实——Gemini 2.0的“用嘴改图”功能正式上线。
语音版Photoshop?没错,这就是你一直梦寐以求的超能力!
Google推出的Gemini 2.0 Flash Experimental版,带来了全新的体验。
只需打开AI Studio,将图片拖进去,然后用语音指令告诉它如何修改——无论是换个背景,还是换张脸,AI都能在瞬间完成。
比如,我现在有张马斯克的图,我想把他变成特朗普。
一切只需要你轻轻开口,无需繁琐的操作,所有你想要的效果都能自动生成。
下面我继续让你们直观的感受下,它还能干啥。
给老照片上个色
又试了一波言出法随,对LOGO做细致调整都非常的方便。
就算我有个错别字,也没有影响输出效果。
扩展、微调、换场景——这些曾经需要反复点选、调试的操作,如今不再复杂。
Gemini通过深度语义理解,一语命中,轻松搞定。
我只能说,好家伙,这种便捷与精准的操作,市面上真是无敌了!
而且对图片风格的一致性,它的理解效果也非常好。
比如生成和图片风格一致的小狗:
还能言出法随的去水印:
甚至,可以扔一个草图进去,然后说:
请根据这张手绘线稿图,生成一张真实的汽车渲染图。
对这个图片的背景不满意,你还可以,换成湖边别墅。
放大,去除,替换,补东西,它的可玩性实在太多了!
这,就是AI的“真多模态”——图像和文字的理解和输出,完美结合,不再依赖外挂生成模型。
关键是言出法随还免费!!!
Google,赢了!
下面我来教一下大家怎么使用。
首先网址(需魔法):
https://aistudio.google.com/
登录后,首页界面如图:
第二步就是在右侧把模型切换成:
Gemini 2.0 Flash Experimental
输出的位置选择Images and text即可。
顺便一提,你也可以上传两张图片,对图片进行融图操作哦!
从今天开始,你不再需要手忙脚乱地在图像编辑软件中摸索,单凭一句话,AI就能将你想要的画面呈现出来。
Google的这个新工具,不仅简化了P图的过程,更带来了前所未有的创作自由。
未来的创作,可能真的就是你和AI之间的一场对话——没有复杂的操作,只有无限的可能。
好了,本期内容就到此结束啦,当然Gemini还有更多可探索的空间:
比如:漫画、3D建模设计盲盒、生成式图文菜谱步骤图等
领取专属 10元无门槛券
私享最新 技术干货