继谷歌Gemini掀起“动嘴P图”热潮后(上新|真正AI全模态?Gemini 2.0“语言PS”,作图修图动口不动手,谷歌再刷屏),马斯克的xAI也坐不住了——Grok3上线全新图像编辑功能,支持用户通过一句话就能完成专业级修图,比如「证件照秒换西装」、「黑发一键变金发」,操作简单到让人感叹传统软件要被取代了吗?
图源:网络截图。侵删。
Grok也同步在X平台的手机App“灰度”上线,未来你可能只需要拿出手机,说句话,照片立马完成堪比专业P图师的改造。这次Grok上线图片编辑,毫无疑问是受到了谷歌Gemini 2.0 Flash版本的“刺激”。
谷歌不久前刚发布的图片编辑功能,用户只需输入简单的文本提示,就能完成换衣、换发色、P动作,甚至还能把两张照片合成一张,毫无违和感。一个动作直接把传统PS用户群体震惊到。
图中所演示试用过程原图和生成图均由Grok3生成。
马斯克团队显然不甘落后,Grok3的“连夜跟进”足见大模型厂商的卷之激烈。从复杂操作到一句话搞定,传统软件会被颠覆吗?但可以肯定的是,未来图片编辑的门槛一定会被无限拉低。过去P一张证件照,得打开PS、抠图、调色、处理细节,动辄几十分钟;现在打开Grok或Gemini,说一句“帮我换上黑色西装带红色领带”,几秒钟搞定。
图中所演示试用过程原图和生成图均由Grok3生成。
这不仅是技术进步,更是一场交互方式的范式转移。当大模型赋予图像编辑“自然语言接口”之后,图片处理不再是少数人掌握的专业技能,而是任何人张嘴就能玩的创作工具。
当然,Grok3和Gemini的修图功能目前更多还是“可玩性”强,距离真正取代Photoshop等专业工具还有不小距离。但趋势已经很明显:未来的比拼,不仅在技术本身,更在用户体验的细节优化,谁能先做到“让普通人用得舒服”,谁就能赢得这场AI图像编辑大战、赢得最终的用户。
photo by DALL·E3
本文写于2025年3月23日
连续日更的第357天,第381篇
⬆️关注我,一起在AI前沿探索⬆️
领取专属 10元无门槛券
私享最新 技术干货