首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

豆包图像生成又更新了,一次生成20张图,还能保持一致性

大家好,我是葉子。今天是日更第470天。

大家好,我是葉子。一个主业搞AI社群运营,副业搞AI视频的AI博主。

豆包又又更新了,如果你现在打开豆包可以看到下面界面中的智能升级Beta。

恭喜你,你被豆包最新的图片生成功能灰度到了。

这也是豆包最新的图片生成功能,完全可以对标GPT-4o。

省流版功能介绍:

1、单次生图20张。

可以通过提示词的描述,让豆包一次性生成最多20张图片。通过连续对话可以生成更多。

2、连续性多图生成功能。

可以把分镜图/故事/绘本等内容,一次性生成20张以内的图片,并可以一定程度的保持人物、场景、风格的一致性。

3、语义理解大幅度增强。

即使非常简单的提示词,豆包也可以深度理解我们要表达的意图,生成符合我们想法的图片。

目前的瑕疵:

1、人物脸部一致性较差。

使用人物作为参考时,生成的一致性较差。

2、个别时候不响应。

有时候多次对话修改,可能不直接生成图片。可以点击技能中的图像生成,保持技能使用中。

下面看一下葉子测试的几个例子:

1、一次生成20张图片。

直接给葉子生成了20张不同的建筑图片,并都标注了建筑名字。有些葉子都没听说过。

2、故事性、连续一致性

只用一句提示词,直接把一个故事自动拆解为分镜,并生成相应的图片。同时也保持了风格的一致性。

绘本故事这次真的无敌了。

3、做一道菜并配图

当时Gemini更新的时候,葉子也用过这个作为案例测试。这次也拿来测测豆包。

效果好极了,一点不比Gemini差。

从葉子测试的很多个case来看,豆包这次的更新真的可以说国产大模型又一次新的高峰。

很多方面不输于GPT-4o的图片生成,有些地方还有所超越。当然也有一些不足的地方。但基本和GPT-4o的图片生成功能站在了同一台阶。

两周前,即梦3.0图片模型更新,中文的生成直接给设计行业带来了一次地震和狂欢。

很多人到现在连即梦3.0还没玩明白,现在豆包又带着全新的图片生成模型Beta来了。

用嘴改图、连续生图、人物场景风格一致性,一次生成20张图。

不得不说,单纯的图片生成领域,字节带着豆包和即梦站在了金字塔尖。

而且,最近两天即梦3.0视频生成大模型已经在内测了。

3.0图片模型+3.0视频模型。

这下,豆包真的要高处不胜寒了。

以上。今天的文章就到这里了,感谢大家观看,希望对大家有所启发,我们明天见。

如果觉得文章不错,随手点个赞、在看、转发三连吧!如果想第一时间收到推送,也可以给我个星标⭐~

文章首图标题:《 水上的桥 》

创作者:葉子

AI 算法提供:Midjourney V7

往期精华文章推荐

2025最强AI工具合集

AI绘画

AI视频

AI声音克隆

AI制作PPT

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O4zufJXItqypT_0T7iG4ntSQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券