首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

快手开源可图Kolors!原生支持中文,实测送上!足够挑战MidJourney!

快手突然开源文生图模型可图Kolors!可图能稳定生成中文,还在评分里面呈现能打赢MJ6的能力。

AI赋能实验室第一时间实测,非常适合作为人像摄影的初稿阶段工具。我们也已经完成了可图模型在COMFYUI的测试,证实可图可以非常好的支持原生中文输入。

魔幻题材,科幻主题,末世时代,男人在一个大型电脑屏幕前编写剧本,同时,一个没有实体的虚拟机器人从屏幕中探出身来,用手指着男人的头部。桌子上有个牌子写着“可图”

总体来说,可图虽然属于魔改级SDXL,但图像生成的实力至少和腾讯的混元DIT在同一级别。主要特点是:

1、描述词全中文,原生。

2、概念匹配效果不太差。

3、画质起码是SDXL的一流级别。

身穿法国球衣的足球宝贝雕塑,黑色大理石,少女雕塑,摄影艺术,景深,超现实画面,拉斐尔,足球和凯旋门作为背景,写着“2024”的铭牌。

身穿西班牙球衣的足球宝贝雕塑,西班牙少女,大理石材质,白皙,摄影艺术,景深,超现实画面,米开朗基罗,安德烈雷姆烈夫,罗丹,写着“2024”的铭牌。

当然,也不是没有缺点:

中文提示词下文本的理解能力和提示词风格都发生了变化,需要进一步适应中文提示词的规则。

另外,部分提示词的权重是存在问题的,比如全身图的触发就很迷,大部分出图都倾向于非全身图,哪怕你重复强调了关键词。

另外,可图的摄影流要达到完整商用能力,contrlnet技术必不可少,需要结合PULID\INSTANTID等技术,还需要工作流上的补全。

目前,可图放出了基本的文生图模型和推理代码,后面还有一系列的辅助模型如LORA和CONTROLNET等将会陆续放出。可以期待!

从画质上,不说一定打赢MJ6吧,能平替是肯定的,而且还能中文输入,完全免费,它不香吗?

可图开源地址:

https://github.com/Kwai-Kolors/Kolors

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OuIZVSOpHGU0wXKkvvdFGWeQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券