快手开源可图Kolors！原生支持中文，实测送上！足够挑战MidJourney!

文章来源：企鹅号 - AI赋能实验室

快手突然开源文生图模型可图Kolors！可图能稳定生成中文，还在评分里面呈现能打赢MJ6的能力。

AI赋能实验室第一时间实测，非常适合作为人像摄影的初稿阶段工具。我们也已经完成了可图模型在COMFYUI的测试，证实可图可以非常好的支持原生中文输入。

魔幻题材，科幻主题，末世时代，男人在一个大型电脑屏幕前编写剧本，同时，一个没有实体的虚拟机器人从屏幕中探出身来，用手指着男人的头部。桌子上有个牌子写着“可图”

总体来说，可图虽然属于魔改级SDXL，但图像生成的实力至少和腾讯的混元DIT在同一级别。主要特点是：

1、描述词全中文，原生。

2、概念匹配效果不太差。

3、画质起码是SDXL的一流级别。

身穿法国球衣的足球宝贝雕塑，黑色大理石，少女雕塑，摄影艺术，景深，超现实画面，拉斐尔，足球和凯旋门作为背景，写着“2024”的铭牌。

身穿西班牙球衣的足球宝贝雕塑，西班牙少女，大理石材质，白皙，摄影艺术，景深，超现实画面，米开朗基罗，安德烈雷姆烈夫，罗丹，写着“2024”的铭牌。

当然，也不是没有缺点：

中文提示词下文本的理解能力和提示词风格都发生了变化，需要进一步适应中文提示词的规则。

另外，部分提示词的权重是存在问题的，比如全身图的触发就很迷，大部分出图都倾向于非全身图，哪怕你重复强调了关键词。

另外，可图的摄影流要达到完整商用能力，contrlnet技术必不可少，需要结合PULID\INSTANTID等技术，还需要工作流上的补全。

目前，可图放出了基本的文生图模型和推理代码，后面还有一系列的辅助模型如LORA和CONTROLNET等将会陆续放出。可以期待！

从画质上，不说一定打赢MJ6吧，能平替是肯定的，而且还能中文输入，完全免费，它不香吗？

可图开源地址：

https://github.com/Kwai-Kolors/Kolors

相关快讯