快手突然开源文生图模型可图Kolors!可图能稳定生成中文,还在评分里面呈现能打赢MJ6的能力。
AI赋能实验室第一时间实测,非常适合作为人像摄影的初稿阶段工具。我们也已经完成了可图模型在COMFYUI的测试,证实可图可以非常好的支持原生中文输入。
魔幻题材,科幻主题,末世时代,男人在一个大型电脑屏幕前编写剧本,同时,一个没有实体的虚拟机器人从屏幕中探出身来,用手指着男人的头部。桌子上有个牌子写着“可图”
总体来说,可图虽然属于魔改级SDXL,但图像生成的实力至少和腾讯的混元DIT在同一级别。主要特点是:
1、描述词全中文,原生。
2、概念匹配效果不太差。
3、画质起码是SDXL的一流级别。
身穿法国球衣的足球宝贝雕塑,黑色大理石,少女雕塑,摄影艺术,景深,超现实画面,拉斐尔,足球和凯旋门作为背景,写着“2024”的铭牌。
身穿西班牙球衣的足球宝贝雕塑,西班牙少女,大理石材质,白皙,摄影艺术,景深,超现实画面,米开朗基罗,安德烈雷姆烈夫,罗丹,写着“2024”的铭牌。
当然,也不是没有缺点:
中文提示词下文本的理解能力和提示词风格都发生了变化,需要进一步适应中文提示词的规则。
另外,部分提示词的权重是存在问题的,比如全身图的触发就很迷,大部分出图都倾向于非全身图,哪怕你重复强调了关键词。
另外,可图的摄影流要达到完整商用能力,contrlnet技术必不可少,需要结合PULID\INSTANTID等技术,还需要工作流上的补全。
目前,可图放出了基本的文生图模型和推理代码,后面还有一系列的辅助模型如LORA和CONTROLNET等将会陆续放出。可以期待!
从画质上,不说一定打赢MJ6吧,能平替是肯定的,而且还能中文输入,完全免费,它不香吗?
可图开源地址:
https://github.com/Kwai-Kolors/Kolors
领取专属 10元无门槛券
私享最新 技术干货