前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >速来白嫖!免费!快手公布了AI绘画大模型!

速来白嫖!免费!快手公布了AI绘画大模型!

作者头像
一个正经的测试
发布2024-07-18 17:43:01
610
发布2024-07-18 17:43:01
举报
文章被收录于专栏:一个正经的测试

一、 Kolors

今天快手悄无声息的开源了自家AI绘画大模——kolors

这款模型基于潜在扩散技术,是一个大规模的文本到图像生成系统,展现了卓越的视觉质量、复杂语义处理能力以及中英文文本渲染效果。

附上地址链接:https://kolors.kuaishou.com/

附上技术报告:https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf

我们来看一下评测数据

二、评测表现

为了全面比较 Kolors 与其他模型的生成能力,快手构建了包含人工评估、机器评估的全面评测内容。在相关基准评测中,Kolors 具有非常有竞争力的表现,达到业界领先水平。构建了一个包含14种垂类,12个挑战项,总数量为一千多个 prompt 的文生图评估集 KolorsPrompts。在 KolorsPrompts 上,我们收集了 Kolors 与市面上常见的 SOTA 级别的开源/闭源系统的文生图结果,并进行了人工评测和机器评测。

人工评测

不得不说,从数据上看,遥遥领先与其他家模型

咋也不知道这个人工评测准不准

至少从数据和图片质量的生成效果来说,与其他厂商的大模型相比,也是不遑多让

再来看看机器评测

采用 MPS (Multi-dimensional Human preference Score) 来评估上述模型。以 KolorsPrompts 作为基础评估数据集,计算多个模型的 MPS 指标。Kolors 实现了最高的MPS 指标,这与人工评估的指标一致

三、Kolors的与众不同之处

Kolors模型经过了数十亿对文本和图像的深度训练,这不仅提升了模型对视觉元素的捕捉能力,也增强了其对复杂语义的理解。以下是Kolors的几个突出优势:

  1. 卓越的视觉质量
    • Kolors生成的图像在视觉效果上取得了显著进步。无论是色彩的丰富性、细节的清晰度,还是整体的和谐美感,Kolors都展现了其卓越的图像生成能力。
  2. 精确的复杂语义捕捉
    • 在处理复杂语义的文本时,Kolors能够准确捕捉并表达其深层含义。不论是抽象的概念还是具体的场景,Kolors都能通过图像进行生动的呈现。
  3. 优秀的中英文文本渲染
    • Kolors支持中英文输入,无论是中文书法的艺术感还是英文的流畅表达,Kolors都能以高水平的文本渲染技术,将文字转化为图像,展现出文字背后的文化韵味和情感色彩。

四、如何使用?

省事玩家 https://kolors.kuaishou.com/ 登录这个官网地址,即可进入官方页面

点击登录注册即可体验

码农选手

🛠️ 快速使用

要求

  • python 3.8及以上版本
  • pytorch 1.13.1及以上版本
  • transformers 4.26.1及以上版本
  • 建议使用CUDA 11.7及以上

1、仓库克隆及依赖安装

代码语言:javascript
复制
apt-get install git-lfs
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors
conda create --name kolors python=3.8
conda activate kolors
pip install -r requirements.txt
python3 setup.py install
代码语言:javascript
复制
2、模型权重下载(链接):
代码语言:javascript
复制
huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors或者
代码语言:javascript
复制
git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors
代码语言:javascript
复制
3、模型推理promot:
代码语言:javascript
复制
python3 scripts/sample.py "一张瓢虫的照片,微距,变焦,高质量,电影,拿着一个牌子,写着“我爱世界”"

四、结论

Kolors的开源为AI绘画领域带来了新的可能性和工具。这款模型不仅在视觉质量、语义捕捉和文本渲染方面表现卓越,而且在多种应用场景中展现了广泛的应用潜力。从创意艺术与设计到教育、电子商务、游戏开发以及新闻媒体,Kolors的多样化功能使其成为各领域从业者的理想选择。

无论是艺术创作、学术研究,还是商业应用,Kolors都能以其先进的技术和卓越的表现力,帮助用户实现更加生动和有吸引力的图像生成效果。通过本文的介绍,希望大家能更好地了解和使用Kolors,在各自的领域中发挥其最大的价值。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一个正经的测试 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 这款模型基于潜在扩散技术,是一个大规模的文本到图像生成系统,展现了卓越的视觉质量、复杂语义处理能力以及中英文文本渲染效果。
  • 🛠️ 快速使用
    • 要求
    相关产品与服务
    大模型图像创作引擎
    大模型图像创作引擎是一款提供 AI 图像生成与处理能力的 API 技术服务,可以结合输入的文本或图片智能创作出与输入相关的图像内容,具有更强大的中文理解能力、更多样化的风格选择,更好支持中文场景下的建筑风景生成、古诗词理解、水墨剪纸等中国元素风格生成,以及各种动漫、游戏风格的高精度图像生成和风格转换,为高质量的内容创作、内容运营提供技术支持。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档