本文主要研究一下Lumina Image 2.0模型的中文提示词进行文生图。
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
python3 -m pip install -r requirements.txt
python3 -u main.py --listen --port=6889 --disable-auto-launch
地址:https://huggingface.co/Comfy-Org/Lumina_Image_2.0_Repackaged/tree/main/all_in_one
cd ~/ComfyUI/models/checkpoints
wget https://hf-mirror.com/Comfy-Org/Lumina_Image_2.0_Repackaged/resolve/main/all_in_one/lumina_2.safetensors?download=true
lumina_2.safetensors大概有10.6GB
打开 https://comfyanonymous.github.io/ComfyUI_examples/lumina2/ 将该图片lumina2_basic_example下载拖拽到ComfyUI即可打开
使用中文提示词:
可爱的动漫女孩,有着巨大的毛茸茸的耳廓狐耳朵和一条大大的蓬松尾巴,金色凌乱的长发,蓝色的眼睛,穿着女仆装,搭配一条长长的黑色金叶图案连衣裙和白色围裙,嘴巴张开着,正在将一个装饰精美的黑森林蛋糕(上面插着蜡烛)放在一座由烛光照亮的古老维多利亚式豪宅的餐桌上。明亮的窗户外面是雾蒙蒙的森林,房间里到处都是昂贵的物品,墙上挂着画作。
负面提示词输入如下
模糊,畸形手指,比例失调,低饱和度,水印
生成的图如下:
Lumina-Image 2.0 是由 上海AI Lab 团队开发的开源文生图模型,参数量仅 2.6B,基于扩散Transformer(DiT)架构,融合了高效的图像编解码器(FLUX-VAE-16CH)和文本编码器(Gemma-2-2B),原生支持中、英、日、韩提示词,中文生成效果尤其惊艳。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。