Omost 是一个创新的项目,它利用大型语言模型(LLM)的编码能力来生成图像,特别是通过图像合成技术。项目的名称“Omost”发音类似于“almost”,寓意着使用该项目后,用户的图像生成工作几乎可以完成。同时,“O”代表“omni”(多模态),而“most”则表示项目旨在最大化模型的潜力。
Omost 提供了一些LLM模型,这些模型能够编写代码,并与Omost的虚拟画布代理协作,合成图像的视觉内容。这个虚拟画布能够与特定的图像生成器结合,以实际生成图像。
目前,Omost 提供了3个基于Llama3和Phi3变种的预训练LLM模型。这些模型使用混合数据进行训练,包括:
通过这些训练数据,Omost 的模型能够生成高质量的图像,为用户提供一个强大的图像合成工具。
安装很简单,只需运行以下命令:
原理请看github上的readme(文末有链接),已经说的很清楚了。
简单说就是:说一句简单的 prompt,LLM帮你丰富,详细规划图像,最后生成高质量可控图像。
纸上得来终觉浅,绝知此事要躬行。实际操作一把:
界面还是比较清楚。
右边输入 prompt,点击“submit”。
然后界面就会生成一大片详细设计描述。
生成完成,点击左边的“Render the Image!”。稍等片刻,图片生成!
我们来看下生成的脚本。
我输入的是“Happy Children’s Day”,下面生成了一大堆图像设计描述。
最后生成了图像。效果还不错。
最后给大家看几张我生成的图,效果都还不错。
问题就是有点慢,几分钟一张图。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。