腾讯云最近推出了高性能应用服务 HAI,这个服务可以在几分钟之内就可以一键部署多种 AIGC 场景,比如AI作画、AI视频、AI写作等。本文就基于HAI部署一个AI 绘画环境 ,实现AI生成小说图片的功能。
高性能应用服务(Hyper Application Inventor,HAI)是一款面向 AI 和科学计算的 GPU/NPU 应用服务产品,提供即插即用的强大算力和常见环境。它可以帮助中小企业和开发者快速部署语言模型(LLM)、AI 绘图、数据科学等高性能应用,原生集成配套的开发工具和组件,大大提升应用层的开发生产效率。
相比使用GPU 云服务器,HAI有以下几点优势:
现在还是春季特惠活动期间,可以1元抢购HAI 8 小时 使用券,进入高性能应用服务 HAI后,在下图进行购买 HAI 服务。
购买成功后就可以移步HAI控制台进行授权开通。
HAI开通后,部署一个AI应用就非常简单了。这里创建一个AI作画应用 StableDiffusion WebUI,只需要两步:
“新建”按钮如下图。
选择 StableDiffusion WebUI 进行购买。
购买成功后会看到创建中的应用,等待1分钟即可创建成功。
当状态为运行中时,即可通过点击下图红框进入 StableDiffusion WebUI 界面。
Stable Diffusion WebUI是一个基于Stable Diffusion模型的图形界面工具(如下图),通过这个WebUI,用户可以输入他们想要的文本描述,然后系统会根据这些描述自动生成相应的图像。
提示词对于生成图片至关重要,通过提示词可以描述希望生成的图像的内容、风格、画质、画风以及画面中不想出现的内容。
画质提示词一般为:
(masterpiece:1.2), best quality,masterpiece,extremely detailed wallpaper,highers,perfect lighting,8k wallpaper,
意思是生成高质量的、完美的、极其详细的画质。
其中()
中的数字代表该提示词出现在画面中的权重。
如果想要生成二次元的风格,可以填写anime, comic ,gameCG,等提示词。
如果想要生成的画像更逼近人类,那么可以填写 photograph, photorealistic等提示词。
如果喜欢宫崎骏的画风,那么可以填写studio ghibli提示词。
总之,可以按照自己喜欢的风格、画风去填写相关提示词。
生成具体的内容同样需要提示词去描述,比如 人物、年龄、发型、头发颜色、情绪表情、衣服装束、做什么事等等。
而画面中不想出现的内容也称之为负面提示词,比如:
NSFW, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality,((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, (((extra arms and legs))),
其中NSFW为不要出现不适宜工作场所的内容。
当然,如果对提示词的格式、语法不是很熟悉,可以在StableDiffusion WebUI安装一个插件提示词,这样在页面上就可以直接选择想要生成的提示词了。
安装提示词插件如下图,将 https://github.com/Physton/sd-webui-prompt-all-in-one 复制到网址输入框直接安装即可。
在重启WebUI后就可以看到下图这样的中文提示词框,大家可以直接选择人物、服饰、表情动作等提示词。
在Stable Diffusion中,采样器是用于生成图像的一种技术或方法。它决定了模型如何从潜在空间中抽样并生成图像,因此,采样器在生成图像的过程中起着关键作用。
Stable Diffusion支持多种采样器,包括Euler、Euler a、LMS、Heum Euler、DPM和DDIM等。每种采样器都有其独特的特性和运算速度,可以根据应用场景进行选择。
接下来,基于高性能应用服务 HAI搭建的 StableDiffusion WebUI 生成小说图片。
这里举例一个简单的小说场景:
程序员结束一天的工作后,在楼下随意吃了个便饭,巧遇同事,便友好地打了声招呼。饭后,他挤上了熙熙攘攘的地铁,踏上了回家的路。
按照场景描述,可以想象出几个镜头:
根据第一个镜头,可以填写相关的提示词,比如画面中有高楼大厦、人来人往的人群、衬衫和裤子、程序员正在走路等。
这里选择生成宫崎骏的画风,加上画质、画风、画面描述等,完整的提示词如下:
(masterpiece:1.2), best quality,masterpiece,extremely detailed wallpaper,highers,perfect lighting,8k wallpaper,studio ghibli,
1boy, shirt, pants, backpack, sunny, office building, after work, walking, bustling with pedestrians,
将提示词和负面提示词分别填入,点击生成即可,如下图。
其余几个镜头的画面描述内容分别为:
将这些提示词依次填入进行生成,就完成了通过AI生成小说图片的工作了。
最后,展示。
镜头1
镜头2
镜头3
镜头4
镜头5
借助高性能应用服务 HAI,非专业人员也能轻松部署AI绘画应用,真正实现人人皆可用AI,人人理解大模型。开发人员更是可以专注于业务场景,也不用操心GPU、硬盘、带宽这些细节了。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。