首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能作图战胜人类?它是怎么做到的?

上周,当杰森艾伦(Jason M. Allen)将他的“空间剧院”提交给科罗拉多州博览会的美术比赛时,这幅华丽的版画立即大获成功,在“数字操纵摄影”类别中击败了其他 20 位艺术家,赢得了第一名的蓝色丝带和 300 美元的奖金。

艾伦现年 39 岁,住在家乡科罗拉多斯普林斯以南,经营着一家名为Incarnate Games的公司,制作桌面奇幻游戏。他高中毕业后进入空军,并在科罗拉多技术学校获得计算机科学学位。他不认为自己是艺术家,之前从未参加过艺术比赛。

他是如何利用AI引擎画出这幅图的?

早些时候他开始使用人工智能驱动的艺术工具:WOMBO Dream、NightCafe、starryai。然后,有人邀请他去 Midjourney,他毅然决然地答应了。

Midjourney 已成为最受欢迎的 AI 艺术生成器之一,主要是因为它允许任何人根据命令自由创建新图像。使用提示“/imagine”,用户可以输入他们想看到的任何内容,人工智能将在 60 秒内返回四个新创建的图像。用户还可以要求人工智能通过对同一想法的新变化来改善或“升级”视觉质量。

支付公司账户费用后,艾伦开始生成数千张图像,每次创作都会更改文本提示。他尝试了新的设置、场景和效果。他要求以达芬奇和美国迷幻艺术家亚历克斯格雷风格的图像。

AI作画如何实现的?

从几年前开始,每隔一段时间就会有一个新的“自动作画AI”跳出来,凭借精心调试的案例吸足眼球。但到了大多数人手里,却又只能画出仿佛脱胎于克苏鲁神话的诡异产物,好奇心的热乎劲冷却后就被快速淡忘。

直到最近,一批风格独特的画作开始在网上流行。天马行空的构图、丰富的细节加上风格统一的笔触无不彰显着作者的艺术审美,只不过它们是出自AI之手。

AI绘图中用到的各种模型,如Disco DIffusion使用的CLIP(Contrastive Language-Image Pre-Training)等,它是神经网络没错,但是和以前的机器学习有两个区别,一是“多模态”,二是“零样本”

“多模态”:意思是它同时训练AI做了两件事,一是自然语言处理,二是计算机视觉。大白话讲,就是让计算机理解人类语言,和让计算机像人眼一样观察理解世界。以前的机器学习都是只干其中一项就了不起了,而CLIP模型是在两者间建立了一个桥梁,而且还是某种很强力的联系,这是它的伟大之处之一。

“零样本”:意思是,它可以输出人类从来没有训练过它的结果。以前的机器学习,让AI画猫,它就学会了画猫。让它画狗,它就学会了画狗。但你没教过它画浣熊,让它画会怎样?会报错,画不出来。而CLIP模型是可以画它没有训练过的内容的,也就是说我一张浣熊的照片都没给它看过,它居然能画出来!而且可能画得还挺像。这也是为何它会被用来进行艺术创作。这是它的伟大之处之二。

你认为人工智能绘画可以取代人类吗?欢迎留言讨论。我是美乐!感受科技之美,乐享生活!我们下期再见~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220909A03IYE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券