当AI开始画画

2022-09-19 16:16:40 来源: 《环球》杂志

 

阿文用Disco Diffusion 生成的“星空下的向日葵花海”

    今年美国科罗拉多州博览会的艺术比赛中,游戏设计师杰森·艾伦使用AI绘图工具Midjourney创作的作品《太空歌剧院》获得第一名,很快在网络上引起激烈的讨论,其中很大一部分争议聚焦在:AI会不会替代人类画家?

文/《环球》杂志记者 乐艳娜 实习生 詹远航

编辑/马琼

  想要梵高为你画一幅画?只需输入几个关键词就能实现——这是人工智能(AI)在艺术领域的新拓展。扩散模型(Diffusion Model)等技术的出现,已让AI生成图像成为现实。

层出不穷

  AI绘画从想象变成现实,有赖于一些重要的产品问世。

  2021年1月,人工智能研究公司Open AI开发的文本生成图像工具DALL·E面世。DALL·E这个名字来自超现实主义画家达利和《机器人总动员》中的机器人瓦力。

  正如它的名字所暗示的,DALL·E是一个能创作超现实画作的机器人,可以从自然语言描述中生成图像。但那时的它生成的图像还比较简单,比如,你可以利用它生成牛油果形的扶手椅等。

  同年12月,另一款可以直接在手机应用商店下载的软件Dream by WOMBO上架,由于使用便捷被很多人熟知,但生成的图像质量仍比较低。

  真正的转折点是2022年1月Disco Diffusion的出现。使用者只需输入几个关键词,就能生成对应的图像,如果你想要某位大师的画风或者赛博朋克风格,只需再加入相关描述语,Disco Diffusion都能生成令人惊艳的效果图。

  阿文是国内最早一批接触AI绘画的人,作为一个PPT设计师,他拥有丰富的计算机图像创作经验和艺术素材积累。初次使用Disco Diffusion,阿文就被AI绘画的效果震惊:在他写下“星空下的向日葵花海”后,AI用梵高的画风生成了梦境般的效果图,展现出不输人类的画技。

  今年4月,阿文开始在社交媒体上分享Disco Diffusion的成果图,也整理制作了初学者入门的中文教程,很多初学者通过他的教程开始接触这一软件,也使阿文的微博粉丝量短短几个月内达到90万。

  阿文向《环球》杂志记者形容,Disco Diffusion的特点是“不确定性”,这种不确定性能给人提供更多的灵感,但也让它每次生成作品就像开盲盒一样,无法稳定输出。所以在AI绘画的讨论社区中,使用者们讨论最多的话题就是如何用更精准的描述词得到自己想要的画面。

  阿文表示,人们在尽情地使用自己的想象力组合各种元素:兔子太空员在星际旅行、赛博朋克风的宫殿、新海诚风格的田野……由于训练数据库非常庞大,Disco Diffusion能实现大多数画家风格和常见事物元素的融合,而它的AI生成计算借助云端服务器,对用户的本地硬件没有很高的要求,降低了入门门槛,让更多人得以了解和方便地体验AI绘画。

开放共建

  除了文字生成图像的功能外,Disco Diffusion还支持导入参考图生成图像和生成视频等功能。

  相较于人,AI绘画的作品更加疯狂大胆,宏观画面令人震撼,但对动物和人的细节处理还有很多不足,人的脸部、手部细节经常会很怪异或者缺失。同时,它的界面只是简陋地堆满英文代码,生成一幅画的时间长达半小时到数小时,这无疑会“劝退”许多初学者。

  但这些问题很快就被后来居上的开发者们解决了。今年3月面世的Midjourney拥有更简洁的操作界面,在人像的细节处理上也表现得更好,并且将生成一幅画的时间缩短到了60秒。

  1个月后,Open AI推出了DALL·E 2,它比初代DALL·E的清晰度高4倍,生成图像的速度达到1分钟10张图,并且能生成更真实准确的图像,在生成的图像上还可以直接涂抹修改。

  “Disco Diffusion生成的宏伟场景和笔触感很让人震撼,但我最多只能用它做叠背景的素材,但是DALL·E 2的出现颠覆了我的想法,它完全有创作能力生成一些很具体的人像和物体。”阿文说他曾尝试用DALL·E 2给油画里的人物改变发型、让背对观众的大象转身……这些对于人类画家来说特别刁钻的“甲方需求”,DALL·E 2都能非常轻松地完成,甚至还能根据原有画作自动补充扩展图像,这样的人工智能自主生成内容(AIGC)被认为是当前一个重要的技术趋势。

  但AI绘画的发展还不止于此,仅仅1个月后,谷歌就在新发布的论文中介绍了它推出的AI绘图工具Imagen,直接对标DALL·E 2,号称其拥有“前所未有的写实感和深度的语言理解”,并在今年6月推出了像素更高、细节更丰富的AI绘图工具Parti。

  与此同时,各大科技公司纷纷涉足AI绘画领域,Meta AI开发了Make-A-Scene,可以根据任意给定的形状和文字描述生成图片;微软和北京大学合作开发了以“女娲”为名的AI绘图工具NüWA;百度推出“文心·一格”,可以用中文描述词生成图像。

  虽然各种AI绘画软件层出不穷,但很多都需要申请内测资格才能使用,普通用户想体验更加丰富的功能,还需要等待或者付费。这一现状在8月22日被改变,当前功能最强大的AI绘图工具之一的Stable Diffusion宣布开源,任何用户都可以使用它开源的技术,借助云端或者本地服务器生成图像。

  更重要的是,在开源社区人们可以对它进行各种迭代优化,仅仅1周的时间,就出现了各种版本和使用教程,它甚至被做成插件加入到修图软件中,实现无缝拼接补充图片。

  9月1日,2022世界人工智能大会(WAIC)在上海开幕,Tiamat团队在会场展示了他们AI绘制的作品,并宣布在半个月后会从内测变为正式上线开放。

  Tiamat是目前国内前沿的AI图像生成引擎之一,除了提供AI绘图工具,Tiamat还打造了一个交流社区,爱好者们可以交流AI生成艺术的相关话题。

  在社区中,爱好者们被称为“魔法师”,他们对于想要生成图像的文字描述就是“魔法咒语”,对画幅、清晰度、风格等描述是“药水配方”,输入配方后只需要几分钟就能得到一张AI生成的对应图像。这样的“AI魔法”让刚刚接触到这个领域的爱好者们非常惊喜,自3月上线后就在各大社交媒体平台受到关注。

  青柑是Tiamat的创始人之一,据她介绍,“Tiamat不只是一个工具,我们的定位是一个AI生成艺术社区,希望每一个加入社区的人都能共建社区,交流探讨未来AI生成艺术的一切可能性。”

  在同一会场,百度也利用“文心·一格”现场生成了梵高风格的“外滩游船”和莫奈风格的“印象生煎”等具有上海风貌的多种风格艺术作品。在此之前,“文心·一格”还被用于补全名画《富春山居图》,补充的部分与原作风格非常近似。

伦理隐忧

  在AI绘画飞速发展的同时,一些艺术家开始担忧自己是否会被AI绘画替代。今年美国科罗拉多州博览会的艺术比赛中,游戏设计师杰森·艾伦使用AI绘图工具Midjourney创作的作品《太空歌剧院》获得第一名,很快在网络上引起激烈的讨论,其中很大一部分争议聚焦在:AI会不会代替人类画家?

  对于这个问题,亲身体验过各种AI绘图工具的阿文觉得那些对艺术风格、艺术史更了解的画家在未来仍然会有优势。“认识的艺术家越多,你生成的AI作品就会更加自由,风格就更加多变,而不是仅使用梵高或者莫奈这些大众熟悉的艺术家。所以AI不会让我失业,而我大概率能早点下班。”阿文说。

  而青柑对《环球》杂志记者表示:“更好的情况是,Tiamat会成为辅助工具,能帮助更多创作者去创作。现在也有很多小伙伴在这方面进行了实践,很好地将AI艺术融入了自己的创作之中,越来越多的人正在接受和拥抱新技术带来的许多可能。”

  除了是否会替代人类画家的讨论外,关于AI绘画其他的伦理问题也逐渐浮现,如AI模仿画风的侵权问题、AI生成暴力图片、AI加重刻板印象等。对此,阿文表示:“你可以把AI看成是一个能力很强的人类画家,人类不能做的事情它同样不能做。”

  而Open AI在DALL·E 2的使用声明中提到:“我们限制了 DALL·E 2 生成暴力、仇恨或成人图像的能力。通过从训练数据中删除最明确的内容,我们最大限度地减少了 DALL·E 2 对这些概念的接触。我们还使用了先进的技术来防止生成逼真的真实个人面孔,包括公众人物的面孔。”

  同时,由于学习的数据集不同,AI可能会学习到人类的刻板印象、种族歧视和性别歧视等,Open AI团队提到他们正在努力增加措施限制这些情况的出现。Tiamat则是把能识别到人类面部的数据主动剔除,避免用户使用“画人”的功能。

来源:2022年9月21日出版的《环球》杂志 第19期

《环球》杂志授权使用,如需转载,请与本刊联系。

更多内容敬请关注《环球》杂志官方微博、微信:“环球杂志”。

手机版