代理服务器设置-不明觉厉的AI绘画,对内容创作者来说有什么用?

AI绘画的展开速度已经超乎咱们的幻想了。

或许不少人会觉得惊讶,两年前AI只能画一些难以辨认的含糊图片,如今,一个没有绘画根底的人用AI输入几个关键词,等候几十秒就能够生成比较精密的著作了,假如再多加练习,部分著作乃至能到达商用的水准。

AI绘画怎么猛然进入技能爆炸的年代了?

从本年2月Disco Diffusion问世,4月MidJourney上线、DALL-E2内测, 到5月和6月Google推出Imagen和Parti,再到7月Stable Diffusion内测、开源,各种AI绘画技能敏捷更迭晋级,有画师感慨几乎是“一天一个样”。

这股浪潮也从国外刮到国内,百度等互联网大厂以及一大批艺术、人工智能从业者和爱好者纷纷投入AI绘画的新范畴。代表途径有文心一格、6pen、Tiamat等等。

与此同时,有关AI绘画的争议和论战越发激烈。近期出圈的一个事情是AI画作《太空歌剧院》在美国科罗拉多州博览会美术比赛中取得“数字艺术/数字润饰相片”类别的最高奖项,结果受到画师们的质疑和抵抗。

关于内容发明者来说,当下要如何了解AI绘画?又有哪些运用场景和亟待探究的问题呢?咱们和多位发明者聊了聊,并结合各途径的事例来剖析。

文章分为三部分:第一部分是对AI绘画的基本原理和展开前史的简略科普,第二部排列举了一些AI绘画的详细运用事例,第三部分是探讨现在AI绘画存在的争议和问题,期望对感兴趣的朋友有所协助,欢迎友爱交流。

AI绘画是资料拼贴?

首要,咱们在这里讨论的AI绘画主要是经过文本生成图画的计算机程序,即“文生图”(text2image)。

比方这张图是在DALL·E2上由文字“Teddy bears working on new AI research on the moon in the1980s”(1980年代在月球上研讨AI的泰迪熊)生成的。

稍微修正一下描绘,把地址换成水下“underwater with1990s technology”就能得到以下图片:

能够看到,AI绘画并不是对现有资料进行简略的“缝合拼贴”,而是依据文字描绘创建新的图画,必定程度上做到了“触类旁通”,能够协助人类画出各种奇思妙想,这背后是许多而复杂的深度学习练习。

让咱们从AI绘画的技能展开史来开端认识一下文生图的基本原理。

图片

AI绘画展开时刻线,图源“逗砂”

深度学习在计算机视觉范畴的展开能够追溯到2012年,AI学者吴恩达和Jeff Dean等人的猫脸辨认试验(经过1000台电脑发明出多达10亿个衔接的“神经网络”,上万张猫脸图片的模型练习后,最终画出了一个含糊的猫脸),这意味着机器自主学会了辨认猫的面孔。

尔后科学家们在AI图画生成的方向上继续深化研讨,提出了“GAN(生成对抗网络)”,经过生成器与判别器的互相博弈来不断提升生成才能,就像有一位老师在检查学生画得像不像,不像的话学生就从头修正,如此循环。

2015~2020年,从GAN开端,AI绘画模型进行了许多探究,但这个时候AI还做不到依据文字来生成图片。

直到2021年1月,代理服务器设置OpenAI接连发布了两个衔接文本和图画的神经网络DALL·E和CLIP。CLIP(跨模态预练习模型)基于大规模图文数据集进行了比照学习练习,能够提取文本和视觉特征来互相匹配。也便是说,AI能够将文字“猫”与猫的图画相相关,且相关的特征是十分丰富的。

图片

在CLIP推出一年后,2022年2月,Somnai等几个开源社区的工程师制造了一款AI图画生成器Disco Diffusion(简称DD),它能了解输入的主体内容、艺术风格、结构视角和润饰词,且生成的图片更华丽。DD作为免费开源项目搭载在Google Colab上,运用浏览器即可运行,AI绘画从此走入了大众视界。

Disco Diffusion默认画作,输入文字:A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”, “yellow color scheme”(一座奇特灯塔的美丽画作,它的光辉照射在汹涌的血海中,Greg rutkowski和Thomas kinkade风格,A站盛行,黄色配色方案)

不过DD并不是“CLIP+GAN”的组合,而是“CLIP+Diffusion”,Diffusion(分散模型)也是当下最抢手的图画生成模型。

这个半路杀出的Diffusion有什么不同?

能够看到DD图片生成的进程是从含糊逐渐变得明晰

image.png

每张图画本质是一个像素点矩阵,Diffusion先是接连给图画添加高斯噪声,图画变成了一堆随机噪声,然后经过逆向回转这个噪声进程来学习康复数据。

图片

图片

Diffusion模型的的分散进程和逆分散进程

所以当咱们在DD输入一段文字描绘时,程序以Diffusion随机生成的噪声为起点,CLIP会继续计算检查画面与描绘的一致性,继续迭代修正,直到噪声变成正确相关的线条和色彩,然后生成满足需求的图画。

AI艺术研讨者“FeiArt”以为,基于生成模型的AI绘画是一个“有码到无码”的艺术。

尽管DD完成了文生图,但由于是开源的,上手门槛比较高,光是满屏的代码或许就要劝退新手小白了。

图片

“一开端要自己调整二三十个参数,以及编制比较适宜的Prompt,才能画出比较抱负的画面作用,关于运用者了解算法逻辑和写关键词的要求十分高。不过现在的版本基本不必调参数,只要写好关键词就能够了。”数字艺术家“脑玩家mindplayer”向咱们介绍了DD的运用体会,她从本年3月开端在B站和小红书共享AI绘画著作和教程,是国内最早一批玩家。

DD出圈不到一个月,很快就有更老练、门槛更低的产品出现了——Midjourney(简称MJ),现在社区成员超260万。

MJ搭载在Discord上(国外盛行的虚拟交际途径),是一个揭露的社区,用户加入后在聊天框输入描绘文字发送,群内的机器人会回复生成图片。

每次默认会生成4张图片,用户能够点击图片下方的按钮继续深化(u1/2/3/4),或许在此根底上生成同一风格、部分变化的图片(v1/2/3/4)。

此刻AI绘画的质感和幻想力已经展现出了必定的审美水平缓艺术作用,上文说到的获奖著作《太空歌剧院》便是由MJ生成的,作者在此根底上进行了修正完善。

咱们在谷歌趋势查找关键词“ai painting”,能够看到近两年的热度敏捷上升,尤其本年7月以来到达最高峰。

很大一部分热度要归功于Stable Diffusion(简称SD)。

“比较DD,MJ或许更杰出著作的质量和绝无仅有的深化交互。而SD就胜在超全面的风格和极快的速度,而且对新手来说比较友爱,网页版简洁易上手,免费的用量也能够体会不少的图。”AI绘画规划师“鱼摆摆”说道。

SD新账号能够免费运用200点数,每次生成依据画面精密程度、张数等参数消耗不同的点数,最少1次1点。不过SD是彻底开源的,用户能够挑选线上或布置到本地来运用。

6pen最近在微博发起了快闪活动,用户写关键词发微博即可体会用SD生成图片

SD出现后,AI绘画的浪潮越发汹涌,多位发明者表明或许前两天还在讨论的功能,第二天就被开发出来了。除了文生图,如今以图生图(image to image)、图画修正(inpainting)、图画拓宽(outpainting)等功能都已完成,AI绘画也能驾驭国风、二次元等多元风格了。

image.png

Waifu Diffusion(二次元老婆生成器)

image.png

Tiamat 国风管线

AI绘画在内容范畴如何运用?

在现阶段,关于艺术、影视、广告、修建、时髦、新媒体等构思职业从业者来说,AI绘画正成为一个强大的帮手,能够辅佐日常作业,进步产出功率,下降时刻和经济本钱。

比方“脑玩家mindplayer”运用AI辅佐规划LOGO。本来的流程是先构思、手绘,再输入电脑调整,中间或许还要跟其他搭档配合,来回沟通会消耗不少时刻精力,但有了AI的协助就十分高效了,“我告知AI我要做什么,咱们磨合一个小时活儿就干完了”。

图片

在AI根底上进行优化,著作拿去商用也不是难事。

影视导演海辛在大众号“全民熊猫方案”共享了其公司将AI规划融入影视美术规划中的初度测验——“这街5·李承铉队长大秀”,作业流大致为Midjourney -> Blender -> UE虚拟制片。

他表明在极短的制片筹备时刻内,AI发明大幅度地进步了功率,证明了AI投入到工业化运用是彻底可行的。

除了辅佐规划,AI也能激起构思创意。像服装博主“JINNY ”、婚礼策划师“哎呀呀哎吔吔”运用AI生成的概念图作为规划参阅。

image.png

PPT规划师、艺术博主“Simon_阿文”经常共享AI职业资讯和实用东西,他测验用AI生成无缝纹理贴图,规划资料的获取变得更自在了。

数字艺术家、小红书博主“对方正在画图”告知咱们,详细运用要看发明者的知识布景和prompt的写作才能,不同职业布景的人写出的词、画出的内容很不相同。

这些从业者发布在网上的著作让更多人看到了AI绘画的或许性,非专业人士也跃跃欲试,期望大展身手。有观念以为专业人士在AI绘画上会更有优势,用起来更称心如意,实际上这个优势跟着技能迭代已经在缩小了。

“之前一个人从不会画画到能画出漂亮的、可读解的图画,或许需要许多年的练习。可是现在,有一个比较熟悉AI绘画体系的人教你的话,或许两三天就能学会大约的描绘办法,再学习精进的时刻本钱下降许多了。”“脑玩家mindplayer”说道。

“人人都能够是艺术家”,咱们列举了几个AI绘画在内容范畴的运用方向。

1. 有经验的发明者能够用AI拓宽新的内容体裁,立异互动方法。

“大谷Spitzer”拿手修正旧相片和视频,现在他能结合AI绘画与手绘来“还原”莫奈1875年绘制的印象派油画《撑阳伞的女人》的写实风格场景。

他经过选取多个部分区域用AI进行绘画生成,再辅佐以手绘进行润饰细节和完善衔接处,最终完成了这幅著作。

百万粉航空媒体自在撰稿人、航空画画家白玮,近期发布了自己用AI制造的漫画,是赛博式的志怪体裁。

跟着技能展开,发明者途径方面也将给予更多AI东西支撑,新的内容玩法值得期待。

比方本年9月百度万象大会上推出了“发明者AI助理团”,经过文心大模型、文心一格、图文转视频等技能,为发明者供给“AI案牍助理”、“AI插画助理”、“AI视频制造助理”,协助发明者完成“一个人成为一支部队”。

图片

2. 将AI图片实体化等进一步变现增收。

“鱼摆摆”基于AI生成的著作做了许多范畴的扩展和测验,比方实体化成为卡牌游戏的卡片角色、拼图、实体墙绘彩绘资料、文创产品等等,也有做AI绘画教育课程。

此外,还有发明者将AI生成图片进一步优化做成数字藏品,上链发售。

image.png

3. 图文作者拥抱“配图自在”,能够测验自己生成符合内容的封面图和插图了。

大众号“槽边往事”从5月18日以来的封面图基本是作者和菜头自己用AI生成的,结尾附上了部分图片的描绘词,他还在文章中共享了发明心得。

image.png

本文的封面图也是咱们初度运用Stable Diffusion生成的,“一个女生在书房里坐在桌前,桌上有一台笔记本电脑,窗外是秋天,有金黄的银杏树”,未经过二次修正。

4. 二创门槛下降,UGC内容数量增多。

现在入门AI绘画越来越快捷了,新手不会写关键词,能够去爱好者创建的检索网站和群内“抄作业”,SD也能够接入Photoshop插件,发明门槛更低了。

借助AI生成图片的才能,不会绘画的用户有时机完成自己的奇思妙想,出于爱好做一些小说插图、音乐MV、鬼畜玩梗等二创,然后跨入内容发明的大门。

image.png

UP主“哀荣四泻”用AI为歌曲作画

5. 延伸探究AI生成视频。

AI绘画的下一步便是视频。近期AI著作《乌鸦》取得了2022年戛纳电影短片节最佳短片,据作者Glenn Marshall介绍,这部著作将真人舞蹈视频资料《Painted》输入OpenAI的CLIP,然后体系依据描绘“荒芜风景中的乌鸦画”转化为动画。

图片

UP主“自在云朵”运用Disco Diffusion绘制,经由Topaz Video Enhance AI优化扩大,复刻了周杰伦新歌《最巨大的著作》的MV,播映量达83万,这是他B站投稿中现在播映最高的著作。

据百度文心方面介绍,AI生成视频,是AI生成图画的一种延伸。从技能本质上看,视频能够以为是多张“图片”,即视频帧构成的序列,且序列上各帧之间有画面、逻辑等层面的相关。因此,从严厉的技能抽象层面出发,AI生成视频是相对更难完成的。

当前文生图技能能够经过简略的技能组合,例如分步骤分散生成等方法,将生成图画扩展到生成视频,但作用还不能令人满意。总结来说,AI依照生成图画的方法生成视频,仍处于前沿探究阶段。

AI绘画仍待探究的问题

AI绘画的飞速展开也伴跟着许多争议和问题。

“脑玩家mindplayer”表明,“AI绘画作为一个东西能够敏捷被运用,人人都能够画出自己抱负的国际,可是之后怎么办?这或许是职业界外的人都在思考的问题。”

艺术相关从业者忧虑的是自己会不会被AI取代,因此失业。

图片

本年8月,《大西洋月刊》文章中运用Midjourney发明的图片作为插图引发了许多争议,假如媒体在未来许多运用AI绘图,那么插画师、摄影师的生存空间会不会被挤压,乃至职业都将覆灭呢?

确实,人工智能的力量会对人们的生活带来很大变化,未来技能普及后不可避免会取代一部分重复性较高的初级岗位,但“艺术已死”的说法真的与现实相符吗?AI绘画具有发明性吗?

Midjourney创始人David Holz曾在每周三Office Hour时刻,答复了这个提问:

<p “=””>发明力本身有许多的方法,假如说是将两个不同的概念混合在一起,像是赛博朋克和洋葱,也许前史上从未有过做赛博朋克洋葱的人类。在将两个不同概念混合在一起的才能上,AI现在基本是人类的水平。但我以为艺术家不仅仅是关于图画的发生者,艺术往往是关于故事和情感的,而AI没有故事和情感,AI发明的印象的叙事来源于运用TA的人。<p “=””>贝壳皆来自大海,但海洋非造物者。美石皆来自川河,但河流非孕育者。这套体系并无发明的才能,但美能够来自其中。AI绘画本质如同行云,TA并无任何片面的意愿。

尽管乐观的从业者纷纷投入研讨AI绘画,但在职业上下游,受到冲击的付费图库首要用行动表明了抵抗。

近来,继Newgrounds、PurplePort和FurAffinity后,图库服务商Getty Images制止上传、出售运用AI生成图片,这意味着由DALL·E、Midjourney和Stable Diffusion等东西生成的著作将无法上传并取得任何收入。并且,之前上传途径的AI生成图片也一概作删除处理。

Getty Images首席执行官Craig Peters表明,该禁令是出于对AI生成内容合法性的忧虑以及保护网站客户的希望,但他并未泄漏Getty Images是否由于出售AI生成著作而面对诉讼胶葛。

图片

实际上,现在海内外关于AI生成图片的合规性颇有争议。

上文咱们谈到AI生成图画的原理是深度学习了许多图文数据,会抓取网络揭露的别人著作,生成的图片与练习的著作相似,乃至有时还会混入原创水印痕迹,所以有观念以为练习库涉嫌抄袭和侵权,部分从业者也揭露表明制止AI学习自己的著作。近期被抵抗下线的日本AI绘画途径micmic便是一个典型例子。

涉及到商业运用时,AI生成图片的版权到底归谁一切?这个问题不同途径都有各自的说法,详细还要看对应的版权说明。

<p “=””>DALL·E:<p “=””>https://labs.openai.com/policies/content-policy?continueFlag=ef7d16db9473cdc8d5561a6340adbe96<p “=””>Midjourney:<p “=””>https://midjourney.gitbook.io/docs/terms-of-service?continueFlag=ef7d16db9473cdc8d5561a6340adbe96<p “=””>Stable Diffusion :<p “=””>https://stability.ai/stablediffusion-terms-of-service?continueFlag=ef7d16db9473cdc8d5561a6340adbe96

有的途径表明归于生成者,比方6Pen声明不保存版权,生成的图片版权都归属生成者,可随意自用商用。有的归于途径,有的彻底开源,不归于任何人。

依据Midjourney的服务协议,输入prompt的人享有生成图画的版权,但关于prompt版权的归属却没有定论。据调查,现在业界已出现贩卖文本prompt、AI洗稿的现象,还有甚者直接盗图卖图,一些壁纸号是重灾区,所以许多发明者挑选不揭露著作的prompt,标注制止转载和商用。

image.png

一般AI绘画商用避免侵权的做法是添加独创性,将AI作为辅佐或根底资料。“Simon_阿文”以为,假如有以下一种或许多种状况,主张不要商用:

【1】当你运用了风格鲜明的艺术家作为关键词时,请不要直接商用,尤其是在世的艺术家;【2】当你运用了某部商业著作作为关键词时,请不要直接商用;【3】欢迎依照这个思路补充。

关于版权问题,百度文心方面表明对图片版权十分重视,假如途径未来开放出来的生成图片侵犯到原作者权益,百度会供给投诉反馈通道,为相关权力人供给权力救济途径,敏捷处理。“AI文生图的版权问题是国内外法令都在继续探讨的方向,百度会跟进国内外展开状况,结合国内法令法规,有最新进展会更新给大家。”

此外,AI本身没有价值判断,只是提取练习库数据的特征与人们输入的数据相对应,当人们故意输入暴力、血腥、涉黄等灵敏信息,或将生成的图片用于虚拟事实时,AI也或许随之陷入道德道德的窘境。在这方面,DALL·E2做了许多限制和干涉,比方减少性别偏见的发生、避免练习模型生成逼真的个人面孔。

人工智能是个新式职业,能够看到相关的职业标准正在向前迈进。

10月1日起施行的《上海市促进人工智能产业展开法令》立法确立了人工智能产品和服务的行为底线,明确相关主体展开人工智能研发和运用,应当恪守法令、法规规则,增强道德意识,并不得从事相关制止行为。比方制止供给危害用户人身或许财产安全、损害个人隐私或许个人信息权益的产品和服务;制止运用算法技能施行价格歧视或许消费欺诈等损害顾客权益的行为,施行垄断或许不正当竞争等行为等。

纵观内容生态的展开,大致能够分成四个阶段:专业生成内容(PGC)、用户生成内容(UGC)、AI辅佐生产内容、AI生成内容(AIGC)。AIGC(Artificial intelligence-generated content)即经过AI技能来自动或辅佐生成内容的生产方法。

图片

图源量子位智库《AIGC/AI生成内容产业展望报告》

“未来十年,AIGC将颠覆现有内容生产形式,能够完成以十分之一的本钱,以百倍千倍的生产速度,发明出有独特价值和独立视角的内容。”百度资深副总裁、百度移动生态工作群组(MEG)总经理何俊杰在2022万象大会上说道。

能够预见的是,未来人工智能将会深化影响各类内容发明范畴,潘多拉的魔盒已然打开,痛苦与期望并存。

共有 0 条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注