这是一张ai生成的平平无奇的照片,但如果把眼睛眯起来,然后将屏幕拿远一点,现在你可以告诉我你看到了什么吗?最近私信和评论问的最多的几个问题,像这种牛,不管你文字该怎么做,logo是如何被无缝植入到图片里的?a i又是怎么生成这样的艺术二维码的呢?巧了,这一大堆花里胡哨的东西,其实是用同一种方法实现的,如果你也对其中的某一个应用感兴趣,那么恭喜你,你可以使用。今天这一期教程就把以上所有利用ai绘画合成文字、形体特效的方法搞明白,并高效掌握多种使用ai绘画实现视觉表达的方式。在接下来的约十五分钟的时间里,我将由浅入深的为你讲解利用stablish塑造文字logo形体的基本操作方式、剖析权重、引导时机等control进阶调节参数的作用,了解great next elimination以及连二维码都能做的全新模型的使用方法。掌握了这些技巧,前面提到的那些所有吸引眼球的内容对你来说就不在话下了。你还可以用它实现各种各样的创意设计、加工修饰,成为一名全能的a i设计师。课程内容难以充实,我建议先点个收藏,然后再开始接下来的学习准备。好,就让我们开始这节课的control max进阶之旅吧。要想完成开头展示的这种a i生成艺术字二维码的效果,你需要先做两手准备,拿一个简单但。
效果出众的应用来举例,就是用ai生成各种材质的艺术字,我把它归结成了一个五步的基本操作。你可以跟着视频走一遍,来体会一下这个流程。第一步,生成文字图。借助一些文本设计软件,生成一张像这样的白底黑字的文字图,上面写下你想要在画面中呈现的文字。如果你有些设计功底,请使用photos shop b类的设计软件,导出常规j p g、p n g格式文件即可。没有接触过photoshop的话,那不妨打开电脑上的word或者w p s,用文档软件打字,在使用诸如微信q q一类的工具截图。第二步,开启c t r l e t,打开stable的fusion,切换到文胸图标签拉到最下方。在你正确安装了control net的情况下,可以在这里展开,将文字图拖入control最上方的这个图片框里,将启用与完美像素模式勾选。
如果你的电脑配置不够,请顺带勾选低显存模式。在下方的模型和预处理器选框里分别选择depth模型和depth midas x处理器。第三步,选择大模型,在最上面的模型框里选择不同风格的模型,它可以为你实现不同风格的绘制效果。模型是ai绘画的灵魂,在系列课第四课与之前的几期模型推荐里,有许多我为你推荐的模型是可以使用的,你也可以在网盘里找到它们的下载方式。这里我选择了magic realistic,是一个真实风格质感的模型,做出来的效果更偏写实化。第四步,书写提示词在界面最上方的两个提示词框里分别输入如下的描述,上面的是正向提示词,用于描述你希望生成的内容。这里请使用英文进行描述,然后用英文半角逗号把它们分隔开。在这些内容之余,我们一般会以一些固定的方式引导a i给我们生成质量更为出彩的图片。
所以可以在后面加入一串这样的高质量提示词,而在生成这类艺术字的过程中,我还喜欢加入solid background、simple background一类的提示词,让背景更加干净,从而令文字更为突出。写在下面的提示词被我们叫做负面提示词,它的作用是用来规避一些我们不想让ai生成的东西,比如低质量的干扰画面的内容。把这一段咒语粘贴进去,就能起到非常不错的效果。最后一步,设置生成图片的各项参数ai绘画的各项参数非常复杂,为了方便,你可以参考我现在为你展示的样子,设定一下参数,这里面最核心的一点是图片的宽和高。你可以按自己所需要的尺寸计算一下画面比例,然后把它折算到一个宽高在五百到一千像素之间的数值。填入不同模型可能有各自适合的采样算法,像我现在使用的magic模型,推荐用eul a来绘制,这也是一个通用性比较强的算法。完成了上述所有操作之后,点击生成的效果,你就拥有了一个用石头组成的石头艺术字体效果了。这个流程是我们接下来的所有应用项目的制作中都通用的那它只能用来做石头吗?当然不止了,我只是拿来举个最简单的例子,那就剖析一下这个流程里的一些细节和它们能起到的作用吧。
首先是提示词,它是生存过程中最为关键的一环,如果你想生成其他风格的文字,只要在提示词里输入一些不同的材质用以描述画面内容,看你就可以得到各种不一样的石头啦。除了这些常规材质的,还包括这种非常富有创意的ai都能为你实现。其次是control net,不同的预处理器的模型可以改变a i读取这个文字信息的方式。不扰文字了,我直接向你推荐几组不同的组合吧。如果你想让一些东西汇聚成这个字体,使用刚刚我们实践过的这个deep minus加depth的组合,我实验过效果是最好的。depth是依靠空间深度识别来帮助你组织画面内容的。常规情况下它塑造的形体是凸起与背景平面的。这里还有一个小技巧,如果你想反过来制作一个凹陷镂空的效果,只需要把前面的预处理器切换为无看就实现了。
如果你想把文字作为图片的一部分融入进去,优先以呈现文字形式为目标,用canny或者lie arts加对应的预处理器效果会更好一些。如果你的文字比较纤细,运用以上方法可能会导致文字的模糊不清,这个时候可以考虑invert加scriber,有时候会做出一些非常有艺术感的效果。来看完了这些应用,是不是觉得controller还蛮神奇的,如果是,可以弹幕敲一个六,至于这些模型预处理器,他们为什么会有这些神奇的作用?如果你真的感兴趣,不妨花上三十分钟,把刚刚我提及到的这些系列课的第十课好好看上一遍,我相信你一定会有所收获。control的核心作用是控制,而对文字的控制强弱会影响效果的呈现。涉及控制强度的三个核心参数就是下面的权重引导开始与结束的时机了。一个个来说权重很简单,代表的就是总体的控制强弱。默认情况下我们一般都会应用一的权重,此时文字的边缘是最为清晰准确的,但这有时候会让形状组成的比较奇怪。适当降低控制权重,形体会越来越自由。
根据我的经验,最低降到零点五左右都可以发挥不错的效果,不同模型也会有所差异。引导开始和结束则代表了在这个生成的过程中,control加t什么时候开始和结束工作。这里的数值代表的是生成进度,零是一开始,一是完全结束。这样说可能有点虚,但我打个比方,可穿戴就像一个在大门口值班的保安一样,默认情况下的零和一就代表他的上班时间是零零七,需要全程站岗,管得很严。但如果我们调成零点三七五和零点八七五,那他就只会从早上九点站到晚上九点,只有一半的时间在这里站岗,管子就稍微松一些。回到生成的过程中管得严代表控制的更加严格,文字更加精确。而管得松意味着a i有更多自由发挥的空间。如果你想仔细琢磨一下,可以联想a i进行扩散生成迭代的这个流程什么时候开始介入,什么时候结束。
这个时候其实就是相对于迭代的进程而言的。而开始结束的时间调节也是有一些细微差异的,保持权重不变,降低引导终止步数,形体会越来越自由,但影响不大。我认为存在一个突变点,会一下子让形体失去识别的轮廓特征,这一个点在不同的场合下应该也是不一样的。而微量的提高引导开始步数也会让形体更自由,但在超过一定程度以上时,就会导致字体完全融入画面中,无法被辨识。在芯片这个操作案例里,我会建议你设置在零点零五到零点二之间的一个数值上,这样对比一下,你体会到了这个时机的作用了吗?在这个过程里,你提供的ai的这个文字图也起到了非常关键的作用。而你不光能通过这样的方式做文字,还能做logo。具体的操作方式其实和刚才一样,只需要准备一张白底黑色的logo图,这可能需要你拥有一些图像处理的基本技巧,也可以借助一些比较方便灵活的在线工具,然后在刚刚提到的第二步里,把它当成文字图导入进去就好了。a i就会围绕着这个logo的形状打造一幅非常具有创造力的品牌logo。
宣传图出来了怎么样?是不是也挺有趣的?好了,重头戏来了,掌握了利用stay for division和c t r l net进行形象控制的基本方法以后,做非常火的这种融字光影字的图片就再简单不过了。根据使用工具和实现效果的不同,这种富有整活气质的图片实现手段大致可以分为两大类,rights和elimination。它来源于一个国内团队i o c lab训练的control t使用模型基于亮度的图像生成控制。看介绍,其实这个训练项目本来旨在帮助一些插画师构建更好的创意工作流。结果吧。这些图片的万恶之源其实就是他们基于不同样本训练的两个模型,就是刚刚我们提到的brines和illumination了。我之所以不用中文描述,是因为他们的概念实在是太容易搞混了,一个叫亮度,一个叫明度,听起来好像差不多,但实际上各有各的不同含义。涉及与美术相关专业的朋友可能会对它有更深的理解,但在这里我就讲到白话了,并从他们能在a i动画里实现的效果出发做一个区分。
先来看看bins的作用,顾名思义,它控制的是图像的整体亮度,决定图片哪些地方亮,哪些地方暗。亮度模型可以被直观应用在类似的图片文字融合中。因为只要这张图的某些地方比周围更亮一点,就能实现文字信息的传递。直接来做一些有意思的图吧,还是像刚才一样,准备一张白底黑字的图片,把它导入到control net中。导入以后模型选择brines,预处理器选invert。如果你找不到这个brance模型,那就和其他模型一样,将它下载下来以后,放到control t扩展文件夹中的models文件夹内。同样前面的那个安装教程里有提到具体的操作方式。接着权重设置成零点五,介入零点一,中止零点八,这样可以让亮度特征比较温和的融入进去。
点击生成看一个非常自然的v我五零就被制作出来了。它和常规的p s还不太一样。这里v自然融入了人物上身的白色衬衫,我和五十则是牛仔裤上的破洞,会延伸到背景里的光影组成的近看图,之所以一缩小就展露无遗,这就是它的妙处所在了。在做这种光影融合的图片时,预处理器的选择有不少讲究。系统会从你提供的文字图像读取亮度信息。其中白色的部分是偏亮的,黑色的部分是偏暗的。按照常理,我一般建议你将最终想要突出呈现的部分以白色高亮展现,而inverse的预处理器会交换黑白,所以我们才选用它。如果你想周围比较亮,就文字那一块暗下去,那可以将预处理器选择为无,对比一下,效果是非常直观的。
这里的权重为什么是零点五呢?老实说是我实验出来的,在刚刚的例子里,权重越高形体就越固定,但在这个例子里,权重高了以后,会导致画面的明暗差异过大。看上了强度以后,周围都变暗了。为了保证文字融合的融洽自然,我建议你最好选择一个居中的权重数值。根据我的实验,在权重为零点二至零点五时,文字更倾向于以淡淡的光影的形式融入进去。而上升到零点五到零点八时,文字更倾向于以硬的物体形体的形式融入进去。做这样的图,用其他预处理器和模型组合可以吗?也可以,但是效果各不相同。刚刚提及的kenny组合是另一个我觉得比较自然的选择。因为candy是通过描绘形体边缘去呈现形状的,不涉及明暗,因此整体画面会更加和谐。
而soft edge组合和candy类似,也是着力于描绘边缘,但因为它识别的边缘更为自由,所以权重一般要低一点点。另一个可选项是depth,但我觉得不太容易出效果。因为death的控制和空间深度有关,除了像我们也比较容易有戏剧性,适当用用,不行就算了。讲完了bryers,再来看看elimination吧。如果特别想强调光影的作用,使用elimination会比brights具有更强的可操作性,且会一定程度避免刚刚那种空间扭曲的情况出现。开局我们看到的那个一键三连就使用illusion做的类似的手法,其实不仅可以使用在文字上,还可以使用在类似的图形上,让图形融入画面,和刚才一样,想实现光照出一个形状的感觉,我们需要确保形体部分是白色的。为了使光线自然一点,你还可以使用高斯模糊一类的处理方法,让边缘过渡自然一些。利用它,你可以做出很多类似于这样富有创意的视觉实现,你觉得效果如何?权重方面,elimination对画面原有光影关系的影响相对较小,所以即便权重开高,画面也还是比较亮堂的。
它的整体逻辑和brance一致,维持较低水平时是光影,较高水平时是形体。至于区别,你可以简单的把它们两个理解为是安排力度的差异,brance更硬一点,零ation更软一点。在做这种图片的时候有一个重要的考虑因素,构图。简单点说,如果我就是希望这些文字出现在人物的衣服上,而不是其他的地方,那我应该怎样操作?假设我们生成的人物整体偏右,在这个时候将文字放在画面正中,它有一部分在人身上,一部分在墙体上,不是很自然,很有可能会干扰面部呈现。其实这些文字放在画面上的什么位置,最终就会被呈现在什么位置。所以如果早期我们可以先固定人物的位置,再去有针对性的规划文字的放置位置,就可以精确控制文字和画面的融合逻辑了。受到控制最有效的手段自然就会让control net。一个经典应用就是利用open post加elimination实现有指向性的文字生成。
open pose可以读取画面中的人物姿态、形象甚至表情,实现人物的精确复现。那如何把它利用起来呢?这里我提供一个简单的操作流程,先找好一张图片,用它来控制人物的姿势位置。随后我们根据这张图片的位置预判文字的位置,进行截图或者摆放在这一步里。使用photoshop一类的图像处理软件会非常方便,你甚至可以做一些变形,让它更契合影响展现的文字形象。在你开启多重控制网后,上面会出现多个unit,可以同时向图片施加多重控制。我们在unit one里先放下人物姿势图,开启open pos四,随后在unit two里放下文字的信息图,开启inverse加elimination。下面三大选项我们设置为零点八加零点一加零点八。没错,在应用光影时权重可以强势拉高了。
点击商城看这些文字就会非常自然的添加到衣服上了。如果你能精确地辨认出衣服上的文字,那就把它们打在公屏上来证明你已经学会了吧。到这里我们这期视频的内容差不多就结束了。等一下还有一个没讲的二维码啊,这个不都一样的吗?我猜你肯定也在各个平台上看到过许多花里胡哨的a i生成二维码。二维码我们天天有机会见到,但这些二维码根本不像一般的二维码,在画面内容如此丰富的情况下,竟然还能扫出东西来。比如这个二维码,你扫扫看内容是什么,其实用ai生成二维码,和前面所有文字、图形、logo在操作原理上都是一样的。二维码的本质是一串网址,它被通过一定逻辑给二维化了,就像我们超市结账时扫的条形码一样。滴一下会读取到一个商品编码,告诉你要付多少钱。
如果你有观察过条形码,会发现它的每一道杠粗细都是不一样的。这些粗细就是在记录一些数字化的信息。二维码也是一样,在被摄像头扫描的时候,里面的深色区域就会被识别到,然后被翻译出来就变成了一个可以跳转的地址。所以只要我们确保在扫到这张图像上的时候,能通过合适的颜色、深浅、明暗区别,让它的信息被识别出来就行了。如果只是想要围绕二维码形状生成某些风格化的样式,按第一二部分的方法操作就可以了。这里我最想推荐的模型还是bss,因为摄像头就是靠明暗度来识别出二维码的信息的。如果你想要把二维码融洽地藏进图里面,那我会非常推荐你使用由monster lab开发的这个叫做q r code monster的contract的模型。同样我已经为你整理好了一个可操作的流程。
首先根据自己想要在二维码里藏的东西生成一个网址,然后用一些二维码工具生成一个带有这个网址的原始二维码。你可以使用草料二维码,一个我用了很多年也还免费的在线工具。这个网站比较全能,也可以输入文字信息直接生成二维码。如果你想呈现的东西在其他二维码里,还可以把二维码拖进来解码。另外web u i里有一个叫做q r code的扩展,同样可以非常轻松方便的为你实现这一步操作。可以安装了以后自己摸索一下。得到了这样一张二维码以后,把它作为信息图输入到control net中要想让二维码能被扫出来,控制水平的要求是相对比较高的,权重一般不低于一。但为了不要让它生成出来的效果太过于死板,我一般会放宽引导时机,把介入结束设置为零点三到零点七,如果发现做出来扫不出来的情况,再逐步退回到零点一、一点零。
采用q r monster模型的情况下,你可能得把权重开到一点五甚至更高才能扫出来。但适当加入brines或者elimination可以让它更容易呈现出来。和刚刚一样,在第二个unit里再加入搭配零点五左右的权重就可以了。随后在你的提示词里书写自己想要画面呈现的内容。我的心得是二维码内部是非常复杂的,所以初始分辨率一定要稍微大一些,以确保可以稳定传递图像细节。点击生成看一张基于二维码创作出来的创意a i绘图作品就诞生了。如果你已经完整的看完了我的整个stable division系列课,你会知道前面我们学习过的很多内容,都可以改进这个流程里产出的二维码的质量。例如将生成的二维码再发送进图层图,利用tile division放大到原来的两倍,可以丰富二维码图像中的细节,提高图片清晰度。
在这个过程中再加一次control,net开权重约为零点二至零点三的elimination预处理器全index全局融合算法可以让二维码信息变得更加容易被识别。另外,你还可以将成品图发送至局部重绘,用画笔涂抹那些人物面部、手部等覆盖较为严重的区域进行重绘,来使主体传递稳定。说白了就是更好看,改完以后记得验一验能不能扫出来,如果不能就稍微改少一点吧。