目前市面上最强的两款ai绘画软件mid journey和stable division,在过去的一年里他们都做了哪些升级迭代呢?v六版本的major ny和stable division到底哪个更强?我们不妨带着这些疑问,开始时隔一年的再一次全方位的p k对比。嗨大家好,我是李晨,欢迎来到c剧迷。在过去一年里,midi针对一直被诟病的可控性差的问题,终于也推出了属于自己的局部重绘。
为了对标stable direction,nova微调模型训练mi ji n n y同样也推出了定制化的格调模型。其实的一些模型的一些大的模型和和d级模型也终于上线了。而stable division这边同样也不示弱,推出了l c i模型和一部就能出图的s d x l特步模型,把出图速度直接提升到几乎实时绘画的级别。
同时像一张图片就能复刻的款人物的ip a data face i d等各种插件,在开源生态下也是百花齐放。接下来我们不搞那些虚的,直接从下面这些方面来对midi v六和stable division进行全面的实操对比。首先midi n y这次更新的大模型,对文字的识别能力有了大幅度的提升。
我们输入在便签上写上c g m的提示词,midi n n o o, 可以说是一字不差的完整反馈出来。首先stable division这边即便选。选择s d x l模型,文字表现依然是比较拉胯,这个回合明显没准里胜出。
在提示理解能力方面,myrin v六模型和s d x l模型都是宣称对提示词理解能力有了大幅度的提升。这里就用两组提示词来分别测试一下,一个女孩,白色的衣服,黑色的帽子,手拿着冰激凌,红色的高跟鞋,长裙,在城市街道里。这一组提示词主要是用来测试一下两者是否能准确还原提示词里面的内容,并看看是否存在提示词之间的污染情况。
从测试结果来看,两者都能很好的理解和还原出提示词的所有描述。接着我们换一组提示词,一只可爱的仓鼠在昂贵的游艇上喝着香槟,穿着鲜艳的t恤,戴着金表和太阳镜。同样对于这种抽象的提示词,两者也能很好的理解和还原出来。
但其中对于戴着金表的这个提示词,min june i四组图片均没有把手表表现出来。而stability fluent中有两张图片是有展示出手表的,但另外两。张哲墨镜没有展示出来,综合来说,两者对提示词的理解都算非常不错,这个回合算是打成个平手。
人物风格一致性方面,madri新推出了一个s r e f风格一致性的功能,这个功能只需要上传一张图片,然后还可以添加杠杠s r e f,加上这张图片的链接,就可以生成同款图片的画面风格了。但这个功能目前只能较好的还原上传图片的画面风格,对于人物的样貌则不能迁移回来。所以目前mtoni在保持人物一致性方面,还是得靠换脸机器人电图和c的值的方法来保持。
但这些方法还原出来的人物效果只能说是一般般了。而stable defection这边保持风格一致性的方法就非常多了。最新推出的ipad data face i d和instant i d都是用来保持人物一致性的。
另外还可以通过加载指定风格的nova或者是训练专属人物的nova来输出固定的角色。另外还可以通过c t r l l的方式来生成同一角色的样貌,所以这个回合stable dial胜出。说到风格一致性,这里就不得不提一下magic最新推出的风格调整器了。
例如这里我想保持这种龙年三d盲盒模型的风格,只需要输入斜杠t u m e,加上这种提示词,接着选择你想要对比风格的数量,然后就进入风格选择页面。我们需要做的就是从系统给出的这些风格里面一一选择符合自己想要的效果的一项,然后系统就会给我们返回一组特定的风格序号。只需要在提示词结尾输入杠杠style加上这个风格序号,那么生成的图片就会给我们返回同款的风格了。
major n的这种种简单的方法来变相对标stable diffusion的nova模型训练。对于不想研究stable division复杂的模型训练参数的同学来说,midi n y的这个风格调整器确实是简单粗暴,不过遗憾的是,目前v六模型还不能使用这个功能,只能在旧版v五点二模型才能使用,一个简单快捷,一个专业复杂,但什么风格样貌、产品场景都能训练,大家更偏爱于哪个呢?放大对比major n y和。revision s d x l默认出图分辨率都是一零二四左右,而mitri v五点二提供二到四倍的放大选项,但v六版本只提供两倍的放大。
并且在仔细对比了mitri i的放大后会发现,即便是四倍的放大,实际上midori做的更多是锐化变清晰的工作,对于画面的细节是没有明显的增加的。而stable division这边有多种不同的放大插件,在放大的过程还能给图片增加爆炸性的细节,不过前提是你的显卡显存能够撑得住,这个回合stable division胜出。视频能力midi i准确来说是并不具备视频输出能力的,不过怎么说呢?同属部署在micro下的产品,p卡收费了,杜m a i目前还是免费使用,那就把它算在midi头上好了,只需上传一段视频就可以返回指定风格的动画了。
画面的稳定性还是相当不错的,就是细节相对少一点,而且时长也只能是几秒钟。而stable division这边是具备视频生成能力的,像movie to movie animation f。e v sen等插件都能输出各种稳定不散的视频,所以这个回合也是stable dual胜出。
局部重绘midi n前段时间终于推出了自家的局部重绘功能了,对于一些局部细节有问题的图片,修个脸、修个手,换个衣服,两者都是可以轻松处理的。所以这个回合打个平手,可控性这方面就毋庸置疑了。stable division引以为傲的效果,通过强大的controller。
手绘线稿还原实物产品、室内场景设计、毛坯房转装修风格、人物指定动作等等。这些都是stadio y形成一些的,所以这个stable diffusion吊打ddi最后来对比一下两者的出图效果。对于出图效果这个每个人的审美都不太一样。
总的来说midi y在出图多样性和创意风格方面,个人觉得是要比stable dual要更好一些的,特别是在video模型出来之后,不管是真实风还是二次元漫画风的效果都有所提升。stay abduction出图的下限和上限都很高,通用和不会用的同学生成出来的。图片完全是两码事,这个回合我会把票投给更简单更容易出效果的major n y,相信支持大家对对midjan y和stabilization的性能都有了大致的了解了。
虽然他们都是ai绘画软件,但实际上他们的定位是完全不同的。midi收费,而stable division免费,madani无需电脑配置,stable division需要较好的显卡,本地安装部署majdi更适合快速生成各种优质的图片素材、情绪版创意参考效果,以便于快速搭建起整套创意设计流程。而stay division则更适合做最后交付的工作,对产品场景进行控制还原,对图片进行细化修改和放大调整。
那么你是选择使用majdi还是stable division呢?不妨在评论区留言一下。