太卷了太卷了,最近的a i视频圈真的是太卷了。前有国产快手可灵后有luma a i的dream machine。这两周a i视频老大哥rv有放出重磅炸弹,发布最新模型g alpha最新模型可以在九十秒内生成十秒的电影级别视频,并且在保证度和一致性上又有了颠覆性的迭代。要知道距离上次如此震撼的发布是今年二月的sora,这才过去不到半年时间就一下有了全新模型。难道二零二四真的是a i视频工具的爆发之年吗?俗话说外行看热闹,内行人看门道。卡卡面对这些神仙打架的a i视频工具,忍不住笑出了声,为什么呢?因为工具始终是为人服务的,这些ai工具越卷,我们普通人就越能从中找到逆风翻盘和创业赚钱的机会啊,所以今天这期视频,卡卡来带大家盘点以及测评目前市面上的a i视频创作工具,带大家了解工具能制作怎样的视频,又有哪些可以帮助我们普通人从小白一键晋升为大师并开启自媒体事业的。
在这期视频最后卡卡也给大家准备了一份小礼物,所以请一定要看到最后,废话不多说,让我们开始吧。各位首先我们先来看。runway runway成立于二零一八年,是一家ai视频编辑软件提供商,很早之前,runway在文生图领域就曾经大放异彩,和stability ai一起训练了大名鼎鼎的stable division模型,在近期的某个深夜,这个老牌ai视频工具放出了全新模型g三alpha,据说这可是酝酿了有半年之久的模型,和它的上一代g m二对比,在逼真度、稳定性和动态表现上都有显著提升。并且根据一的官方介绍,g三还只是即将要发布的一系列模型的先行军,不愧是a i视频界的老大哥,出手果然就是不一样。卡卡掐指一算,sara发布至今也是半年,所以难道rv的这一次回归真的是冲着soa来的吗?j alpha有着一众新特色,其中卡卡觉得最值得推荐的有三点,一生成速度快,可以支持在九十秒内生成十秒的视频,并且。可以并行生成多个视频。
二高保真的素材和逼真人物生成jet三能够生成接近真实世界质量的视频内容,也就是写实性更强了。它擅长生成具有各种动作、手势及情绪且富有表现力的人类形象。三精细动作控制因为这j三是被描述精细、直接、密集的描述词训练而成的,所以它也能够精确控制视频中对象的动作和过渡,实现复杂场景的流畅动画。口说无凭,我们直接来看看让位这一次公开发布的视频吧。这个画面是整个官方发布里面最让我喜欢的。因为我发现车窗外的光影变化与人面部的光线变化竟然是完全一致的。
在这高速流动的画面中,我的眼睛看到了自然流畅的变化,所以大脑竟然一下都反应不过来,这竟然是a i的作品。另外我也想小小八卦一下,我看到了提示词发现这。这个影片用的也是日本城市的场景,很难不让人联想到sara半年前那个刷屏的东京女人效果吧。具体哪个更符合你们心中东京的样子呢?大家也可以在评论区留言讨论哦。还有另一支公开的视频,让我也对jc逼真人物的生成有了更具象的认识。我感觉我看到的不是a i的作品,而是一位老艺术家在我面前进行无实物表演。
能做到这个精细的颗粒度,以及表情有在大幅变化的时候还能保持流畅度,这真的是太牛了。看到这里,卡卡又忍不住去查了一下,发现genre alpha的宣传语就是for artist by artist,为艺术家而生,由艺术家而生。深挖了一下他的模型训练团队,里面不仅有科学家、工程师,还有艺术家哦。怪不得在视觉风格和镜头缘上都有着出彩的表现。深沉的视频也可以处理复杂的场景变化,并能包含多样的电影叙事手法,艺术气息拉满,甚至还有艺术家也发帖赞。看了最新效果,在之前的视频里,卡卡有说可以用ai工具来做电影大片,遭到了一些小伙伴的吐槽。
不过runway g三的发布确实又让我看到了希望。就在卡卡写稿的时候,runway官宣g三已经可以开放使用了,目前是十二美金一个月的订阅费,感兴趣的小伙伴们可以去尝一个鲜哦。那目前je二的模型是免费使用的,我们先用g二来试试。好了,我挑选了几个模型的视频,输入提示词后生成同款视频。可以看到二和三的模型在理解力和效果的区别上差异还是比较大的。luma g machine说来也巧,就在runway发布g三的同时,另外一位a i视频领域的佼佼者鲁玛a i也宣布推出了新模型dream machine。
luma i是一家成立于二零二一年九月的美国加州公司,专注于三d的内容生成技术,可以通过少量照片生成着色、渲染逼真的三弟模型。这一次luma推出的dream machine主打的也是电影级别的视频生成,特点是,一、生成速度非常快,可以在一百二十秒生成一百二十帧。由于帧率的巨大提升,视频也更加的丝滑顺畅。二、动作逼真连贯。这一点和rv提到的很类似,主要也是采用了电影级别的运镜效果。三、角色一致性强。
这是用的新架构,让它能够理解人、动物、物体在物理世界的交互,可以说是能模拟物理世界了。目前这个模型已经可以使用了,我们直接来到luma的官网,选择谷歌登录。谷歌用户有免。飞了三十次额度,如果想升级次数的话,费用是三十美元一百二十次。既然gam machine和g三前后脚同时推出,而卡卡我又来到了dream mine的界面,那么看热闹不嫌事大,我们就来一起来卷哦,不是,我们来一起测评一下这两个工具的效果吧。那我就直接先选择刚才我喜欢j生成的这个东京光影,直接把同款皮试词输入进去,等待撸马的效果,直接上对比吧。
其实我觉得这两个模型的理解力确实不太一样。哎,因为luma竟然是把这个提示词分为两个部分。先是出现了高速运行的列车,随后才出现一个日本女人的形象。单从这个luma的效果来看,我觉得也是很好的,甚至她的这一段视频还有了一些影视化的视觉理解,这一步我要赞一下luma哈。整体来说,jam machine生成的视频质量还是非常出色的。其中人物角色和场景都栩栩如生,动作流畅自然,场景丰富多彩。
无论是写实风格、动画风格,还是视频游戏镜头风格,g machine都能出色的生成,和rom也是不相上下。虽然目前生成的视频还存在一些局限性,如变形动作和文本标识等方面的问题,但在视频的一致性和流畅性上已经有了很大的进步。快手可怜。接下来我也想顺便聊一下被称为国产索尔的快手可灵。这个可怜最近的风也是很大。在社交媒体上。
到处能看到不同效果的视频,我们来看看目前可伶官方放出的效果吧。这个虽然是远景,但是城堡的细节还是有的,整体效果中规中矩还算过关。还有这个这个视频对物理视频理解还是挺好的,各个物体的位置和远近关系都符合逻辑。甚至还有窗外的景深,美中不足的是咖啡杯的边缘还是有一些扭曲,在精致度上还有待提升。再来看看它生成人像的技术,效果也还是同样不错的,不过在精细度上和runway j相比还是略显逊色的。除了纹身视频,可能也在六月推出了重磅更新,又开放了图像视频功能,支持将静态图像转换为五秒钟的视频,再通过文本实现丰富的叙事。
这个功能我个人觉得还是很牛的,因为在纹身视频的操作中,难点通常是不知道怎么写出一个符合想像的提示词和图片。视频就可以解决这一点,我们可以直接找到想要的场景图片。在视频化它,比如我们可以再看一下,可伶官网给到另一个案例,小猫乘坐飞机向窗外看。如果只是纹身视频来制作这个画面,可能我们就要对小猫的衣着背景的结构和窗外的景象做细致的描述,还不一定能达到这个效果。另外一个亮点就是视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约三分钟的视频,也就是说我可以直接用一张图生成视频,然后在无穷无尽的续写下去,可以完整的生成一个视频,这听起来就简直太牛了,不知道是不是可以直接拿来做自媒体。视频和脚本和素材都不用考虑了,目前可能还只是在内测阶段。
如果想要使用,我们首先需要先下载一个快影a p p,在这里找到内测入口,简单填写一些信息就可以坐等审核了。那我是大概在申请了五天左右就通过了审核,所以我也来用可伶给大家生成一下runway二三的效果。看看哦,我们可以直接用手机端来操作,直接输入同款提示词,它的生成速度很快。来看看成品,怎么说呢?我觉得这个效果风格和前面的不太一样,还是偏动漫一点,在写实性上不如前两个,甚至还没有人物。看来国产模型还是任重而道远啊。不过整体来看,可能这个a i工具还是属于国产a i的佼佼者,再加上它根植于快手这个平台,和前面runway luma在艺术性电影影集生成的定位不同,更多的应用场景还是在短视频领域。
所以我们可以按照自己的需求来使用这些工具哦。其他软件大乱斗测评除了有最近技术层面重磅更新的几个ai工具,其实现在市面上纹身视频的工具也是眼花缭乱。比如我们频道之前有用过的pick a labs,还有helper,以及国产的军。美图推出的monkey v do等等等等。那么如果把rv的视频提示词运用到这些软件上会是什么效果呢?看热闹不嫌事大,我们继续来个视频大乱斗。首先我们来看一看皮卡和long way的对比,乍一看这个效果还是很不错的,虽然皮卡本身在动画效果上的处理是不错的,但如果提到写实感和大片感,还是能看到有差距的。
然后再来看一看helper,它生成的视频只有四秒钟,整体来说还是能还原这个提示词给到的信息的。画面也算中规中矩,不过如果跟j三放在一起,那简直就是被吊打了。接着我们来看字节剪映旗下的寂寞。嗯,这个生成效果我感觉连最基础的稳定性和画面质量都不过关呀。不说光影和质感了,连人都是抖的,国产ai还是要继续加油啊。所以卡卡可以在这里做课代表。
再总结一下,我们刚刚是把runway luma可林皮卡helper、jm吉梦。输入了同样一个提示词,大家一起来对比看看效果吧。我个人其实是非常喜欢luma dream是这一次的效果的。屏幕前的你更喜欢哪个呢?卷完了这一波,你是不是想说卡卡你这是忘了sorry吗?好好好,既然要卷我们,不如卷到底,直接来一个神仙打架。我找了一个sara比较新的提示词视频,我们先来看sa生成的效果非常不错,鸭子式模型做的很自然,动画也很流畅。那我们继续重复上面的动作,把提示词喂给大家看看能生成什么。
这里让位的话还是用jm二的模型来尝试,实际上了一整个的对比效果。哇,这一波视频真的是各有各的特色了。首先所有生成的视频都很好地表达了提示词的意思,并没有穿模,画面都流畅有过渡。从写实性来说,runway、可怜helper和极目效果都还不错。从艺术性上来说,我会更喜欢luma。你们可以看到,它仍然是为这个提示。
此做了简单的分镜,电影感满满啊。从生成时间来说,皮卡和吉姆暂时只能生成三秒动画,而其他都能有四到五秒左右,从生成速度上来看,可零皮卡都还蛮快的,而效果好的rv luma都需要等待更久,确实也符合预期,所以看看来总结一下今天的测评。我个人最喜欢的是luma dream machine,非常有艺术感和电影感,游走在写实与动画风中间。其次,如果考虑到写实和电影风格,runway和皮卡laps可以算是并列第二吧。接着就是可怜,生成的效果比我想象中好很多,感觉制作短视频是绰绰有余了。最后就是helper和jm,目前可以看到有一些复杂的提示词,生成还是不是很稳定,还需要继续努力。
当然zara王者效果定位,目前卡卡觉得还是没有被撼动到。至于是不适合应用于我们实践,那还是等到正式。公测再来见分解了。如果大家喜欢今天这类的测评内容,也可以点赞收藏,一键三连。卡卡后续会继续第一时间更新a i工具的测评内容的。对了,卡卡即将上线一个新手友好的小红书训练营,市面上的小红书训练营很多很多人教认知,一些人教方法,但卡卡相信理论听过一百遍,不如自己做上一遍。
所以我直接给模板卡卡和团队爆肝了五百个小时,总结了小红书上最全的行业内容模板库,无论你是什么行业,都可以在里面找到快速起号的方法,不仅如此,标题、文案、封面都可以套公式,就跟一加一一样简单的。普通人最低门槛的赚钱路径就在小红书。如果你也想在二零二四年开启一份新的事业,赚取被动收入,就一定要点击视频下方描述框中的链接,领取免费的电子书。在二零二四年末。为回顾,你一定会感谢你的这一份自我投资。