老友们又出大事了,我给你们带来了一个超级炸裂的消息。google最近在a i人工智能视频创作领域有了巨大的突破,也是google最新的大招。现在越来越流行一种完全由ai创作的视频,就是通过一段文字或者图像提示生成出来的。看过我以往视频的你们都知道,市面上已经有不少ai工具搞出各种花样的视频,甚至已经有频道通过这样的方式获得不错的流量和可观的收入。
但是google这一回通过他们的video poee给这一招升级了,直接碾压了所有工具。我给你们解释一下为什么。video破坏是一个用于视频生成的大型语言模型,集成了一堆强大的功能,都是通过最新的a i技术以非常简单的方式生成视频,包括但不仅限于文本转视频和图像转视频。这幅图是对video破坏模型的概述,它能够对各种以视频为中心的输入和输出执行多任务处理描绘了多种功能。
巴拉巴拉的这么说有点难懂,不如用实例来解析一下。它向我们展示了生成这些视频只需要简单的提示词。为了更好的理解,我们翻译成中文,这里展示的是text to video,也就是文本转视频功能放了很多它的示例,比如这个视频提示词是一匹马,在梵高的新页中。视频就是说你写下这段文字,ai就生成了这段视频。
像这个狗在吃雪糕的视频,它的提示词就是日落时。一只金毛猎犬在美丽的热带海滩上吃冰淇淋,高分辨率细节丰富,即便是天马行空,它也能按照你的要求生成出来。比如一只章鱼袭击纽约,一条从嘴里射出激光束的鲨鱼,一个人是由很多根电线组成的一个幽灵飞过走廊,摄像机摇晃等等。这个a i总的来说它的创作自由度和质量看起来都很不错。
以往同类工具的问题在于a i生成视频的动作连贯性不足,或者提示词内容和视频内容之间有一定的差距。需要你的文字内容足够细节,否则生成出来的视频呢可能不符合你的预期,这几乎是a i生成视频的通病。在这个问题的处理上,video powered确实有了很大的突破,这算是一个小惊喜吧。当然它能做的不仅限于这个这个处的image的。
有图像转视频,我们上传一个图像,然后给出提示词,它就可以生成与提示词相匹配的视频。所以当我们使用图像来生成视频的时候,有个重点就是上传图像后要配合使用提示词,让ai知道我们想让这个图像做什么,而不是让a i胡乱发挥。我们看虽然它所展示的视力不是很多,不过也能看出这个a i的功力。比如这个白色的牛奶溅在一个圆环上,圆环上方的一堆牛奶落下来溅起水花,a i是能够理解一些逻辑的,他知道水花溅起就是这个样子的,像这个一艘载有几名乘客的船在波涛汹涌的大海上航行,雷暴和闪电画布上的油画栩栩如生。
然后这个也挺有意思的这是蒙娜丽莎提示词是一个女人打哈欠,这图像就会按你的要求来生。生成视频非常的生动,所以图像和提示词紧密结合,可以得到很棒的效果。video power还可以用于视频编辑,这是什么意思呢?可以理解为video to video,就是我们上传一个视频,可以在里头改变它的内容,这是在其他同类工具中很少见的功能,这里叫视觉叙事提示词,可以随着时间的推移而改变,以讲述视觉故事。当我们已经做好一个视频,如果想要修改里面的内容是一件很麻烦的事,又或者想添加一些特效,但不会使用专业编辑工具。
所以这个功能就成了我们得力的助手,非常简单的弄点花活上去。比如说导入的视频是由水制成的行走人物,然后提示词描述扩展一下,由水制成的行走人物背景中闪电闪烁,水影之中冒出紫色的烟雾,呈现出来的效果很。贴切水人冒出烟雾以后,脚步还慢了下来,小细节处理的很好。我们看另外一个事例,两只浣熊骑着摩托车在松树环绕的山路上行驶。
八k所有的提示词描述为两只浣熊骑着摩托车,浣熊身后落下流星雨,流星撞击地球并爆炸。整个画面呈现的内容很一致,前面的浣熊呢还回头看了一下。这体现了a i的理解能力。好,这里讲的是长视频生成的能力。
默认情况下video power的输出两秒的视频。好,这个模型还能够通过原视频来预测下一秒的视频输出。这此类的可以无限的视频就可以生成任意时长的视频,并且可以很大程度的保留原视频的对象身份。目前同类工具中很少能做到这一点。
并且这个模型强大的地方this is a bottle of the other light。and his curiosity makes him step inside. suddenly he's falling through a long tunnel, which takes him to paris. i've never seen anything like it, he says. and then to the great barrier reef and even the south pole, where he makes some new friends, which visiting the ios and and ultimately planet android eda, where the locals didn't speak, reckon a, which makes me miss the record forest, and especially his family lucky, quickly finds his way back home. he is so happy to be back with his friends, but also make tea for us. 他也给出了很多事例,我认为最有代表性的就是这个视频提示词是一大团爆炸飞溅的彩虹游戏,其中出现了一个苹果八k a i能够理解它是彩虹游戏。即便你告诉他出现一个苹果,他也只是用游戏做出苹果的形状,而不是冒出一个真的苹果。这里还谈到了交互式视频编辑,视力是一个可爱的生锈。
的损坏的蒸汽朋克机器人的特写,上面覆盖着潮湿的苔藓和发芽的植被,周围环绕着高高的草丛。这是原视频,我们需要延长它的持续时间。a i可以精细的控制机器人的运动,无提示词的话a i自己发挥。用户可以从候选列表中选出最佳的视频效果,三个选项都不满意的话,输入提示词,在背景业务中启动a i就按你的要求来执行。
通过简单的提示,你可以在视频里添加你想要的任何内容。另一个我觉得很赞的功能就是可控视频编辑,这意味着你可以掌控视频里的各种动作,例如舞蹈风格,这个视频中他展示了一只浣熊在时代广场跳舞,根据你的指示可以是机械舞、格子舞或者自由舞,可以根据指示生成更复杂的动作。这样看来,video boy在与。原模型生成视频方面要领先于其他模型。
另外它还有风格化功能,就是根据通过提示词把你的视频进行各种风格改变。像这个把喷泉变成糖果样式,这个人俯瞰云海直接变成了红白相间的木刻版画。俯瞰大海,泰迪熊在走路变成了泰迪熊。在冰湖上滑冰,蒲公英狮子变成了视觉样式。
这些都只需要输入简单的提示词就能完成。不光如此,它还可以轻松的组合各种视觉样式和效果。这是什么意思呢?就是说你可以在基本提示词中给它附加一个视觉样式。比方说提示词是一名宇航员在茂密的森林中骑马,然后可以写上你需要的视觉样式。
比如逼真数字艺术、铅笔艺术、水墨,甚至更特殊一点的视觉效果,像这个是马和森林双重叠影。还有让马行走在一个球形迷你世界等等。好,最后一个修复功能。对于社交媒体的创作者来讲,像小红书、抖音、tiktok、instagram这些都非常实用。
比如这两个视频记录一只狗的生活原片由于素材尺寸的原因,上下部分都是黑的,经过ai修复以后,它自动把黑色部分填充完整了,这种a i填充功能呢对于图片修复比较常见,叫做创程式填充,对于影片填充确实不多见,可以看到它的效果还是挺自然的,至少看不出有大的问题,想马横屏改竖屏,或者竖屏改横屏,同样可以应用到这个功能。它还展示了其他事例,除了填充,它还可以修改,例如这个人在冲浪,冲浪板通过门板遮住输入骑着鲨鱼进行冲浪的人,冲浪板那里就变成了一条鲨鱼。我在之前的影片中也展示过。与鲨共舞不过是修图,看来视频还是要更酷一些。
然后还有一个强大的功能,video to audio视频转音频。比如你上传一段小狗在吃爆米花的视频,a i可以自动配上与之匹配的音频,我们听一下。小熊在瀑布前弹吉他。火车驶过,奇幻风景。
一条喷火龙。这可以提高配音效的效率,这需要a i对视频内容有足够的理解能力。看起来google在生成式ai视频领域有了巨大的突破,但是目前我们还不能使用。你懂的,这是科技公司巨头的老套路了。
先展示产品,全球宣传一波,积累人气,提高一下期待值,顺便修一下吧。然后再过一阵子就发布了,我也会密切关注他的消息,记得关注我的影片,写完我的分享对你有帮助,欢迎在评论区留言。那么我是小发,会分享图片影片编辑的思路与技巧,以及与新ai工具的结合应用,记得点赞,感谢观看,我们下期再见。