让AI帮我做视频,从视频剪辑到脚本分镜全自动#AI视频#AI剪辑#AI人工智能

老婆老婆啊好。前段时间我沉迷于猫mam视频主页一刷全都是,每次打开都被硬控十几秒就这样还总觉得不够看相较于传统视频,猫mam的剪辑元素少,模式也比较固定于是我冒出了一个想法,能不能用ai来帮我创作猫mam视频?说到视频的辅助创作,虽然像索尔那样可以直接生成视频的产品还没有发布,但其实目前的a i已经具备从视频剪辑到脚本分镜的多维度能力了。比如tim他们刚尝试过的分镜a i就是基于开源的本地绘图软件,用ai创作出故事发生的场景、人物和分镜等等。

如今我们所看到的大多数a i应用案例一般都是基于云端大模型,比如chat g p t这类网页端应用来完成的。虽然云端模型更大更成熟,在内容生成上具备更高的准确度和精细度,但使用过程中会面临一些网络问题,最常见的就是火车、飞机这种信号不好的地方,而且加入了层层限制。本地模型虽然小,但支持d i y与解除限制器使用起来也就有了更高的自由度。

甚至能够和设备以及运行在设备上的工作流耦合,把本地的计算设备变成真正的a i p c。于是这次我决定加大难度做起,不要笑啊,不对。互联网挑战也就是在全程离线的情况下,不依赖任何云端大模型和网页a p i,用自己的笔记本跑完整个制作流程。

首先用本地模型进行视频创作十分考验笔记本核心的性能。a i计算能力在过去只有移动工作站或者大型游戏本才能胜任。那么问题来了,如果只有普通的工作本能不能做到呢?这周我在外地出差参加c c f的交流会,身边只带了一台没有显卡坞的红米。

都说笔记本跑a i是小马拉大车,自找苦吃,虽然配置跟我开发用的a i工作站没法比,大约最近一年英特尔牙膏挤爆,这台笔记本的酷睿auto七上还集成了二k核显和a i专属n pu。我决定试一试。第一步我们先试着让它通过本地运行的大语言模型来帮我们进行脚本的辅助创作。

这次用到的百川二g b已经集成在了a i g c助手中,最多支持一千零二四长度的上下文。首先我们要给出猫man的定义,通过提示词设计一个比较抽象的rag知识库,基于few shot让ai来理解和学习这些知识。接下来结合我们过去的真实经历,给出故事的剧情简介,然后让ai来创作一个完整的剧情,根据格式处理脚本和旁白。

最后,我们会对故事的理解给出一些文字性的场景描述。文字后面的ai绘画。虽然本地模型的参数量有限,文本生成的质量与g d s的模型还有些差距,但考虑到离线这一前提效果已经很令人满意了,稍加润色就可以直接使用。

当然最出乎我意料的是,实际使用下来a i p c上本地大模型不仅能正确,运行速度也还不慢。放在五年前,七十亿参数量的模型怎么都得r t x八千才能搞定。如今得益于大模型压缩蒸馏等技术的进步,加上英特尔新一代制程工艺和高性能混合架构,以及ark核显的升级,即便手头这台较为轻薄的笔记本也可以在酷睿auto的加持下,变成具备a i核心的a i p c,满足最高百亿级参数的大模型本地性需求。

既然脚本没问题了,接下来就是基于a i给出的场景描述进行图片生成。首先我们基于a i给出的场景描述进行stable division的提示词优化,接着可以进行背景图片的生成。我们使用了秋叶提供的开源stable division web u i,也就是中文的绘制。

一般来说图像生成是个更吃算力,耗时更久的i流程。酷睿ultra七上搭载的二k和弦采用了台积电五纳米工艺,计算单元的数量和频率都大幅超过之前服役很久的锐炬x e和弦。加上这代酷睿的tip list模块化设计,整个a i图片生成速度非常快,在高清场景上可以达到秒级出图。

最后一步就是剪辑了,对于个别没有清晰文件的map素材,我们只能从原视频中进行抠图。一般的剪辑软件在调用a i相关功能来处理图像时,都比较是c p u和内存,尤其是对于普通笔记本来说,序列一多就容易卡死。但酷睿ultra因为自带了专门加速a i应用的特殊芯片,n p u, 可以匀出更多算力用这个a i内核来负责这些专门任务。

比如剪映里的抠图。除了s d这样的a i g c应用,酷睿ultra在图像处理等计算密集型应用上的优化也很明显。视频点击完成后,我们就可以进行导出了。

这台酷睿ultra核心的笔电在序列导出和视频渲染速度上都快的有些超模,而很多类似应用也可以轻松hold住。最后给大家展示一下这次的互联网挑战中,我们在a i p c辅助下生成的视频。哎呀。

老婆老婆啊。再来一张幺零五。moments later. 北方。

好。好。i i didn't get it. i was just in all on it. 我喜欢。

一只只。哪一张嘴?look at. 有一天亏。说谢谢你。

还有一点就是续航,笔记本的续航在叉八六平台上一直是一个老大难的问题,这也导致了笔记本阵营分化成游戏本和轻薄本两个极端。这代酷睿ultra系列最核心的部件用上了更新的英特尔四支撑,再加上全新的模块化设计,其续航就有了不小的改善,实际跑完整个创作流程也只花费了不到百分之七十的电量。过去一年自从下g d引爆大元模型之后,各家厂商都在卷自己的大模型。

有像open a这样纯云测的做法,把所有模型都放在云端,提供a p i和网页调用。也有像小米这样纯做端测,把大模型放到自家的手机和汽车上。而从市场角度来看,a i p c其实和后者比较类似,就是将一个或多个大模型塞进电脑,用来迎合如今ai风口的噱头。

但如果我们换个角度来思考,会发现如今p c本身的硬件其实已经十分完善了,只是缺乏一种与人的交互。如今这种交互和二十年前没什么不同,都是屏幕和键盘。未来ai势必会打破这些维度,延伸到每个人的生活、工作中来。

这些延伸有很多种,比如语音助手、智能家居、虚拟头显,甚至人形机器人。但不论哪种方式,本质上都是本地模型加个性化场景的融合。最终a i p c逐渐适应用户的偏好,形成一种私人的伙伴关系。

在未来也许会成为贾维斯那样的私人管家,成为屏幕前的你服务。而以上这些都必须要依赖于强大的算力核心,否则就会成为一个笨重的设备。正是因为a i核心的存在,a i p c它被赋予了意义,与我们一起迈入下一个智能时代。