重磅黑科技，一键同步音频表情#AI“数字人”#AI使用教程#AI表情

哥哥，你女朋友不会吃醋吧？从未见过有如此厚颜无耻之人。只需要上传一张静态的照片和一段包含人物语音的音频，那你他娘还真是个人才，他就可以把它们合成一段像这样的人降talking视频。那你他娘还真是个人才能让表情包开口说话。

欢欢欢欢真要diss你，甚至还能让纸片人开口唱歌。它就是由阿里巴巴旗下的通义实验室开发的ai视频生成模型。伊某早在今年二月底公开的时候，他就在国内外引发了大量媒体的关注，风头一度比肩当时震惊海内外的soa。

为什么会引发如此轰动？因为在这之前，大部分talking head技术只能实现简单的唇形匹配，嘴动脸不动，皮笑肉不笑，僵硬还有点。欢乐谷业内也出现过一些更生动的数字人方案，但往往需要预先录制大量的视频素材。结果也只能让人物重复几个特定的动作组合。

和他们相比，伊某的要求更低，只要一张图片就可以驱动一整段长达两分钟的视频，而且生成的视频更加生动传神的自然，在一些案例中，连人物面部的细节和微表情都可以完美呈现出来。这一切的原因是研究团队使用了超过二百五十小时人像讲话视频来训练这个模型。他们通过一个预训练的音频模型提取了话音与技能特征，将它和整体的面部像素建立起关联，然后借助和大家所熟悉的c body fusion技术类似的引导去噪方式生成视频，并通过一个独立的神经网络提取我们上传的图片特征来维持面部一致性。

说人话，让ai学习一个人长什么样，说话的时候你会怎么动。然后在我们上传的这张照片上浮现出来。通过这种。

方式训练的模型是编码了大量关于人类在谈话时体现出的语气特征，甚至是暗含的情绪色彩，从而让a i在某种程度上读懂了人类的情感，进而能生成活灵活现的说话视频。你想尝试一下吗？如今他通过阿里旗下的通义千问app向公众免费开放使用了。你只需要在各大平台app store搜索并下载通义千问，在对话栏输入阴谋并发送，即可开启这个图片转视频的功能入口。

上传一张颈部以上的大头照，并从他提供的人生预设里选定一个需要生成的内容。目前阶段同意为大家提供了一系列非常有趣的爆款、热播、影视热梗，甚至是表情包元素，整个空间非常大。你好骚啊，点这个眼同款。

上传一张大头照片，拖拽画面时，识别出来的面部保持在画面中点完成确定形象，然后点立即生成。根据玩法不同，所需的等待时间也不同，主界面右下方生成记录里可以看到生成进度，等进度跑完以后，这张照片就能动起来开口说话了。借助同一app里的各种有趣玩法，你还可以把这个功能玩出更多的花样来。

例如这个表情包换脸就使用了和去年走红的妙丫相机。类似的技术。可以通过人脸模型把自己的外貌带入各种。

去的表情包里，你可以拿它制作出来的表情包，再输入阴谋里生成像这样的视频。心里话我想要回家。对了，前段时间爆火的全员科目三视频，也可以用里面的这个通义吾王的功能轻松制作出来。

这项技术的意义非常重大，在阴谋技术加持下的数字人会更加具有亲和力和感染力，势必会被广泛应用在诸如虚拟人物、直播带货、短视频创作等领域。但另一方面，它也让我们开始警惕以后在互联网上听到的，看见了这一个个视频是真实的还是a i生成的呢？欢迎聊聊你的想法，这里是哪里？感谢看到最后，我们下期见。

重磅黑科技，一键同步音频表情#AI“数字人”#AI使用教程#AI表情

图文助手更多>>