AI外语翻译工具,让外国人秒说中文#AI翻译#AI教程#AI工具

你是否看过这样的a i翻译呢?记得我妈妈在我还很小的时候带我去看它。i remember my我现在开源的ai语音合成技术也能做到这种多语言的翻译,并保持原有的音色了。观众老爷们大家好,我是练习时长三分年的程序员。只用级别的音频,然后就可以训练一下,一起玩玩话语言复刻声音,这是原始的声音,然后就可以休息一下,跟伙伴们一起玩玩。但你can take a break。

and play with your friends, 再结合echo mimic算法,还能生成对应的肖像视频啊,这是日语的效果。所以这里所展示的效果一共用到了两个算法,反audio l m和echo mimic。对应的一键启动包呢放到了视频的简介里,没有任何套路,不用关注,不用私信,只求各位彭于晏、吴彦祖、刘亦菲们,就是你玩的开心的时候,记得给我一个免费的赞就行。我们先看饭audio l m这个算法呢我之前出过一期介绍的视频,但是有很多小伙伴想看详细一些的使用教程,并且有些小伙伴呢本地机器性能不足啊,没办法部署。所以今天我找来了一个可以薅羊毛的云服务器平台驱动云注册呢就送七十元的算力,什么概念呢?我们用最低的算力,服务器每小时不到五毛钱,七十元免费的算力大约可以用一百四十二小时。

假设每天用五个小时啊,服务器能够白嫖使用一个月。如果再连充两次十块钱,再做一个上传数据集的任务,就又能得到总共二百五十元的算力。好家伙。这台服务器呢玩各种a i算法,每天用五个小时都绝对妥妥的够用小半年了。接下来我们就以驱动云为例,演示一下饭audio l m的使用。

驱动云的注册链接我放到了视频的简介里,有需要的自取。我们点击社区选择项目,搜索饭audio l m就能找到我为大家准备好的一键镜像了。点击进入,选择运行一下,点击确定就能看到项目正在克隆中,选择立即运行就能启动这个项目了。等待部署完成后呢,点击进入开发环境。饭audio m分为两个部分,cos voice和sets voice。

我们先看cosy voice啊,运行方法很简单,进入目录里啊,找到run,点i p i n b文件,打开它,找到运行运行所有单元格,稍等片刻后看到这个u i l就表明运行成功了。我们点击右侧的端口,添加端口,输入我们启动的这个八零八一端口用途,输入web u i,点击确定,打开这个外部访问地址,就能看到我们启动的服务了。这就相当于把这个服务放到了公网上,任何人拿到这个地址都能访问你部署好的这个服务。我们先看预训练音色的使用输入法。合成文本点击生成音频,稍等片刻就能听到合成后的音频了。

修改推理,随机种子还能抽签改变不同的音色。除了使用预确定音色,也可以三秒急速复刻。我们上传一段音频,点击开始按钮可以听一下声音,然后就可以休息一下,跟伙伴们一起玩玩。然后我们在prompt里面输入这个音频对应的文字,注意要有标点符号。然后再输入合成文本里输入我们想要合成的文字,点击生成,稍等片刻啊,就能听到复刻的音频了。

使用几秒的音频。然后就可以训练一下。我们再看一下跨语种复刻跟三秒极速复刻类似。不同的是呢输入的文本需要换个语言,比如输入英文,点击生成音频,稍等片刻啊就能听到合成后的效果了。break and play with your friends. 最后这个自然语言控制呢,我们需要在rn点i p n文件里面修改一下使用的模型。

在第一行代码前面加一个井号,注释掉这段代码。然后下面这行呢删除井号,去掉注释。两行代码的区别就是使用的pinch model是不一样的。我们点击终端内核,然后重新运行所有单元格,这样启动的服务就有了新的权重文件,我们就能使用自然语言控制这个功能了。然后按照这个操作步骤选择预训练颜色,然后输入instruct文本就可以了。

这里就不过多演示了,我们接下来再看一下sense box,这个使用方法更简单啊。还是打开软件i p y n b文件运行所有单元格。当我们看到这个u i l的时候,就表明服务开启完成了。我们还是打开右侧的端口,输入我们新的端口八零八二,用途呢还是web u i点击确定,打开这个链接就能看到开启的服务了。我们上传一段音频,然后。

点击start就能识别出对应的文本了,这个识别的准确率还是挺高的。其实呢这个可以结合cos boys一起使用,把sense voice识别的文本结果啊当做prompt的输入,这样就不用人工听录音识别啊并手动输入文本了。怎么样放audio m的使用,大家学会了吗?最后我们再看一下echo magic的使用,这个使用起来很简单,直接上传一张图片和一段音频,点击生成按钮就能生成对应的合成视频了。这里需要注意的是输入的图片尺寸尽量是幺零二四乘幺零二四的,否则呢你可能会遇到一些奇怪的报错。这个算法用起来还是很简单的。

不过因为一些特殊的原因,这个算法我就不提供云服务啊一键克隆的环境了。但有一键启动包,一键启动包的下载地址我还是放到了视频的简介里,有需要的自取。本地机器建议至少有十二g的显存,然后双击这个bat批处理文件就能一键运行了。好了,本期视频的内容就是这么多,我是热爱技术分享的jack,我们下期再见,拜拜。