这个采用了l c m nura技术的实时生成式ai绘画应用,可能要革命。只要在左边用鼠标随意的涂鸦,然后输入你想要的东西,只需要自然语言,不需要复杂的提示词,不管画的有多丑都没关系,ai会根据提示词生成你想要的任何东西,而且右侧的画面会根据左侧的变化实时的调整。如果觉得用鼠标不过瘾,也可以接入ipad直接用手绘。
然而这只是最初级的玩法,事实上它的左侧参考图可以是任何东西。参考图可以用色块或者色块加涂鸦,也可以是图片。你也可以把它接入二d绘图软件i gma photoshop,也可以把它接入三d建模软件,比如dreams。
maximum. 等等,甚至接入摄像头。也可以接入计算机图形库,open c v和three g s。
有人已经用它来设计外包装和鞋子了,甚至有人把它接入像素游戏我的世界。我的世界有史以来第一次变清晰了,这个神器叫krea。试过很多的分离人声和伴奏的软件,只有这个是真正的免费。
只要上传一段歌曲,它就能将人声和伴奏分开,也可以将讲述的人声和背景音效分开。项目解决了数据问题,自己生产数据,open a i可能正在利用计算机合成数据进行训练。ok. 转换完成,你可以选择保存音乐人声,或者是音乐加人声,它叫vocal remover。
只要按住你自定义的快捷键,就可以提取任意图片上的中英文文字,而且准确率非常高,表现超过市面上大部分收费和不收费的o c i软件。此外它还支持批量上传图片,批量提取文字,后期可能会加入翻译功能。最重要的是它是免费开源本地使用的,它叫UMI OCR。
ai视频生成又进化了。只要给a i一张起点图片和一张终点图片输入提示词,a i就会自动补全起点到终点之间的所有画面,生成从起点到终点的变化过程,从而得到一个准确的运动视频。比如起点参考图片是悬浮在男人双手中的一只球,终点图片是男人双手之间的一只火龙,输入提示词求着火,并且变成一只火龙,a i就准确的完成了命令,这个工具叫pixeldance。
字节跳动触屏。做影视解说的有福了,这是一段无声的松鼠视频。只需要上传你的本地视频,选择一个解说的声音,输入提示词,制作一个纪录片风格的画外音脚本,点击发送a i就会自动观看视频,理解视频的内容,并配上合适的文案,并且使用t t s生成好音频,最后合并成一个完整的视频返还给你。
目前只支持英文,它使用的是g p t v的技术,这个工具叫AI VoiceOver。如果你想把刚刚的英文解说视频转换成中文解说视频,那么用这个工具你就可以一站式的解决。首先上传你下载好的英文视频语言模型,选择title然后点击转写,它会自动提取你的文案变成字幕。
转写之后点翻译,它就接着将英文翻译成中文,最后使用我们熟悉的t t s转成语音,播音员就选云溪,那么一个趣味动物解说小视频就诞生了。in the art of the forest. 在森林的中心,一只好奇的松鼠在探索它敏捷的动作。邱金的生机勃勃的背景,在转瞬即逝的时刻,它体现了大自然的野性精神。
这个声音熟悉吗?这个神器叫MEMO。这个新的图片像素增强工具将图片放大工程推进到一个新的境界。如果你觉得MEMO这里生成的图像素不够,你可以将它放到这个工具中放大两倍,再放大两倍,就会得到八k的高清图片,并且细节拉满。
它的放大和之前放大的区别是不是简单的像素增强,而是增加了a i自动重绘。a i会补充放大之后缺失的细节,并且改正之前a i生图不合理的地方。比如这个男孩的双眼尤其擅长于解决之前a i生图脸部模糊的问题,这个工具叫magnific。