这也不知道怎么回事啊,就最近的一周发布了很多有意思的新东西啊。那这些新的东西呢由于发布的比较密集,而且他们各有特色啊,可能单独拿一个去讲讲不到一整部视频啊。所以今天我们把。四个新东西放在一起来讲啊,给大家来看一下啊,在过去的一周到底整个ai圈发生了哪些好玩的事情啊,以及它为什么好玩。好吧,欢迎大家收看我们今天新一期的视频啊。啊,首先第一个我想讲的东西啊,就是这个mistral 7b啊,不知道有没有人听过这个公司啊?这个公司呢每一次发布产品呢,就是在twitter上面发布一个磁力链接啊,这个磁力链接呢就是他自己训练好的开源大模型。
他啥也不说是吧,就发一个磁力链接,然后让你自己送到这个磁力链接的配置文件里面去,看它到底是一个什么样的东西啊。那为什么他发布的产品能够引起呃一些大家的这个议论呢?这个公司特别有意思,他就是专门做小模型,他一直在专注做的事情就是剪枝,然后做performance上上面的东西啊,他想要做的一件事情就是利用。这个模型的压缩能力让小模型也有呃比肩大模型的一种能力啊。所以这个公司其实是专门做项目,而这个公司的创始人也是比较厉害的,也是业界的大牛。那最近发生了一个什么事情呢?他发布了不是这个七b啊,他发布了一个七b乘八啊,他发布了一个m o e的框架出来。大家如果去看的话,大家可以看到这个东西。
大家可以看到啊,这个项目呢是啊别人根据这个mysta o a i的m o e改的一个hungry face的版本啊,然后放到了hockin face上面。那这个没mixture,七比八也不是官方的名。就是他发布了八个呃七b的单元模型之后呢,呃这个人们下载下来以后给它取了一个名字啊,叫做这个mixture by啊。然后呃它由于是一个m o e的模型,也就是说这个小模型每个小模型都只负责自己擅长的那个部分啊,但是它最核心的意义是在于它希望能够开源这样的一种架构,让人们更加的能够了解m o e是一个什么样的东西,怎么样去用。这个m o e啊去做事情。因为g p t four本质上也是一个m o e模型嘛。
但是我们虽然知道了g p t four是一个m e模型,嗯,很少能真正看到开源的m o e模型到底怎么样去做的。啊,所以这个呃myr o a i它相当于就是把这件事情给开源了出来。如果以后有人想要要去用m o e模型的话,就可以呃选用它这样的一个呃开源模型去做啊,这个是它最核心的价值和意义。那为什么需要有m o e啊?其实在这方多多提一嘴。啊,这个m o e它最大的核心的价值就是在于它其实可以运行在更小的设备上,是吧?你这个一个呃小的专家模型解决特定的问题,嗯,通过一些压缩的方法,通过一些蒸馏的方法,可以让小模型也达到一定的水准。在一个特定的领域啊,那我用这个小模型我将更加的节省。
是吧我就更加经济实惠,甚至未来小模型还有可能能放在移动端。啊,所以这个是小模型最大的一随着这个算力的增长啊,移动端的设备的算力在增加,它可以渐渐的去运行一些模型。第二个就是呃大模型,人们卷大模型的能力卷到一定程度以后就开始会会开始卷性能是吧?啊,那你我们现在正在看见这件事情正在发生。所以要如果你要现在去做大概率模型的话啊,你要关注的很重要的一个赛道就是性能赛道啊,小模型赛道啊,这个是很重要的一件事情。所以呃mystery a i啊他发布的这个产品最大的意义在这个地方。啊,他如果对这个方向有兴趣的话,建议去看一看。
那第二个有趣的应用啊,是这个playground的这个嗯应用吧,或者是这个网站。这个网站其实和呃stable diffusion的那个clip crop啊做的是一个类似的事情。或者说是他跟这个photoshop做的是一个类似的事情。他想做一个基于stable diffusion更加专业的绘图工具,绘图软件啊这个。它比stable diffusion厉害的地方是在于它的产品力,它比photoshop更厉害的地方,它对于diffusion的这个理解能力。
所以你如果去看这个playground它的演示的时候,你会发现其实很多stable diffusion插件实现的事情啊,都在它的这个应用里面去实现了。所以它迭代这个产品的能力是比较快的,而且你一看就知道是一个熟悉stable diffusion sion嗯这样一个模型框架,以及熟悉y b i的人开发出来的一套东西。啊,所以现在来说playground n d在产品的这个层面上是占据了一定的优势的。我觉得它解决了一些我们去用stable diffusion的一些痛点,是一些maternal或者交易他做不到的一些事情。这是他很关键的一个点啊。
然后啊他最近发布了一个新的模型啊,叫做playground v two一零二四p x啊。这个模型最核心的东西啊还是这个resolution一零二四乘一零二四。那你说这个一零二四乘一零二四对标到底是谁呢?对标的就是stability ai的这个s d x l是吧?那它就是瞄准了这个呃。stable diffusion这个x l去去打的啊,他希望能够在产品的能力上,这个stability ai地区产品力上没有其他的东西强了。嗯,这这我个人是觉得playground的这个产品力还是很强的。那如果说stability ai它的呃这个模型的能力也没有。
playground这个模型的能力强的话,那其实可能很有可能会被playground的这样的一个应用给打败啊,这是这是非常非常有可能的一件事情啊。然后还有一个点就是他发布了一个这个m g h q三十k啊。这个其实也凸显出他一种小小的野心吧。这个野心是他想去定义标准。啊,我发布了这样一个东西去呃告诉大家怎么样去呃评价一个模型的美学能力。啊,没有,你说他定这样的一个标准,尽量我接受这个标准之后,我就更熟悉这个模型的标准怎么样去达到。
那同样的我就能得到一个更好的分数,他想成为这个行业标准的一种制定者。啊,所以我们可以看到playground l a的潜力、野心以及它的产品能力都是很大的。啊,甚至我现在觉得stability ai有一些些后继乏力啊,有一些些后继发力。啊,我们来看一下啊就是。像这样的一个赛道啊,playground的这样的一个东西,它到底会走多远啊,我还个人还是非常非常期待的,好吧,我们来拭目以待啊,这是第二个呃模型。啊,那第三个就是论文啊,最近这个论文出的实在是太多了,就是多到有点看不过来啊。
就是我也不知道为什么,我猜测啊可能是接下来的一周那个呃。nas i p啊,就是那个呃neural network神经网神经网络的那个顶会就马上要开了。那这个会议开之前,我们看到了很多很多可能是悲剧的论文,然后给给放出来了。你猜测啊纯猜测这个不一定是正确的。然后所以我们能看到很多很多新的有趣的东西能够出现啊,那当然是吧那顶会之后发出来的论文可能也很有借鉴意义和价值。然后我们也会持续关注这个顶会上面到底有哪些值得关注的论文啊ok。
那我们来看一下啊,就是总结一下最近比较火的论文到底是在哪个方向。我们最近已经看不到图片生成的论文了啊,你最近能看到的论文和图像相关的就两个两种嘛。第一种是文字生成视频的论文。啊,其实告诉我们的是一种什么?是一种方向性的东西啊,就是视频一定会崛起,视频生成这个赛道一定会崛起。不管是皮卡runway还是其他的小公司做的应用啊,一定一定会出现迭代和更新的,这个是毋庸置疑的事情。举个例子,像这个。
customized emotion in text to video这个是m i t和这个adobe是吧?他们联合起来发了一篇论文。然后像这个。啊,阿里啊为了反制自己,出了篇新论文,叫做这个dream moving啊,是吧?你说阿里为什么要大力的去做短视频赛道上面的论文?这个野心也是能看到的,就是要告诉自己的团队,你在这个方向上你不行。我把这些东西弄了以后,我在哪些平台上,或者说我在自己的平台上去做这种生成式的内容。我比你强,我就可以把短视频的赛道的主动权给拿回来啊。
这个视频赛道啊,大家一定要关注,强调再强调,一定一定要关注。有很多很多新的东西出来。第二个和图像相关的,我们一直没有说,但是一直想说的东西是啥?是这个。二d转三d。不管是英伟达发表论文还是wonders三弟,其实这个二弟三弟建模的事情其实也是一个老生常谈的事情。而且这个是一个有非常非常久历史啊需要解决的问题。
只不过最近大家都开始说,哎,我要不要用diffusion模型去做加速,或者是用二d转三d用diffusion的能力。去帮助我构建三d的模型啊,这个是很大的一个领域。然后这个领域我们从来没有给大家介绍过,但是这个领域非常的有潜力啊,非常非常的有潜力,原因是在于什么呢?呃,第一个是现阶段的技术,能够帮助降低三弟。建模的成本。原来三d节目其实可能很多时候是一个呃人这个人工密集型的一个产业。然后最近呢就变成了哎我用ai技术能够大差不差的去生成一些三d的物体。
当你能够生成三d物体的时候,你能作用到很多很多方面。比如说家居,比如说游戏啊,比如说自动驾驶啊。我们在自动驾驶的时候去构建这个场景,去模拟车行进的这个路程,这其实是很多地方能用到的啊,还有工厂物流系统,这些都是一些。非常多的应用到建模的领域啊,所以三d建模的需求非常非常的广阔啊啊也就是为什么二d转三d最近会很火。第二个就是啥?第二个就是当a i这个板块轮动的时候,会不会下一个风口a r和v r火起来。啊,尤其是在头显嗯更加普及的时候,是吧?这个苹果的设备出来之后,会不会有一阵风把a r v r吹起来。
如果a r和a r的风吹起来,三弟建模生成的技术也会变得非常炙手可热。所以现阶段。三d的这个论文还是很多,人们还是密集性的去研究这些东西啊,这些都是一个对未来的投资。啊,所以。你如果对三d a r v r感兴趣,现在也是去利用a i的技术去探索这个三d方向的一个比较好的时期啊,也是论文比较多,你学习起来可能慢慢慢慢就能pick up最新的技术啊。
嗯,大家如果有兴趣的话,也去研究一下这个领域。如果你对三d非常感兴趣的话,我们未来会跟进这个方向。因为我们从来没有讲过就是这方面东西,我们可能会出一期视频系统性的去讲解一下这个方向。这个方向我自己认为有很大的应用价值。那今天的视频主要内容就是这些啊,就是我们讲的四个点啊。第一个这个呃m o e啊,第二个是这个新的playground模型啊,第三个是这个论文里面的视频赛道啊,第四个是这个论文里面的三d赛道啊。
我觉得我们讲这些东西,其实他们如果强行归为一个主题,就叫做未来。就是未来的ai技术的发展方向到底是什么啊?就是。可能这些东西体现出来的是一些小公司,或者说是一些小的个人超级个体,他们可以着重去看的ai未来的发展方向。这个呃有这样的一个眼光,我觉得比。有成熟的技术,甚至还要更重要一些。好吧,那今天主要内容就是这些啊。