大家好,我是爽林超,b站真的很久没更新了,主要是过去这一年多,好几个宏观选题都想写,但是写到一半都写不下去了。比如中美在ai领域的竞争问题啊,就属于去年我特别想聊,但是写不出来的那种话题。因为整个零二三中国的ai产业似乎一直都在疲于追赶。很多人焦虑说中美的a i差距是不是越来越大?这种焦虑在跨入二零二四年之后缓解了很多。一方面中国这边的自研大模型其实越来越好用。普通人之前那种只能看见美国那边的猪在跑,却吃不上中国这边自己的猪肉,那种焦虑已经缓解。
那另一方面中国也开始出现一些有国际水平的开源大模型。比如昆仑万维的天工三点零,阿里的千问一点五,还有百川的百川二三b而且同时中国还在一些专业领域,比如工业制造、音乐创作这一方面出现了一些综合评分超越美国同行的垂直大模型。所以总体来说,我们逐渐看到了中美ai目前一方面是有差距,但另一方面其实差异也在变得越来越明显。在a i技术的中心地带,中国的确还是有差距的。但目前来看中国咬的还是挺紧。而在a i跟实体产业和垂直场景融合的扩展。
我们说这个才是未来a i落地的大市场。在这里中美的差异正在变得越来越明显。要理解这个问题,我们需要一个简单的分析框架。支撑ai模型的四大要素是算力、算法、数据场景。这里面现在算力方面,那全球王者就是英伟达了,垄断优势非常明显,脖子卡的很难受。但其实这方面中国已经浮现出一些替代方案,这块我们之后会单独聊。
今天先说剩下的算法、数据和场景。这三个东西结合起来解决问题,可以简单分为两类。一类是全球赢家通吃的问题,比如a i编程、a i翻译、a i解题,这些问题就是有明确的最优解的问题,全球范围内谁做的最好一目了然。而另一类是全球不同行业不同国家会百花齐放的问题,比如矿业、农业、工业里的a i应用,比如基于本国国民dna数据训练的医疗大模型,或者基于本国民族音乐特征训练的创作大模型。看这些场景全球根本没有统一的最优解,而中国公司的这些垂直场景里面的a i竞争力是很大的。工业场景,现在中国有三十一个制造大类,六百零九个小类,每个类别里面还有研发、设计、仿真。
跟生产、测试、运维、售后这么多个环节那么这么交叉起来,上万个细分场景就出来了。再比如我们现在是全球最大的新能源汽车制造国、手机制造国家、电制造国,未来还有可能是最大的机器人制造国。那这些乌泱泱的终端设备未来都是我们的场景。所有这些场景里面,中国最大的竞争优势就是利用非公开的专有数据,在真实场景里面去优化垂直大模型算法。再把这个算法呢用回特定场景去强化学习,然后再产生数据形成闭环。这种闭环就是中国ai产业未来的结构性机会。
当然说到这里可能还会有人问,说中国的数据和场景这个优势我们但是说到自研算法嘛,前不久不是还有一个投资人说中国的自研大模型没戏,说我们自研的速度还赶不上美国那边开发的时候。其实这段话说的是中国的初创ai公司,不是泛指中国所有的a i开发团队。我们前面已经分析过了,在很多垂直专业领域,中国团队今天是具备做出世界级全自研大模型的能力的。这方面我想说一下最近我了解到的一个案例啊,大家知道这两个月a i音乐大模型是一个行业热点。月底美国那边的a i音乐软件solo刚发布了v三版本,很惊艳,引爆了全球媒体。四月份中国这边昆仑万维也发布了他们自研的音乐大模型天空sky music。
那这两个产品前后脚发布,也有不少博主拿这两个软件进行对比。我也看了一下这两个大模型的横向测评数据,结果发现中国这边的sky music在设计人生的三个维度上表现得更好,这居然使得它的综合分数上是高过美国的solo v三的。要知道在音乐a i生成领域,现在全球是没有开源大模型的,而苏宁也没有公布过自己的技术框架,反而我们这边的sky music是公开技术架构的a i音乐大模型,所以关于它技术分析的公开资料更多。我在信达证券最近出的一份研报里面看到是这么写的,说天空sky music是中国首个音乐a i g c的sota模型,这里的sota就是stay of the二的英文缩写,意思是技术水平已经达到全球前沿的位置。那这两个音乐模型我也用了一下,功能还是有些差异。中国这边的天空sky music和solo在功能上最明显的差异有两个。
第一个就是sky music可以根据视频音乐去生成音乐,就是你现在可以找一个现成的音乐给他做参考。甚至未来可以根据用户哼出来的旋律来生成歌曲。这个功能我觉得是比酥肉更加贴近普通人的使用习惯的。因为对于多数普通人来说,让他们在苏州上用提示词去描述音乐风格,那简直就是mission impossible。比如你说你喜欢听王心凌的爱你。那你来告诉我这首歌什么风格,至少我不知道。
那还有第二点就是天空sky music是可以生成方言音乐的,目前是包括了粤语啊、四川话、北京话、上海话等等啊,那这个功能非常好,我觉得最好能够加上潮汕话。所以啊不管从测评数据还是从功能差异,至少目前综合来看,中国的sky music和美国的sono是各有千秋的那这就说明在全球百花齐放的那些场景里,中国团队的自研大模型是有能力达到世界水平的那说到百花齐放,在音乐创作方面,不同民族音乐之间的差异,它就是百花齐放。这就意味着不同文化背景的开发团队做出来的模型训练的侧重点就是不一样的。比如中国这边的大模型会更加侧重歌手的声音表达,而美国的大模型就会更加侧重乐器声音的表达。这是因为中美音乐之间在旋律结构、节奏风格这些方面都很不同。比如欧美音乐会更加侧重旋律的层次丰富的和弦,中国音乐就会更加侧重旋律的流畅,歌词的表达。
那欧美音乐会更加有节奏和跳跃,中国音乐会更加温和和稳定。这些差异就给中国这边的ai团队留出了。很大的优化空间。所以了解了这些音乐专业的常识,我们也就更能理解为什么上面那个横向对比的测评数据里面,跟乐器相关的指标苏诺会表现得更好,而跟人生相关的指标sky muy这边就更胜一筹。我说到这里,其实大家还有新的疑问呢,不能妄为这家公司嘛,说a i也有一段时间了,怎么突然就做出一个能在全球达到头部水平的音乐垂直大模型呢?这其实涉及到中国科技公司,今天做a i还有一个很少人意识到的优势,就是出海优势。中国移动互联网最近七八年出海突飞猛进。
前段时间美国制裁tika,这个事大家都肯定知道啊,因为t二在美国影响力太大了,他这几年在全球攻城掠地我就不用多说了。但tiktok真的不是出海成功的个例,中国还有很多像虚影,拼多多的tamil,这个两个大家也都知道,出海电商双雄,还有短剧出海平台real shop,去年很多新闻霸总出海谁与争锋,这几个a p p大家可能也听说过,但其实还有一大堆大家没怎么听说过的。中国a p p出海也很成功,比如star maker single life,like uc brother, cap cut, daily yoga等等等等。你如果要问为什么中国互联网公司突然就开始集体出海成功了?那的确是因为中。国在移动互联网产品的整体战斗力,现在已经全面超过美国同行了。背后的原因是因为中国在移动时代真的太卷,能在国内存活下来的a p p都是卷王,卷王出海天下无敌。
另一方面中国互联网发展周期呢跟美国是错位。美国那边互联网产业比我们早半拍,所以他们在pc时代的那些强者巨头到今天都还很厉害。比如你看美股七巨头里面,微软、亚马逊、谷歌、meta苹果、英伟达这六家公司在pc互联网时代就已经很厉害了,但中国这边,腾讯、阿里、百度、京东、头条、拼多多、美团、虚影、小米,有一半的公司都是在移动时代才出现的。所以中国的互联网产业天生基因就更偏移动化。这意味着随着时间推移,中国公司在争夺全球移动流量这件事情上肯定越来越有优势。而且了解了这个背景,也能解答上面的音乐模型训练的,因为上面提到那个出海很成功的star maker就是搞音乐社交的,它和我们上面提到的sky music那个音乐模型母公司都是昆仑万维。
所以star mak的成功其实给音乐大模型训练提供了海量数据。这个star maker就是海外版的全民k歌,它从二零一六年。开始出海,做到现在覆盖海外几乎所有的国家和地区。我看过他们最新的财报数据,star mak目前在全球一百三十个国家地区音乐音频排行榜都是第一名。那这至少意味着在这些国家里面,中国公司对当地音乐曲库的积累就可能比美国公司还要强。所以这个案例还告诉我们说,中国公司今天拥有的场景优势,其实不止于我们前面讲的工业产业链,手机、汽车终端这些场景,中国公司这几年其实还在海外独占了大量的用户场景。
在中美ai竞赛里面,中国公司其实是有一纵一横两类场景优势,纵向就是中国实体产业行家的门类场景,横向就是中国移动出海丰富的国家场景。我们还是拿上面那个ai音乐创作的模型举例,很多发展中国家其实比发达国家今天是更加需要好的a i音乐模型,比如生活在尼日利亚或者秘鲁的普通人,他们有没有民族音乐创作的需求呢?当然是有的,但他们既没有产业,也没有人才,也没有设备,也没有资金,所以他们之前没有办法进行任何创作,也就只能被动地接受欧美主流的音乐文化了。但是一旦有了创作门槛很低很低的ai音乐软件,这些发展中国家的人就有可能创。作能力瞬间爆发。这个事情往大里说,我觉得就是全球欠发达地区的文化平权嘛。所以从这个角度,我觉得中国团队让a i音乐大模型对小白用户更友好,这件事情本来就能更贴近发展中国家用户的需求。
而这个东西未来必然也是中国a i产品应该发挥的差异化竞争优势。本来嘛,全球各国的文化就应该是百花齐放的形态,ai内容创作当然不应该是少数大模型赢家通吃。就像英伟达的创始人黄仁勋说的那样,每一个国家其实都需要用自己的国家语言和数据去打造属于自己文明的主权ai因为各国的语言、文化、历史都是有巨大不同的,所以未来只有各国都能够建立主权ai才不会让本国的文化在别人家的a i霸权之下被完全同化掉。我理解啊这个表面上冠冕堂皇的理论呢,其实也是为了他卖卡做准备的。但他其实这个观点也是有一定道理。因为在大模型训练的过程中有一个重要的工作叫做人工智能对齐,就是a i align。
这个工作就是确保ai的行为跟人类的价值观保持一致,不至于最后a i越来越强把人类给灭了。所以这个的话呢就是ai对其工程确实很重要。但是这个事情有一个bug,就是谁的价值观能代表人类的价值观?我们今天全人类真的有统一的价值观吗?你就拿美国为例吧,最近各种游行示威那一步的价值观都如此的撕裂。那么如果全球今天只有一个a i大模型,它的价值观应该向谁对齐呢?是不是谁家开发的大模型最牛?谁的价值观就代表了全人类了当我们问出这个问题的时候,大家已经能看出来这个问题有多荒谬了。所以随着人工智能能力越来越强,中国肯定是有必要拥有完全自主可控的顶级a i g c大模型。虽然在接下来全球的ai竞争里面,中国要补的短板真的还有很多,虽然有些领域我们要追赶的时间还非常长,虽然也有人觉得最近这两年中国似乎很多事情都不太顺利,对整体的宏观形势也比较失望,但其实我想说的是,中国作为一个现代国家,今天还非常的年轻。
一六零二年,当我们还处在万历皇帝的统治之下,活在一个完全封闭的世界里的时候,欧洲那边荷兰就已经诞生了证券交易所、股份制公司。你看这些非常现代化的概念,这些现代化的组织,支撑我们全球攻城略地。一七六。五年,中国还处在乾隆皇帝的盛世里面,认为天下之大莫过于意。那个时候詹姆斯瓦特已经在苏格兰发明了分离式冷凝器,让英国开启了第一次工业革命。一八六六年,当中国还在被太平天国折磨得体无完肤的时候,西门子在德国已经发明了自立式发电机,开启了第二次工业革命。
所以整体来说,过去四百年里面,中国大多数的时间都在原地踏步。我们简直可以说是一朝开窍,原地升天的那种类型。就像是一个从小学到高中都没读过书的孩子,只凭高三一年的魔鬼训练就顺利考上了名牌大学,这简直就是奇迹嘛。这种奇迹的背后必然伴随着严重的偏科,巨大的阵痛。一旦我们处在这种阵痛里面,就会无数人觉得不满、怨恨、迷茫,这个是非常正常。但如果我们真的能够跳到五千米的高空去俯瞰全球的所有民族,就会发现综合来看,华人的智商、努力、韧性真的还是鹤立鸡群的,大多数民族真的没有华人这个群体这么高的综合实力。
所以我个人真的是认为中国的未来还。有巨大潜力的。只不过是因为我们经历现代化的时间还太短,还有很多的学费要交。所以中国今天真的就是需要更多更多更多的时间。离离原上草,一岁一枯荣,野火烧不尽春风吹又生。这期视频就到这里了,如果你喜欢这个视频,欢迎点赞、收藏、投币、转发。
如果还能够点击关注,那就是对我巨大的鼓励了,谢谢大家。我们之后看什么时候再更新吧。