当a i工具说自己能看图做饭时,会议神器还能秒出神图,它到底是黑科技还是人工智障呢?那今天就让我们用毛血旺和赛博脑洞扒开他们的真面目。欢迎来到太平洋a i大横屏的多模态和应用篇,我们将以医用篇的测试作为入门,毕竟功能再强,用起来抓狂它也是白搭。首先我们来看看注册体验,文心一言、质朴清妍、天空a i等选手三秒游客模式入场,而不支持游客模式的kimi通义千问、腾讯元宝等选手就只能止步不前了。
看看各家的主页,国产a i对新手还是十分友好的。像通义千问、豆包、天空a i mini max的首页都有功能的分类,甚至豆包还配有了专门的新手引导,可以说是零门槛了,有手就行。在第一个关卡呢,我们的所有选手都拿到了一个开门红,十款ai工具的平均分达到了四点四的高分,恭喜恭喜。
接下来第二关呢,我们通过是否提供快捷选项,能不能通过简单的指令调整输出。基于这个评分标准,除了kimi和deep sik没有快捷命令。扣掉一分,大家都取得了满分的好成绩。
第三关呢我们用一个火锅段子做了一个简单的响应速度比拼。从体感来看,十五秒就是生成速度的接受极限了。所以从响应思考到内容生成完毕,时间超过十五秒的a i工具我们都会扣分。
同一个问题下我们可以看到平均响应速度都达到了三秒以内,也有学霸选手质朴轻言以零点三八秒的成绩遥遥领先,生成时间倒是长短不一,但质朴清颜还是以四点九一秒遥遥领先。其他工具平均都在两位数以上,吃了生动思考的亏。deep sick更是长达五十六秒才生成完毕以上的易用性测试值。
开胃菜接下来的多模态修罗场,我们直接让a i集体翻车。现在上来是第四关,a i美食家对决,上传这张毛血旺,看看这些a i工具到底认识不认识。kimi直接爆出了鸭血一块,牛百叶一百克,郫县豆瓣酱两勺。
而mini max嘿他说这是一个麻辣兔头,而且我们这里不仅有麻辣兔头啊,文心一言的火锅续费,星火的水煮牛肉也是天如乱。毫无疑问在这一轮mini max文心一言、讯飞星火,一顿铁锅乱炖,成功夺下零分。值得一提是,我们的内容生成优等生deep sak同学在图片识别上也吃了大亏。
他在联网搜索的时候不支持上传文件,不联网搜索的时候也只支持图片上的文字识别。在毛血旺的冲击下,本次关卡直接秒杀了五位选手,幸存的仅有豆包、kimi、通义千问、质朴青年和腾讯元宝。惨烈啊,实在是太惨烈了。
第五关我来给大家讲讲火器识别一篇文章可播的m p三文件,看看转写的准确度怎么样。事先说明这篇文章是普通话英语配音的科技类文章,难度应该仅在产品型号和专业名词的识别上。但是仍然有五名选手在洪水中惨烈牺牲啊,主要原因是他们不支持m p三文件的识别。
这里要重点表扬天空a i不仅网页和a p p中都支持识别准确度也都高达百分之九十五以上,甚至可以一键生成ai文档,包括a i总结脑图、重点字幕,简直就是打工人的利刃。想知道谁家a i能让画师失业吗?我们迎来了第六关的终极挑战,赛博朋克风格黑长直女高中生的图片生成。话不多说,我们来欣赏一下美女吧。
十款ai工具,我们一共收到了八份答卷,那么是谁没有交卷呢?答案揭晓。kimi通义千问、腾讯元宝、mini max、deep sak这五位选手并不具备ai生图的能力,不过他们也都提供了生成方法的关键词描述。优等生deep sik更是提供了最详细的提示词描述。
既然有五名选手没有提交,那为什么我们会收到八份答卷呢?答案揭晓是因为豆包他一个人就提供了四份答卷。很遗憾的是,我们这关的门槛就是生成图片。不过呢,剩下五款ai工具生成图片,我认为也一般,a i生图还是需要更对口的专业工具。
六个关卡打下来,易用性和多模态的综合王者是质朴轻言。虽然在易用性上它只有a的评级,但在多模态上可以说是吊打众多选手,取得了s的评分。而deep sak的多模态能力确实比较弱,再加上服务器和深度思考速度的影响,虽然生成质量不错,但在易用性和多模态能力上确实欠缺。
以上就是本期视频的全部内容了。另外在视频的最后呢,我们也要让可怜来生成一张毛血旺风格的黑长直女高中生视频,图片领域还得是专业选手啊。