本期将介绍最新公测的阿里云助手通义听悟的真实使用感受。视频后面还会将听悟和另一款我在用的ai工具进行对比,帮助大家更好的了解两款工具的使用特点。最后呢还准备了一个小技巧分享给大家,帮助大家利用ai工具流。更好的获得知识,提高学习效率。那么话不多说,就开始今天的分享啦。
首先呢我们输入这个网址就可以到达通义听悟的官网。整个界面还是很简洁的,它主要的功能区都在左侧。那第一个就是首页,它的主要功能就是一个实时记录。第二个是音频上传转文字。实时记录的话呢,目前是只有pc端可以使用。它会通过你的电脑麦克风进行录音,然后将语音同步转文字,智能总结要点,还可以进行同步的翻译。
那上传音视频这个就是通过本地上传,或者去通过阿里云盘能够去把它进行文字转换,也可以去智能总结要点等等。那我们先来填一下第一个功能。那第一个功能的话呢,它这里有个转写语言和翻译。那注意转写语言是指你这个音频里面的语言。比如说会议发言人说的是中文,那你就要选择中文这个地方。因为我第一次使用的时候,我就理解错了。
然后就发现我说出来的话,他根本就没有办法去识别。如果你是在一个中英文都有去使用的一个语言环境,那你就选这个自由说就好。翻译的话呢这个就是根据你的需要去进行选择就好。现在就开始一个录音啦,同时我需要把我的电脑麦克风去对准我的音响,方便他去收音。在实时录音的这个环节要提醒大家,一定要确保自己的麦克风是处于一个正确的开启状态。
你可以在这里查询你的麦克风,然后如果你有多个麦克风,你可以进行管理,然后在这个地方选择能够正常使用的麦克风。然后现在他已经开始录音了。看我现在说话,他已经录进去了。这里我用麦克风对b站up主将dora的一个视频进行了录音。频录音下来呢,它已经帮我生成了这样的一个文档。它主要有几个特点,第一个就是关键词,它会去汇总出现的一些重要的文字。
然后你点击对应的,它就可以跳转到这个关键词包含的语段里面。第二个的话呢就是全文概要。这个地方就能够方便你去很好的了解这样一段语音里面它的这个主要内容是什么。总的一个摘要还是比较正确的。然后这边还有个章节速览,当你这个录音它是比较长,比较有逻辑性的时候,他就会去给你进行一个章节速览。这边呢可以直接点击,然后去进行回顾。
发言总结这一块,他就会直接去针对一段对话里面去做一个总结。然后用的话呢也是会更加书面化一些。你也可以直接把这段话用来去做自己的一个读后感呀,或者文字摘要都是可以的。另外它还有一个功能是问题回顾,它会智能提取语文中的问题。比如说你在课程访谈的场景下,就能够快速的去进行一个问答的回顾。不过他这个问题回顾的功能,目前我感觉起来还不太灵性。
可以看到啊现在它有四个问题。这个问答其实是一个场景里面的情况,并不是一个真实的我们需要知道的知识性的问答。第四个,我可以怎么称呼你呢?这个也是一个场景的情对话。所以说其实主要就是这两个问答是我们需要的知识性问答。然后我们点击过去就可以看到这边是他的问题。点击之后它就会跳转到这个答案对应的章节。
标出来的部分的话呢就是他给我们的答案。但是你可以看到,因为我们的这个问题,其实他没有在视频里面做一个文本性的阐述回答。所以他在去做一个强制的摘要回答这样的一个动作上,给使用者得到的答案其实就是不准确的。如果这个音频里面有非常详细的一问一答的内容,那么这个功能其实能够很好的提取问答的环节的。所以其实目前实际体验下来,给我的感觉这个问题。回顾的功能还不够智能,为什么这么说呢?一会儿呢会介绍另外一个工具,它的这个对话问题回顾就会相对更智能一些。
然后另外一个功能,文字记录这块,它有一个比较方便的,就是直接划词或者点击对应的按钮,就能够实现快捷的复制粘贴。其他的使用的话呢,就跟我们平常用的这种飞书语雀等等的文档。的这个使用方法是差不多的。好的,刚刚是单人的演讲。接下来呢我尝试了一个三个人对话的演讲,截取了一小段,然后就得到了这样的一段文档。可以看到他把它识别成了一个发言人。
其实这里面应该是有三个人的另外两个面试官,他们分别提了一个问题。我猜测可能是因为面试官的发言时间过短或者停顿不足,导致这边他直接识别成同一个发言人在进行对话吧。比如说你看你为什么想为我们工作,这句话其实应该是另外一个发言人说的。但是我这里现在不知道如何去把它。提取出来作为单独的另外一个发言人。我尝试去编辑这个发言人的名字,但是我发现他会直接默认这整段话都是第二个发言人说的。
所以我还不知道怎么去调整这种局部单词给他提取出来作为另外一个发言人的。如果大家有知道这个方法的话,也可以告诉我一下。那另外一个就是它的翻译功能了,我体验下来还算比较准确。特别是在这个音频它的一个语速适中的情况下,它的准确率感觉可以达到百分之九十五以上。但是如果你是播放的倍速的视频的话,那它这个识别错误率就会提升了,而且可能会大大提升,特别是在这个英文转汉语这一块。所以建议大家还是用原声速度去播放比较好。
好的,那么这就是这个实时记录。第二个就是上传音频,然后这个地方的话,你点击上传,然后点击或拖拽本地的音视频文件到这个地方,转写语言跟刚刚的一样。如果这个文件的语言是中文就用中文。我上传了我之前的一个答疑视频,然后呢它能够很好的去根据我的内容进行分段。但是它这个分段呢还不够细致。比如说我的答疑视频只有十二个问答的,但是它只分成了三个大段。
下面的这个内容的话语言文字识别还是不错。但是在出现专业词汇的时候,需要我们手动再去修正一下。通过替换查找功能,可以很快的帮助我们修改其中错误的单词。如果你的视频太影响,就可以把它收起,这也是一个非常人性化的功能。另外视频的话呢它也有跳转功能,你点击对应的对话框,它就能把视频跳转到对应的时间点。以上就是通义听悟的一个实际体验效果的感受下来的话呢。
感觉确实有用,但是呢还有进步的空间。接下来我们来看一下另外一个工具啊,这个工具的作用就是可以一键总结各种音频视频的内容。你只需要去把这个视频的链接复制进来,点击一键总结,它就会去下面给你生成了,或者你去上传本地文件。两种方法都是可以的,这个就要比阿里云这个好一点。就是它可以直接在线去进行一个总结,就不用我们去下载视频了。好像刚刚的那一篇呢,我继续给它直接复制上去之后,就得到了下面的这个情况。
它会有几个可以看到,第一个是大纲视图,就会很简略的去进行一个。介绍。然后下面还有一些这种emotion的图标,我觉得很适合放在小红书里面去做这种内容推荐。第二个就是思维导图,那这个的话也是可以有多种方式。你可以下载图片啊,或者直接去下载它的这个文件,然后去进行修改都是可以的。然后第三个就是这个字幕列表。
你字幕列表就是你能够看到它的每一句话,四个文章。视图点击对应的文字,它就会直接跳转到那一个地方去进行播放,就和刚刚的通义听悟一样。另外它还有保存到notion的选项,这个功能就会更丰富一些。他最近更新的这个功能,我觉得非常的好用就是。开启对话的按钮。看在右侧呢,它会就有一个小机器人。
然后呢你可以通过提问,让机器人呢去结合视频里面的内容,还有他自己数据,然后来给你做一个回答。这就会比通义听悟里面的问题回顾要更加的灵活。但是它有个体验不好的地方,就是因为它这个视频是一直悬浮在这里的。而且当我点击了时间点之后,它这一段文字占比非常大我这一块的操作空间就非常小,不知道这个能不能折叠。如果能够像通义听悟那样把视频折叠起来就更好了。好的,那么就是另外一款软件的一个介绍了。
它的优势呢在于这个对话功能非常的方便,而且呢它还支持多种形式的导出。但是通义听悟的话是由阿里云做靠山的。呃,这个小工具的话呢好像是个人开发的。所以这两个体量是非常不一样的。在用户体验呀还有u i界面上,肯定是阿里云会做的更好一些。另外,阿里云的免费时长可以随着分享而叠加,而这个软件的免费时长是有限的,后续就需要进行付费了。
最后就是一个进阶的小技巧的分享了。结合通义听悟和p p t的工具,来对我们的学习内容进行进一步的处理和消化。首先我们把视频转换成文字之后,把这个文字全部复制出来,然后把它放进cloud界面里面。让cloud学习这段文本,并且提出一个问题让他给我们进行解答。最后问的是这个视频讲述了什么内容,然后他就去给我归纳总结了一下,然后我觉得他讲的还是很好的,然后呢我再去进行这个衍生,根据这个内容呢,我我应该怎么怎么办去提个问题。他也可以去根据视频内容以及他的数据来进行一个回答。
结合提供的文本,cloud能够很好的把语言转化成我们能够通俗易懂的文字,而且他说话也非常的有礼貌。另外cloud还是免费可以使用的,所以呢我们用通义听悟加cloud 这样的组合模式。可以很好的去处理我们的学习资料,帮助我们提升学习效率。总的来说,通义听悟还是一款非常不错的音视频a i助理国产的软件。而且呢它现在还在测试阶段,你也可以在你的使用过程中去进行实时的反馈,帮助这款软件变得更好。期待听悟变得越来越好吧。