这是一款支持免费使用p t s模型的一站式ai开发平台。在平台中你无需具备编程知识,就能够轻松地创造出强大的ai助理,并且能够把它集成到自己的业务系统当中。比如它能够每天为团队推送最新的a i资讯,它也能成为个人的媒体号助理,能够基于已经发布的内容自动的回复用户的问题,并且带有对应的跳转链接,点击后即可跳转到对应的内容。它就是由字节跳动开发出的a i应用开发平台cos在本期视频中,我将从技术原理的角度出发,向你解释什么是ai智能体,探讨它的核心功能模块和应用领域。接着我会详细的介绍智能体的具象化产品cos的使用方法。并且结合我自己的实际案例,如何使用cos来创建一个可以集成到你自己业务系统的ai助手,从而提高我们工作和生活的效率。
那我们直接进入第一部分,a i agent到底是什么?最近吴恩达教授在红杉资本a i峰会中分享了智能体agent的设计模式、工作流以及效果评估。智能体的工作涵盖了几个关键环节,包括对复杂任务的规划能力,对不同工具的调用能力,对输出问题的反思与迭代,以及多个智能体的相互协作。为了更具象的解释什么是智能体,我们可以看看github中一款名为t d的开源项目。通过这个项目我们可以更直观的理解智能体在实际场景中的应用。check dep是由国内大模型公司面壁智能联合清华大学n l p实验室共同开发的一个开源项目。它可以被看作是一家虚拟的软件公司。
但这家公司里的员工并不是人类,而是各个不同角色的智能代理,包括c e o、c t o、产品经理、程序员、测试设计师等不同角色。而客户则是真正的人类,我们只需要提出需求,比如开发一款乒乓球的游戏程序,然后这些智能体就会协同工作,进行讨论规划和程序开发,并且最终把成品交给我们。那除了check back,还有很多其他有趣的项目。比如你还有与复旦大学发表了一篇有关agent综述,文章中提到了一个涉及多个智能体的社会场景。比如场景的左上角有一个智能体正在点菜,同时另一个智能体正在规划如何完成烹饪的任务。我在右上角你会看到两个智能体正在讨论如何制作灯笼,以及正在计算制作灯笼的成本。
如果你对agent的技术和相关的项目,感兴趣我之前也发表过几期相关的视频和文章。深入探讨了这个主题,包括海滨g p t和auto g p t系列的视频,还有一篇深度剖析ai安全的技术原理和其应用发展的文章。我会把链接放在置顶的评论区,以便你及时的查阅。这些内容可以帮助你更好的去理解agents的技术原理和其应用场景。我们已经对智能体有了一个基本的概念,那现在我们把智能体从抽象的概念具象到具体的产品。我会通过cos平台展示如何搭建一个既能调用多种工具,还能进行专业知识对话的聊天机器人。
cos平台目前有两个版本,一个是面向国内用户的版本,另一个是面向海外用户的版本。两个版本的关键区别在于,首先海外版需要有魔法才能够访问使用,而国内版则没有这样的限制。其次,海外版支持多种语言模型,可以选择包括g p三点五和g p四的八k以及一百二十八k的版本,而国内版仅支持使用由字节跳动自己开发的云雀语言模型。最后,关于发布平台,如果你在海外版开发了一个机器人,你可以把它部署到disco de instagram、slack等平台当中。国内版则支持发布到飞书、微信客服和微信服务号等平台。考虑到今天的演示我们将使用g p四的模型,所以我选择在海外版上进行演示。
不过无论你选择哪个版本,操作流程都是相同的,所以就按照你的实际情况来选择合适的平台就行。啊。这个就叫专业。我们输入cos点com就能够进入到cos海外版本。登录的方式可以通过谷歌账号就能进行登录。登录成功后,你首先看到的就是cos的欢迎页面。
你可以直接跟大模型进行对话,让模型来介绍产品的功能、使用方法。甚至我们有了初步想法后,只需要表达我们的需求,它就能够帮助我们创建一个a i机器人。我们接下来来看探索模块中的机器人和插件的商店。在这里你可以直接搜索并使用商店中的其他人已经创建好的机器人和插件。最后我们来看个人空间,在这里你可以找到你所有已经创建好的机器人。除此之外还有插件的模块。
cos的插件功能类似于g p d s的action功能,能够实现机器人调用其他应用的能力,从而增强特定问题的处理效果。紧挨着插件的是工作流模块。一旦你的机器人集成了工作流,它就能够自动的完成一系列的标准化的任务,比如自动检索指定推特账号中发布的最新ai资讯。此外还有一个非常重要的部分就是知识库。你上传的数据会被存放在这里,创建的机器人会利用这些数据来检索信息,以此来提高模型输出的质量和准确性。如果你对这方面的技术原理感兴趣我之前发布过一篇关于rac增强检索的科普视频,你可以在视频下方的评论区中找到相关的链接进行查看。
那接下来我会教大家如何一步一步的去创建具备实时更新本地知识库的ai助理,并且还会把它集成到我们的日常应用当中,为我们提供及时的服务。在这个案例中,机器人作为我的媒体号助理,当然使用同样的方法,你也可以去创建像企业知识顾问、智能客服等ai应用。创建机器人很简单,有两种方式可以选择,首先,你可以像我们之前演示的那样,通过跟平台模型表达需求的方式来创建机器人。另一种方式是可以在个人空间中点击创建机器人的按钮,创建时你需要给机器人取个名字,写下描述,还可以让ai帮你生成机器人的头像,所有这些都设置好之后,点击创建,你的机器人就成功创建好了。创建成功后就进入到了机器人的配置界面。每个机器人的配置界面都包括三个部分。
我们从上往下看,首先它有两个模式,单代理模式和多代理模式。单代理模式是指你创建的机器人实际上就是一个独立的实体,也可以理解成一个单一的语言模型。而多代理模式与单代理模式的差别在于,在多代理模式中,允许你的机器人包含多个代理,也就是多个语言模型,这样就可以让机器人执行更复杂的任务。因为不同的代理可以专门去处理不同类型的问题。对于多代理模式的配置,我会放在下期视频当中进行详细的讲解。然后右侧就是我们用到的模型,可以选择g p d四一百二十八k g b d四八k和g d三点五,我就选择g p d四一百二十八k来进行演示。
因为它提供了更广的上下文的处理能力,这意味着机器人可以更好的理解和响应复杂的对话。再往右侧就是预览窗口,在创建机器人的过程当中,你可以实时测试机器人的响应是否符合我们的预期。这样我们就可以不断的对机器人进行优化和迭代。在下面左侧的这一大块就是用于编写提示词的区域。你可以在这里定义机器人的角色,他需要完成的任务以及他的行为边界。如果你已经有了预先准备的提示词,可以直接将它们复制到提示词的区域。
当然,你也可以根据自己的具体需求编写新的提示词。编写完成后,我们可以利用ai优化提示词的功能来对提示词进行优化。完成这些步骤之后,我们就为机器人设定了一个清晰的角色技能和行为边界。中间这一块就是给机器人添加技能树的区域了,包括插件、工作流、知识库和一些其他配置项。首先我们从插件开始介绍。在这里你可以添加各种现有的插件来增强机器人的能力。
比如谷歌搜索g d四的图像识别代码解释器等等。你也可以通过搜索或者按照类型去查找需要的插件。这里我勾选了网页插件、web pilot和话术插件打理三来进行演示。接下来就是工作流创建,工作流会稍微复杂一些,而且在我们的演示案例中,本地知识库机器人暂时还用不到工作流,所以我也会在后续的视频当中进行工作流的详细讲解。这里我就不去做演示了,现在我们将进入到本次演示的核心功能。增强机器人的记忆能力。
在这里就包括了几个重要的组件,如知识库、变量数据库和长期记忆。首先就是知识库,点击加号,你可以添加已经上传的知识库,或者创建一个新的知识库。那我来演示一下如何创建知识库。点击创建知识库,页面就会跳转到个人空间中的知识库模块的页面,输入名称和描述后,就能往知识库中上传内容了。每一个内容叫做一个unit单元添加单元的方式,支持文本格式和表格模式。在文本格式中支持上传本地文件,如p d f t s t等文件格式的文档,也可以通过链接来添加网页。
比如我添加了一个基于notion搭建的个人网站链接,这个链接包含了我的个人介绍,往期的文章和视频,以及我体验的一些a i产品。添加链接后可以配置cos抓取网站数据的频率,这里我设置是一天。这样cos就能每天自动的去抓取网页中的最新内容。那在表格格式中支持上传本地文件,如excel和c s v文件,也可以通过a p i去获取jason格式的数据。这里我直接上传了一份c s v文件,里面包含了我的视频标题、播放链接之类的字段。上传完成后,系统会自动的识别出表格中的表头字段。
我们需要做的就是选择表头的索引,这将决定通过什么样的字段来检索表格中的内容。这边我就选择了视频标题作为索引,完成设置后就可以预览系统识别的表格信息。确认无误后,系统将处理文件并保存数据。现在我们的知识库就已经成功创建,并且里面包含了两个单元的内容。一个单元是自动从我的个人网站中抓取往期的视频和文章数据,另一个单元是我上传的表格文件。知识库创建完毕后,我们需要回到机器人的配置界面。
我们可以先测试一下没有添加知识库的模型表现。比如当我们询问请推荐在野的热门视频时,机器人因为没有相关的数据支持,是无法提供有效的回复的。接下来我们将刚刚上传的数据添加到机器人当中,再进行一次测试。这次当我们输入我想了解agent的相关知识,机器人就会自动的去检索数据库的内容,并找到与请求匹配的文章。我们点开链接可以看到跳转到的页面也是正确的。我们再测试一次输入如何通过a i创建音乐。
同样机器人也会去检索数据库,并且给出相关的视频链接。我们点击链接页面的跳转也是正确的,可以直接对视频进行观看。通过测试我们可以发现,一旦机器人配置了知识库,它的功能和效率都得到了显著的提升,能够提供具体和准确的信息。现在我们已经完成了所有的配置,接下来就是发布我们的机器人了。发布的过程也非常的简单,只需要按照官网的操作文档进行操作就可以了。我这边就不去做具体的演示了。
不过对于发布到飞书平台而言,我这边补充一个操作文档中解释的不太清楚的一个细节,在cos平台做完飞书授权发布后,需要到飞书应用管理平台进行审核后才能使用,不然发布的机器人就一直处于审核中的状态。好了,那我们来简单回顾一下本期视频的内容。我们首先探讨了agent的基础原理和相关的开源项目,然后在cos平台详细演示了如何创建一个具备实时更新本地知识库的a i助理。如果你对今天内容感兴趣,不妨动手实践一下。在操作过程中如果遇到任何问题,欢迎在评论区留言,我会第一时间回复你。今天的视频只是一个基础的入门教程,未来我会更新更多有关cos平台的进阶使用技巧,包括自动化工作流、数据库配置以及在多代理模式下的使用场景。
如果你对这些内容感兴趣,别忘了点赞、订阅并分享这个视频。非常感谢你的观看,我是三爷,咱们下期见。