帮你查看网络热点,然后按照你的风格写篇媒体文章。根据设计公司一贯风格和要求,学习当季流行和气温变化,直出服装线稿、模特图和海报。根据出差目的地判断天气,自动添加日程,提交公司审批,查询机票酒店。跨应用管理项目和知识库说人话,就可以自动发布和安排任务,查询进度和完成情况,获得优化建议。
在对面跟你一起工作的,可能已经不是真人,而是一个个的数字同事。不是这种你已经看滥了的虚拟主播,而是编辑秘书、项目经理或者设计师。而且这样的数字同事和员工你也能拥有。在钉钉当中找到a i助理市场,点击添加就可以了。
如果不满意,你也能自己做一个。a i助理的本质就是给定一个具体的角色,并且基于这个角色模仿人的行为模式。但要做到这一点,他至少需要四重能力。第一重能力,大模型本身的基本能力。
头脑风暴、编故事、做方案、写摘要、翻译润色,包括对话的方式、语气、角色。当然还有基于多模态的能力,比如语音、视频、图片的生成、总结和描述。但是大模型在相对专业的事情上,给的方案泛泛而谈,文章没头没尾,你要么费时费力去做prompt重复沟通,要么毫无卵用。所以我们需要给他第二种能力。
第二层能力就是基于场景或环境的感知、记忆、规划和执行能力。比如告诉你的角色假定你是谁,这是什么环境,需要做什么,如何跟我沟通,更重要的是投喂一些你想让他了解的知识,如果有必要的话,给他特定的工具,比如查天气的a p i接口,获取微博热搜的a p i接口,然后你直接对他说人话,就会得到一个更聪明专业的ai助理,这其实就是a i agent或者智能体。不过,帮你设置假定场景,疯狂投喂知识,钉钉本身就是天然真实的工作环境。通过深度的环境感知记忆以及给到可用的工具a i就会在具体的项目当中更精准有效的规划和执行。
并且这些规划和执行的过程和结果又会重新存储的记忆,下一次帮你做的更好。比如帮你快速摘要一场会议或群聊,就是基于你们团队的明确摘要,而不是泛泛而谈。基于你们公司或团队日常对话的信息和问答助手或者故障解决方案设计公司。基于自己的大量数据和需求生成的效果图、模特图以及海报。
这些能力都可以直接在a i助理详情当中看到,你也能自己添加其他能力。如果你是自建助理,直接打开这里的开关就可以了。如果不够用,也可以用a p i接口添加更多工具,创造更多能力。当然还有一些可能被忽略的东西,比如直接通过a i助理唤起钉钉功能,比如投屏、深色模式白板。
第三重能力是模拟人类的任务思考和执行过程,处理其他复杂任务的能力。举个例子,自建一个ai助理角色是项目经理,去管理你notion当中的工作空间,让他随时听你指挥。添加删改任务,统筹规划进行安排、查看完成进度、提供规划建议、报警通知。这些事情当中的任何一项,对人来说只有简单几步,比如添加个动画制作任务,只要输入项目名称、负责人、优先级、截止日期,但我们脑子里其实一直在想,项目管理器在哪儿?名称是啥?谁来负责动画师?这些人谁是动画师?这个任务急不急?这个思维过程对你来说很轻松。
因为你是这个公司的人,之前参与了相关的会议讨论,或者有别人给你信息,你还知道公司里有哪些人,分别负责什么,甚至他们的绰号、昵称,你也知道怎么用notion这个工具,怎么找到项目看板,怎么添加任务。换句话说,面对这样的任务,人类也是感知到周围的环境和接触到的信息,存储为脑子里的记忆,并会在需要的时候调取这些记忆来进行任务规划,最终利用外部工具来一一执行。但大模型还做不到这些的时候,我们可以模拟人的思维链路。让大模型在链路的多个步骤当中去负责输入输出和工具使用,然后将整个链路重组为完整的工作流。
比如我对a i助理说句话,他就能自己理解我说的啥。然后帮我在notion当中添加一个任务,我把它拆为我对a i说句话。a i从我的话中提取关键字段,把得到的字段送到notion a p i返回信息告诉我是否添加成功。在执行过程中,我不仅对a i提出提取字段的具体要求,而且还通过说人话而不是编程告诉他如何提取,最终实现一个完整的工作流。
一系列工作流集合起来,这个a i助理就有了处理复杂任务的能力。到目前为止,a i助理拥有了一个普通人类的基本能力,以及通过工作流处理复杂任务的能力。a i在整个助理的层面,基于场景进行感知、记忆、规划和执行。在工作流的具体节点当中也在做着类似的事情。
比如他会记得你的同事张三的绰号是狗剩,你就算说把任务安排给狗剩,他也会听得懂。又或者你添加了一个动画制作任务,但并没有指定负责人。a i助理会自己理解这件事,然后默认安排给动画师,但是还不够。钉钉的ai助理还有第四种能力,那就是学习并模仿人类操作过程的能力,通过类似录屏等方式,你可以让机器学习模仿人的操作步骤,进而在今后类似的操作中完全解放双手。
比如模拟一次故障报修流程、表单签到流程,下次你只要说句话,a i助理就会帮你自动执行。而且它并不是简单重复你的操作步骤,而是学会你的操作步骤之后去处理同类型的任务。a i大模型百花齐放一年多,因为缺乏实际的应用场景等问题,让普通人在玩个热闹之后束之高阁。而钉钉恰恰天然拥有丰富的办公场景应用和企业数据和agent的一结合,通过至少这四种能力的加持,就能自然生长出企业和个人都能用得上的a i助理数字员工,让a i对每个普通人产生真正的价值,而不是遥远的概念或者玩具。
让工具回归,工具让你成为你。这里是top,我们下期再见。