如何用chatgpt去模拟人类的行为?#ChatGPT打造NPC小镇#AI科技#人工智能

chat g p t的强大大家应该都知道了。那么如果我们用chat g p t去模拟人类的行为,为二二十五个chat g p t生活在一起,会发生什么样的事情呢?最近来自谷歌和斯坦福的团队就做了这样一个很新的实验,并且用open i的a p i创造了二十五个n p c。然后把它们放在一个沙盒中去模拟,让他们像人类一样去起床、刷牙、吃饭,甚至去出门上班,然后社交。其中每一个n p c都有不同的身份和行动的啊角色驱动力。结果发现在这个小镇中,不仅这些啊n p c可以像人类一样去生活,并且他们还会去创造一些属于他们自己的故事。

在论文作者们经过少量的实验之后啊,认为chat g p t是可以模拟人类的行为的,并且将模拟人类的这些机器人称为生成式的代理。在这个视频里呢为了简便起见,我们在之后都称它为n p c。这些n p c是可以自发的去做,比如说上班啊、睡觉等等的事情的啊,并且能够与环境中的呃物品发生交互,比如说洗衣服啊、冲咖啡之类的,呃,以及也可以去跟其他的n p c用英文进行交流。更离谱的是呢,他们在和其他n p c发生了交互之后,他们还能够去和其他n p c去交朋友,然后或者搞暧昧,聚众搞party等等等等。在古文中描述了几种啊不是预编程,而是emerging出来的这种社会行为。

第一个就是传八卦,在论文中描述了这样一个例子。有一个叫sam的老哥在早点买东西的时候跟tom聊说啊自己准备去竞选市长啊。然后sam走了之后,有一个叫做join的人,他从其他地方也听说了sam准备竞选市长。然后在杂货店里这个john和之前那个汤两个人就对于sam要去竞选市长这个事情就聊起来了,并且聊到了这个sam的获胜的可能性,然后以及他的竞争对手什么之类的。就这样这个镇子里的其他人也都开始聊sam要去竞选市长这个事情。

然后一传十,十传百,然后基本上整个镇子里大家都在讨论这个消息。玩过r p g类型的游戏的朋友们就知道,现阶段的r p g游戏里,大部分n p c都是这个工具人。除非是预编程好的剧情,其他时候呢其实你是这个n p c的救命恩人或者说杀父仇人。他们在街上遇到你也会懒得去聊你。但是呢在这个模拟中,这些n p c他是有一种呃关系记忆的,就是他能够记得和某个人他的关系怎么样,以及记得那个人的事情。

在论文里作者也举了一个例子,有两个人在街上,他们初次相识的时候啊,其中一个人提及自己正在进行一个呃摄影的项目啊,在之后呢两个人再次相遇了。然后和正常的人一样,另外一个人和他聊天的开场白就是哎,你那个摄影项目进行的怎么样了?这个就非常非常的真实啊。搞事情这个社会行为也非常非常的厉害啊,以前我都完全没有办法想象一个机器人或者说一个编程出来的东西能够做到这样的地步。有一个叫做伊萨贝拉的n p c,在被设定了一个在二月十四号下午啊去搞一个情人节的party的初始意图之后,就开始自主的邀请他的朋友们来参加这个party。然后他的朋友们呢又邀请了朋友的朋友们,并且有人答应啊,有人拒绝。

于是这个伊萨贝拉在十三号的下午就开始布置起了这个搞party的呃现场的咖啡厅。二十四号的时候答应邀请的是n p c也如期的到场,然后这个情人节party就顺利的举办了。这这这个网站就是斯坦福谷歌团队们放出来的呃n p c们所生活的小镇的啊录像。就可以看到不同的n p c他们会在啊这里有所活动,以及往下翻我们可以点击不同的n p c,然后来看他们这个行动的轨迹,可以看到这个地方t m和这个j l应该是正在聊天,可以看到他们所聊天的对话。如果有兴趣的朋友可以去这个网站看一下这个录像。

当然了,只是把这个链接放出来给大家看啊,其实并没有太多的关于这个h r g p t的更深层次的收获。关于这个实验呢呃stanford和谷歌团队在四月十三号放出来了他们的论文。在这个视频里呢我们是希望和大家一起来去快速的阅读这篇论文,来看啊他们的这个n p c到底是怎么实现的,以以及主会聊一聊未来可能会造成的影响。我呢也把这篇论文做了中文的翻译,如果有兴趣的话可以去找一下这个原文。论文中的生成式的n p c是基于chat b t来构建的。

那么他们到底是如何办到的呢?其实呢open a i的接口来去做一个这种仿真式的a i有一个显而易见的问题,用过的朋友应该都知道,就是头肯限制g p t是没有长期记忆的啊。对比人类来说的话,人类在行动的时候则会有非常非常复杂的动机。可能是因为自己的个性,也可能因为今天的心情,也可能对于呃他人的判断。那么四零九六的头肯肯定是没有办法去直接模拟出人类的行为的。我觉得在这篇论文里提到的好几个方法啊,就取得了非常不错的效果。

并且对于我们未来拿ai去模拟真实的人类也会有很大的启发。论文中构建生成式代理的方法啊,基本上可以分成四个部分啊,第一个部分就是人物设定了,这是在创建的时候对于某一个智能体的设置。就是让他清楚他的人物关系,让他知道他的个性是什么样子。然后他的基本的这个人物的设计,这个就没什么好说的。如果需要chat g p t去模拟人类,我们不能直接把呃最近发生的所有的事情传给他,然后让他把这个内容概括出来再去回答问题。

呃,因为当你去问一个正常的人类今天过得怎么样的时候,他不会把今天干的所有的事情啊都回忆一遍,然后再概括总结出来,然后再回答你今天过得怎么样这一个问题。论文呢在这里使用了一种叫做记忆流的方法,每发生的一件事情都用流水账的方式记录下来,然后每次再做下一步的决策的时候,对流水账里的每一项记忆进行三种参数的评估和检索。第一种是recency,但事情发生有多近,越近发生的事情赋予recency越高的值。第二个是importance,就是重要性。这件事情对于n b c来说有多重要?重要性则由n b c自己来判断,一最普通,十最重要。

比如说某个n p c就是判断整理房间是二,而与喜欢的人约会则是八。第三个就是relevance,这件事情与当下n b c所处的环境有多相关。那么当下遇到的任务的文本去和流水账里的所有的文本进行向量的匹配。比如说当下如果是在和同学们讨论作业相关的问题,那么关于老师啊课程之类的啊记忆的文本就会匹配度比较高。而今天早上吃了什么之类的文本匹配度就会相对来说比较低。

再将流水账中的每一项的三个参数啊量化出来,并且相加之后再排序,从中选出最可能被回忆起的那些记忆项,然后作为prompt啊传递给g p t。这个时候n p c就能根据这个信息来做下一步的行动了。大家可以考虑一个这样的场景,就是你问一个正常人,如果你可以选择你认识的一个人一起度过接下来的一个小时,你会选择谁?对于正常人来说,可能会选择自己暗恋的对象,也可能会选择自己的idol或者选择一些崇拜的学者之类的。只有刚刚的流水上的情况下,对于这些n p c来说,他很有可能就会选择的是最近互动或者见到的最频繁的人。如果按照这个逻辑,你很有可能选择就是啊天天在你面前c p u你的老板,那说明只使用流水记忆的这个逻辑不正常,而你也不正常。

于是呢论文引入了第二种记忆,被称为反思。啊,反思是由代理生成的更高层次的更抽象的思想。同样的这个反思也是直接扔给c h b t,让他自己去生成。比如说对于n p c k m来说,他就是这样去生成他的反思的。然后根据c h p t的回答,这是一个树状结构的反思。

越高层次的反思它越抽象也越概括。因为呢这个反思是一种记忆,所以在检索的时候,他们和。其他的观察结果一起被包括在内。反思定期的生成,大约每个n b c一天会反思两到三次。到这里由过去发生的事情的记忆,已经可以去驱动n p c干啊那些看起来合理的事情了。

但是呢大部分的正常人类的行为还会有一个相对长期的规划去作为啊顶层的行动力驱使。比如说你还有一个星期就要去进行期末考试了,于是呢每天你都会规划一定的时间去复习。而不是因为啊最近的流水记忆里全都是打牌或者打游戏,你就继续的打牌和打游戏。所以呢在每一天开始的时候,呃,这些n p c都会去做一个今天的大致规划。然后呃n p c也会跟着这些大致的规划去行事。

有了这几个组件之后呢,这二十五个n p c在这个小说中被模拟生活了两天的时间。尽管呢很多媒体报道了这件事情,然后在推特上也有不少的呃人在讨论这件事情啊,大家也都在说啊,一个呃西部世界在被构造出来,然后一个更有智能的啊这个虚拟世界啊,放在以后的游戏会发生非常非常大的变化。但是呢我还是认为这件事情的重要性可能还是被远远低估了,给g p t设定了合理的记忆模式以及啊行为驱动因素之后,啊,在模拟中智能体所表现出来的真实性,我觉得意味着以下几个事情。第一,注册式的人工智能,或者说呃a g h的人工智能,从技术实现的角度上来说,也许已经非常非常近了。想象一下,如果说你的人工智能助手啊能够根据你每天的行为来去模拟你,那么很多琐碎的事情他都可以去进行啊决策和辅助了。

就比如说几点钟应该叫醒你,什么时候应该准备好咖啡,或者说接下来日程会是什么。所有的普通人都可以像。现在的啊马云啊、马化腾这样的大咖一样拥有一个生活助理加私人秘书,这将会大大提高那些啊能站在更高层面上思考的人的效率。当然了,从另外一个角度来说,如果你没有办法做呃更深谋远虑的决策,没有办法做那些a i做不到的决策。那么你的工作和生活中的决策可能在未来会非常非常的依赖a i去帮你做决策,甚至可能会被a i取代。

社会中的思考的强者和思考的弱者将会拉的差距非常非常大,啊,马太效应将会进一步放大。第二个,人工智能体之间的互动可能会会取代人人类之间的大部分决策。我不知道啊这个结论可能下的有点过于夸张和武断了,但在这个实验中,人工智能体之间的互动给我留下了非常非常深刻的影响啊,我隐隐的觉得这次的大变革可能比我们想象中的更夸张。大家想一下,人工智能体之间的互动肯肯定比人工智能的互动更有效率,甚至可能会非常的深刻的可能。讨论某一个问题。

但是即使不考虑讨论的有效性,在机器的运作下,可能这个对话几十秒钟就能跑完。如果说在未来你我他都有一个秘书,当我做好决策之后,我需要传递信息,我只需要跟我的啊人工智能秘书说一声,然后我的秘书就可以去跟所有相关人的秘书开会了。然后一分钟之后,所有人的秘书根据自己老板的性格喜好啊,协商出来一个最优的方案,然后每个秘书再去汇报给各自的老板。这个过程中其实不需要浪费任何一个人一分钟的时间啊,甚至任何人对这个方案有不理解的地方,他都可以直接问自己的秘书,然后自己的秘书也会一一的去给他解答啊,不需要任何一个其他的人类花费时间去参与其中。曾经的那种你迟到了一分钟就浪费了全班同学六十分钟的这种事情再也不会发生了。

而且人工智能体之间的互动是以这个自然语言的方式去进行的这意味着如果我们对于结果不满意啊,可以往回追溯到底是哪一步发生。问题,然后从而对整个这个过程来去进行优化。我们也不会对于ai的这个决策过程失去控制。对此我只能说这是社恐的福音。第三点就是a i的所属权,伦理安全等等等等各种各样的问题已经非常非常迫在眉睫了。

在可预见的时间里,这个a i会越来越强,甚至都不需要出现一个啊试图毁灭的二五的a i伪造数据。对于a i过分依赖a i霸权,加剧这个呃阶级的分化等等等等各种问题,就可以让啊大部分的普通人当场褒贬。如果对这个事情感兴趣我非常推荐大家去仔细阅读一下原文,然后去呃看一下到底在这个小说中发生了什么样的事情。