如何用open interpreter帮你自动下载图片。我讲这个题目是很兴奋的啊,这个王老师又找到了新玩具的感觉啊,我们来看一看。这个首先我们先来这个回顾一个概念,叫做code interpreter。它是个什么东西呢?是chat g p t啊,括弧得是plus版本才能享有的一个模式。
呃,我在今年的五月份就给你介绍过它啊,如果你对它有些淡忘了的话啊,欢迎回去复习啊。呃它是可以干什么呢?能帮你自动的分析数据,能够帮你做数据的高级可视化等等一系列的功能。这个例如说这是拿它做机器学习啊,你上传数据集,它能够给你最后跑出来一个模型,还能够告诉你这个模型最后的准确率有多少。然后呢还能干什么呢?这个是它直接做出来的一个模拟仿真的,这个相当于信息的传播的结果。哎,这里呢你可以看到他现在改了名了啊,叫advanced data analysis。
打他刚出来的时候,我就说这名儿不对是吧?这个什么code interpreter让人经常望文生义,容易错过啊,现在改了这个名好多了。嗯,但是呢他现在还是有一个功能的缺失,这个功能是什么呢?就是联网能力。嗯,我可以理解对吧?因为你要是让他去联网的话,这第一成本上不好把控。第二呢也很难保证这些用户,对吧,这里面也藏龙卧虎啊,谁要用它干一些这个呃不符合open a i官方的这样的一个期望的活动啊,这个事儿也确实难以控制。所以联网的功能到现在都没有在这样的一个模式当中提供,这就带来了很多的问题啊。
因为我们现在你说干什么事能离开网络,所以一旦你没有这个功能的话,许多的这个我们的一些设想都没法在这样的一个模式当中充分发挥chat g p t,尤其是g p t四它的这种啊强大功能。嗯,所以说这个是一个很让人遗憾的事儿。那么例如说在这里我就给你举个例子啊,假如说我们让他给我去下载一些这个内容,他直接就告诉我说我们我无法啊直接访问互联网来下载图片。哎,所以呢但是我可以指导你自己如何操作啊,这我用你啊,对吧?我自己会啊,再再说了,我不会我也用不着一个机器来指导我去做这些基础的枯燥的活,对吧?那么这里给你介绍一个概念叫做open interpreter啊,这就是我说的这个新玩具,它是一个这个开源的项目啊啊这个你可以看看他那个星数的增长的这个速度啊。嗯,他自称啊是这个开源版的code interpreter啊,这个而且更强。
这是我前两天发在这个知识星球上的一篇文章,介绍这个模式。呃,当时我介绍的呢是怎么用它自动做这个数据的可视化。但是今天咱们要充分发挥它的其他能力啊,就是这个联网的功能。这个联网能力呢它补充上了。因为它可以充分的利用你本地电脑的能力,你本地电脑连着网,它就算能联网。
那么我们来举一个例子啊,这个例子呢就是刚才说的想让code interpreter啊啊或者现在叫高级数据分析模式做的这样的一个图片数据的下载。有的人可能不知道为什么这个你你要批量下载一堆图片呢?实际上是这样,机器学习里经常有这样的需求。我们构建一个模型,让它帮助我们去区分不同种类的图片,这个来讲是一个常见的任务。可是这里面去网上数据的图片,这个实际上是一个非常辛苦的活。那么我在之前,这应该还是在好几年前了啊,当时我介绍如何用python和fast ai做这个图像的深度迁移学习。
在这一篇里面我们提到了当时用的一些数据,例如说有这个哆啦a梦和瓦砾啊,让他各下载了一些这个图片,当时啊这个手动下载。啊,刀耕火种是我自己干的啊,现在我希望什么呢?让open interpret ter替我们做啊,千万不要让我在自己动手了啊,你来啊,那他做的怎么样呢?下面我来给你实际的演示一下,我们来看看现在的这个提示语。这里说呢首先新建一个data目录,下面分别建立子目录,一个是哈利波特,一个是江湖川柯南啊,上网找寻这两个类别对应的图片各三十张。这里有一条啊,注意不能是重复的,因为什么呢?我们都知道这网上的照片啊和图片有很多。是重的,我能与这个重复的显然无异于后面我们去做这样的一个训练,对吧?然后呢告诉他分别存在对应的子目录下,哎,建议你啊分步执行。
对呀,哎先下载一张图片测试,哎,如果可以再批量处理。哎,这个呢是我当初用auto g p t来做这个相关的工程项目的时候,从中吸取的教训。因为什么呢?毕竟我们要使用a p i啊,这东西调用起来那也是要花钱的。如果呢出现这种一个图片都没过去,哎,这个呢是我们重复三十的,你想想看这多少钱对吧?所以呢我们就先先让他先先把基础的试点做好,做好了以后再说,哎,这是我们给他的一个要求。哎,最后呢还是要这个客气一下啊,说句谢谢。
有了这样的提示词呢,下面咱们就可以开始来执行了。执行的方式呢是我们按一下回车,然后呢他就可以开。是来实际的进行操作了。首先呢你会看到啊,它会给你来编制任务列表,对吧?哎,第一项要新建data目录,然后新建两个子目录。第三哎找一张图我们来测试。
第四,另一个类别找一张图,如果成功我们怎么怎么样啊,下面他就正式来开始。首先他现在来创建这两个目录,那么告诉我们很快这个目录就创建好了啊,嗯然后呢现在很快就会遇到问题了。这个问题在哪儿呢?也很简单对吧?就是他在执行的时候跟你这个系统的环境需要一个磨合。哎,他有时候执行,他发现自己啊把自己想象成在notebook里,实际上根本就不是啊,他在shell里面,那怎么办?他就得重新的把这样的一些这个命令重新的改写。改写之后哎,然后就可以正式的开始来进行测试了。
那么他在这里面哎一测试果然又报错了。那这里呢他说又遇到错误了啊,我现在把人像先隐藏一下,对吧?看看他会跟你说这里面是什么什么的原因啊。说完这些原因之后,他自动进行修改,这中间不需要你干预啊,他把这些重新的来改写之后,用改写好的然后来给你去这个进行相关的这个展示啊。那么在这里他说又遇到了一些问题,那么他自动的再去把这个问题加以解决,重新的。编制一段代码,把这个东西再给你来讲解清楚。
那么这里面你注意到他这回是执行成功了啊,他说很好,这时候已经成功的下载了一张哈利波特的那下面呢就是江湖传柯南的这里面他可以开始,然后因为刚才已经有一个成功的例子了嘛,所以他在这回从里面去这个下载的时候,相当于有了经验,只需要修改一下那个关键词而已。对他来说这个应该就是非常简单的问题了。那你可以看到啊,他这个时候已经是哎又下载成功了江湖传柯南的这都是里面那张test的这个照片。那下面他就要这个把那三十张已经给他弄齐,而且呢他说现在要防止重复,怎么办呢?就是我每次先看这u l每回下载的把它存起来,新的u i l呢我和他进行比对,如果是一样的,那我就不再弄了啊,如果是不一样的我再去下载。哎,然后他又在这儿开始编制,你看这时候他已经呃不是只执行一回了啊,他这时候要反复的去循环来执行。
哎,首先做的呢还是哈利波特的,你可以看这就一张一张的图片啊,这就开始来下。但是呢下着下着你会发现啊卡住了。不过呢你也别担心啊,虽然说他卡住了,但是呢他会自己来意识到这里会存在着问题,然后尝试着用他的方式帮你来这个解决。那么这里面你看这里他指出来了啊,说这个下载的时候遇到了问题,因为什么呢?一页上可能放着他就是不足三十张,所以从这一页上他凑不齐三十张怎么办呢?他于是这时候就来这个尝试一下啊不同页面,然后来下载,那么这个时候他又改进了它的这个代码,然后呢重新来运行,为我们提供新的运行的。结果哎你可以看到啊这个每一次他的这个输出都在改进。
然后你看这回啊他在执行的时候啊,比刚才的这个要流畅许多了。我们来等一等啊,看他这个是不是能给我们正确来弹出这个提示。哎,你看现在他已经说了,成功的下载了三十张哈利波特的图片,并且保存在这个目录。那下面呢他要开始来找这三十张江户川柯南的图片了。这里呢为了这个节省时间啊,咱们就不把这个从头到尾再给你去进行演示了。
但是现在你已经知道这个意思,就是他是通过怎么样的方式来帮助你啊把这些这个图片给他攒齐,中间呢也会对这个重复的问题加以解决。由此呢就可以帮助你通过他的联网能力,通过他的这样的代码执行能力,哎,在你这里可以对目录操作啊,下载内容,还能够。自动的对数据进行呃重复性检查,可以说可以节省我们很多的时间。好,演示结束。我不知道你现在对于这事儿怎么看啊,我给你小结一下。
首先它成功的完成了我们的任务,对吧?这个批量是我们指定的三十张,你也可以多指令,对吧?你可以看到它因为具有这种不断的这个翻页功能,所以这不是问题啊。然后呢,当他自己卡壳或者遇到障碍的时候,他自己能够去处理,并且提出解决方案,然后还去解决它。这里面的对话持续了很多轮啊,并没有受到那个tokens长度的这样的一个明显的限制啊,哎但是确实他可以在其中不断的尝试去修改自己的解决方案,给我们提供更好的方式。还有一个事儿是他把这个代码不是做出来了吗?他最后给我们来提供这个结果,也是通过他自己编写的代码,然后下载到了图片。告诉你一个技巧,这个代码一定要把它保存好。
你直接说一句,你说说你给我保存下来就可以了啊。他把这个代码给你直接下载下来。那么有了这样的一个代码,你可以干什么?下次再做的时候,就没有必要从头的然后去去这么去做了。你可以直接的让他从这个提供的可行代码改改好,比如说我需要更多的张数。我需要改变其他的这样的卡通人物啊,这样的获取,我只需要改这个代码就可以了。
这样可以做到什么?第一节省时间,第二主要是省钱的。你这个跟他对话调a p i呢是要花钱的。哎,这招我跟谁学的?我跟安t老师学的啊,这是那天我拍的照片。他这个来做这个呃报告的时候,他这里面有最后一条叫自动化和固定啊,这个固定是什么呢?他曾经干过这样的事儿,就是先是啊调用这个chat g p t大量的对话试错,然后哎他最后把一个这个代码给他写定了。好,从此之后他可以做什么?退订chat g p t啊,以后就改这个代码,下次再需要这样的情境的时候重新再定啊,这这样可以省下很多钱。
我觉得安迪老师分享的这个方式是这个非常好的啊,也建议你来尝试使用。