AutoGPT和BabyAGI是AI的新热点但它们现在很糟糕

  • 发布时间:2023-04-25 10:27:19 来源:
标签:
导读 忘掉ChatGPT、Bard和BingChat!那些机器人太过时了,它们还不如尖叫危险,威尔·罗宾逊!或从盒式磁带上读取节目。AI的下一件大事,至少在本

忘掉ChatGPT、Bard和BingChat!那些机器人太过时了,它们还不如尖叫“危险,威尔·罗宾逊!”或从盒式磁带上读取节目。AI的下一件大事,至少在本周,是自主代理,这是一个程序,它接受一个或一系列目标,然后制定自己的任务列表,并遵循这些任务列表。

试想一下,要求代理编写计算机程序或开发工作演示文稿。你离开几分钟,然后回来,机器人会提供你所要求的东西,尽管它必须经过几十步才能到达那里。这听起来很棒,也许有一天会这样。但是现在,这些工具更多的是概念验证,而不是有用的实用程序。

在过去的几周里,我开始使用两个领先的自主代理:Auto-GPT和BabyAGI,虽然它们都有潜力,但现在我找不到一个它们做得很好的实际用例.公平地说,这些代理只是使用相同的大型语言模型(LLM)、GPT3.5和GPT4,当您输入提示时,它们会犯很多错误。这些错误被这样的事实放大了,就像EnergizerBunny一样,agent会继续走在错误的道路上。

Auto-GPT:请停止过度使用

Auto-GPT由一家名为SignificantGravis的公司设计并发布到Github,是一个Python应用程序,它会在您为其设定一组初始目标后完成自己的任务。安装该应用程序相当简单,如果您想自己尝试,我们提供了有关如何设置Auto-GPT的完整教程。

要使用Auto-GPT,您只需要获取一个OpenAIAPI密钥,该密钥可免费获取,但每次代理执行任务时都需要付费,并且必须访问OpenAI服务器。当你第一次注册一个账户时,你会得到几美元的免费信用(我一个账户有18美元,另一个账户有5美元)并且,考虑到每个请求可能只用掉一分钱的一部分,你的免费信用可能还可以用于实验。

无论您使用的是Windows、Linux还是macOS,您都可以从命令行运行Auto-GPT。然后它会要求您命名您的代理并为其指定一个角色,该角色是一个广泛的目标和一组目标。我在Twitter上看到过很多开发人员吹嘘Auto-GPT是游戏规则改变者的例子,但吹捧的用例要么是机器人无法以其当前形式完成的,要么是那些模糊得可爱但无用的用例,比如为理论创业制定商业计划。

我最成功的Auto-GPT会话发生在我创建一个名为WebSiteGPT的代理时,其角色是为我发明的虚构网络开发公司Geek-in-ChiefDesigns设计一个三页网站。我的目标是编写和设计一个介绍公司的主页,制作一个联系我们的页面,并制作一个隐私政策页面,上面写着Geek-in-Chief设计根本不收集或出售用户数据。我还要求它将所有三个页面输出为HTML文件,然后停止。我不应该将停止作为目标,但考虑到这些脚本可以持续多长时间,我想确保它最终会结束。

整个过程大约需要45分钟和几十个步骤。默认情况下,Auto-GPT会在执行每项任务之前提示您批准。但是,您也可以通过输入y-[N]对接下来的N个步骤说是。所以,你输入y-100,接下来的100个可能的步骤会很好。

对于每一步,Auto-GPT都会显示一系列标注:WebsiteGPTThoughts、Reasoning、Plan和Criticism。推理部分显示代理接下来要做什么。例如,在第一步之前,它说“我认为我们应该从设计Geek-in-ChiefDesigns的主页开始。..我可以使用谷歌搜索来寻找网站设计和结构的灵感,也许浏览他们竞争对手的网站来获得一些想法。”

推理步骤解释了为什么它想做它想做的事(例如:“通过检查竞争对手的网站,我们可以推测他们使用的一些策略和做法”)。计划部分解释了机器人计划做什么——“使用start_agent命令委托创建HTML文件。”

批评部分是Auto-GPT开始添加一堆神经质的自我批评和它不遵守的质量规则的地方。例如,它写道,它必须确保其编写的隐私政策符合GDPR,并且信息“绝对准确”。在另一个会议上,我要求它编写一些Windows教程,它说“在编辑和完善教程时,我应该以清晰和简单为目标”,并坚持要修改自己的工作。

在Auto-GPT完成网站建设任务后,我确实有代表网站三个页面的HTML文件,但是这些页面上的设计和文案都不是很好,文案既描述了公司又保护了隐私政策很简单。例如,尽管我明确告诉机器人我的公司不收集或出售用户数据,但它在隐私政策中写道“我们可能会通过联系表格、调查或用户帐户收集、存储和使用多种类型的个人信息”它甚至命名了我们将收集的信息,例如姓名、地址和浏览行为。

主页还包含关于公司Geek-in-ChiefDesigns的一大堆内容。“Geek-in-ChiefDesigns提供网站和网络应用程序开发、网站维护、网站优化、定制网页设计等等,”它写道。“我们经验丰富的开发人员团队处理任何复杂的项目并按时交付,坚持高质量。”

  • 免责声明:本文由用户上传,如有侵权请联系删除!