ChatGPT搜索如何为AI代理铺平道路

OpenAI的平台产品主管Olivier Godement和开发人员体验主管Romain Huet正在全球各地进行巡回访问。上周,在该公司年度开发者大会DevDay召开之前,我在伦敦与他们进行了交谈。伦敦的DevDay是该公司在旧金山以外举办的第一个DevDay。Godement和Huet接下来将前往新加坡。

接下来几周公司会很忙。在伦敦,OpenAI宣布更新其实时API平台,允许开发人员在其应用程序中构建语音功能。公司正在推出新的语音和一项让开发人员生成指令的功能,这使得他们能够更快地开发应用程序和更有用的语音助手。同时,对于消费者来说,OpenAI宣布推出ChatGPT搜索,用户可以使用聊天机器人在互联网上搜索。 点击此处了解更多信息

这两项发展都为人工智能的下一个重要领域铺平了道路,那就是代理。 AI助手可以完成复杂的任务链,例如预订机票。(您可以点击此处阅读我对代理的解释)。

“快进几年——地球上的每个人、每家企业都将有代理。你的代理非常了解你。它知道你的喜好。”Godement说道,代理可以访问你的电子邮件、应用程序和日历,它就像你的参谋长一样,与每一个工具进行交互,它甚至可以处理长期问题,比如根据某个主题撰写论文。

Godement表示,OpenAI的战略是自己构建代理,也允许开发者使用其软件构建自己的代理。语音将在代理的外观和感觉方面发挥重要作用。

“目前,大多数应用程序都是基于聊天的……这很酷,但并不适用于所有情况。在一些使用案例中,你不用打字,甚至也不看屏幕,因此语音本质上是一种更好的模式。”他说。

Godement表示,在代理成为现实之前,有两大障碍需要克服。

第一大障碍是推理。 Huet说,建立AI代理需要我们相信,它们能够完成复杂的任务,做出正确的事情。这就是OpenAI“推理”功能的用武之地。 上个月,OpenAI的o1模型中引入了这一功能,利用强化学习来教会模型如何使用“思维链”处理信息。Godement说,给模型更多的时间来生成答案,这样,它可以识别并纠正错误,把大问题分解成小问题,尝试使用不同的方法回答问题。

但是,华盛顿大学计算机科学教授Chirag Shah说,应该谨慎对待OpenAI关于推理的说法。大型语言模型没有展示真正的推理。最有可能的情况是,他们从训练数据中看到了一些看似是逻辑的东西。

“这些模型有时看起来推理能力很强,但其实它们只是很会装模作样,只要人类稍加挑剔,模型就会被戳穿。”他说。

Godement承认,在这一方面还要付出很多努力。从短期来看,o1等AI模型需要发展成为更可靠、更快速、更便宜的模型。从长远来看,OpenAI需要将其思维链技术应用到更广泛的使用案例中。OpenAI一直以来专注于科学、编码和数学。他说,现在该公司希望涉足其他领域,如法律、会计和经济学。

Godement表示,第二大障碍是连接不同的工具。 如果只能依赖训练数据,AI模型的能力就会受到限制。AI模型应该能够上网,查找最新信息。ChatGPT搜索是OpenAI新工具的一个强大功能。

这些新工具不仅需要能够检索信息,还需要能够在现实世界中发挥作用。竞争对手Anthropic宣布了一项新功能,其Claude聊天机器人可以“使用”电脑,它可以通过点击来与其界面进行交互。如果要执行预订航班等任务,这对代理来说是一项重要功能。Godement说,o1在“某种程度上”可以使用工具,尽管不是很可靠,关于工具使用的研究是一个“很有前途的发展”。

Godemont说,明年,他预计AI在客户支持和其他基于助手的任务中的应用会越来越多。 不过,他也表明,很难预测人们将如何采纳和使用OpenAI的技术。

“坦率地说,每年回顾以往,对于突然出现的使用案例,我都会感到惊讶,我根本没有预料到。”他说,“你知道的,我预计会有很多我们谁都无法预料到的惊喜。”

原文链接

(机器翻译,轻度译后编辑,仅供参考。)

编辑:李旭媛

审校:章坚

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部