ChatGPT搜索如何为AI代理铺平道路 – 语言服务资源摘编网

OpenAI的平台产品主管Olivier Godement和开发人员体验主管Romain Huet正在全球各地进行巡回访问。上周，在该公司年度开发者大会DevDay召开之前，我在伦敦与他们进行了交谈。伦敦的DevDay是该公司在旧金山以外举办的第一个DevDay。Godement和Huet接下来将前往新加坡。

接下来几周公司会很忙。在伦敦，OpenAI宣布更新其实时API平台，允许开发人员在其应用程序中构建语音功能。公司正在推出新的语音和一项让开发人员生成指令的功能，这使得他们能够更快地开发应用程序和更有用的语音助手。同时，对于消费者来说，OpenAI宣布推出ChatGPT搜索，用户可以使用聊天机器人在互联网上搜索。点击此处了解更多信息。

这两项发展都为人工智能的下一个重要领域铺平了道路，那就是代理。 AI助手可以完成复杂的任务链，例如预订机票。(您可以点击此处阅读我对代理的解释）。

“快进几年——地球上的每个人、每家企业都将有代理。你的代理非常了解你。它知道你的喜好。”Godement说道，代理可以访问你的电子邮件、应用程序和日历，它就像你的参谋长一样，与每一个工具进行交互，它甚至可以处理长期问题，比如根据某个主题撰写论文。

Godement表示，OpenAI的战略是自己构建代理，也允许开发者使用其软件构建自己的代理。语音将在代理的外观和感觉方面发挥重要作用。

“目前，大多数应用程序都是基于聊天的……这很酷，但并不适用于所有情况。在一些使用案例中，你不用打字，甚至也不看屏幕，因此语音本质上是一种更好的模式。”他说。

Godement表示，在代理成为现实之前，有两大障碍需要克服。

第一大障碍是推理。 Huet说，建立AI代理需要我们相信，它们能够完成复杂的任务，做出正确的事情。这就是OpenAI“推理”功能的用武之地。上个月，OpenAI的o1模型中引入了这一功能，利用强化学习来教会模型如何使用“思维链”处理信息。Godement说，给模型更多的时间来生成答案，这样，它可以识别并纠正错误，把大问题分解成小问题，尝试使用不同的方法回答问题。

但是，华盛顿大学计算机科学教授Chirag Shah说，应该谨慎对待OpenAI关于推理的说法。大型语言模型没有展示真正的推理。最有可能的情况是，他们从训练数据中看到了一些看似是逻辑的东西。

“这些模型有时看起来推理能力很强，但其实它们只是很会装模作样，只要人类稍加挑剔，模型就会被戳穿。”他说。

Godement承认，在这一方面还要付出很多努力。从短期来看，o1等AI模型需要发展成为更可靠、更快速、更便宜的模型。从长远来看，OpenAI需要将其思维链技术应用到更广泛的使用案例中。OpenAI一直以来专注于科学、编码和数学。他说，现在该公司希望涉足其他领域，如法律、会计和经济学。

Godement表示，第二大障碍是连接不同的工具。 如果只能依赖训练数据，AI模型的能力就会受到限制。AI模型应该能够上网，查找最新信息。ChatGPT搜索是OpenAI新工具的一个强大功能。

这些新工具不仅需要能够检索信息，还需要能够在现实世界中发挥作用。竞争对手Anthropic宣布了一项新功能，其Claude聊天机器人可以“使用”电脑，它可以通过点击来与其界面进行交互。如果要执行预订航班等任务，这对代理来说是一项重要功能。Godement说，o1在“某种程度上”可以使用工具，尽管不是很可靠，关于工具使用的研究是一个“很有前途的发展”。

Godemont说，明年，他预计AI在客户支持和其他基于助手的任务中的应用会越来越多。 不过，他也表明，很难预测人们将如何采纳和使用OpenAI的技术。

“坦率地说，每年回顾以往，对于突然出现的使用案例，我都会感到惊讶，我根本没有预料到。”他说，“你知道的，我预计会有很多我们谁都无法预料到的惊喜。”

原文链接

（机器翻译，轻度译后编辑，仅供参考。）

编辑：李旭媛

审校：章坚

发表评论 取消回复

发表评论取消回复