SambaNova在HuggingFace上通过Llama 3.1驱动的演示挑战OpenAI 的o1模型

SambaNova系统刚刚在Hugging Face上推出了一款新演示,提供OpenAI o1模型的高速开源替代方案。

该演示由Meta提供Llama 3.1指导模型,是对OpenAI最近发布的o1模型的直接挑战,代表着在主导企业AI基础设施的竞争中向前迈出了重要一步。

该版本表明SambaNova打算通过提供满足开发人员和企业需求的高效、可扩展平台,在生成式AI市场中占据更大的份额。

AI领域在很大程度上由Nvidia等硬件提供商和OpenAI等软件巨头定义,SambaNova的平台将速度和精度放在首位,这将撼动AI领域。

Llama 3.1 Instruct-o1演示由SambaNova的SN40L芯片提供支持,允许开发人员与405B模型交互,在Hugging Face上提供高速AI性能。该演示被视为对OpenAI的o1模型的直接挑战。(来源:Hugging Face / SambaNova)

OpenAI o1的直接竞争对手出现

SambaNova在Hugging Face上发布其演示是一个明确的信号,表明该公司有能力与OpenAI正面交锋。虽然OpenAI发布的o1模型因其先进的推理功能而受到广泛关注,SambaNova演示利用Meta的Llama 3.1模型提供了一个引人注目的替代方案。

该演示允许开发人员与Llama 3.1 405B模型交互,这是当今可用的最大的开源模型之一,速度是每秒129个令牌。相比之下,OpenAI的o1模型因其解决问题的能力和推理能力而受到称赞,但它尚未在令牌生成速度方面展示这些性能指标。

开源AI开发人员和OpenAI以外的开发人员之间显然正在进行竞争,以达到与该公司的新o1模型相当的性能,许多人寻求在其他竞争对手模型中实施以前研究的“思维链”(chain-of-thought,简称 CoT) 样式指令。

不过,OpenAI的公开发行说明和系统卡明确概述了其新的o1模型系列是如何从头开始训练参与CoT的,而不是后来才将CoT作为一种推理添加进去。因此,目前处于预览阶段的o1模型是专门为“思考”而设计的,它在提供答案之前需要更长的时间。由此可知,即使其他公司试图达到OpenAI的o1推理能力并提高速度,OpenAI正在走与众不同的路。

这个演示很重要,因为它表明免费提供的AI模型的性能与私营公司拥有的AI模型一样好。虽然OpenAI的最新模型因其推理复杂问题的能力而受到赞誉,SambaNova的演示强调纯粹的速度——系统处理信息的速度。这种速度对于AI在商业和日常生活中的许多实际应用至关重要。

通过使用Meta的公开版本Llama 3.1 模型并展示其快速处理能力,SambaNova描绘了一幅让更多人能够使用强大的AI工具的未来图景。这种方法可以使先进的AI技术更广泛地使用,使更多种类的开发人员和企业能够根据自己的需求使用和调整这些复杂的系统。

Llama 3.1 Instruct 70B模型的性能比较,显示了各种AI提供商的令牌输出速度。拥有SN40L芯片的SambaNova排名第二,每秒提供405个令牌,仅次于Cerebras。(来源:人工分析)

企业AI需要速度和精度——SambaNova的演示同时满足了这两点

SambaNova竞争优势的关键在于其硬件。公司专有的SN40L AI芯片专为高速生成令牌而设计,这对于需要快速响应的企业应用程序至关重要,例如自动化客户服务、实时决策和AI驱动的代理。

在初始基准测试中,在SambaNova基础设施上运行的演示为Llama 3.1 70B模型实现了每秒405个令牌的速度,使其成为Llama模型第二快的提供商,仅次于Cerebras.

这种速度对于旨在大规模部署AI的企业至关重要。更快生成令牌意味着更低的延迟、更低的硬件成本和更高效的资源利用。对于企业来说,这可以转化为现实世界中的好处,例如更快的客户服务响应、更快的文档处理和更无缝的自动化。

SambaNova的演示在实现令人印象深刻的速度的同时保持了高精度。这种平衡对于医疗保健和金融等行业至关重要,在这些行业中,准确性与速度同样重要。通过使用16位浮点精度,SambaNova表明可以同时进行快速可靠的AI处理。这种方法可以为AI系统树立新标准,尤其是在即使是小错误也可能产生重大后果的领域。

AI的未来可能是开源的,并且比以往任何时候都更快

SambaNova对Meta的开源模型Llama 3.1的依赖标志着AI领域的重大转变。虽然像OpenAI这样的公司已经围绕他们的模型构建了封闭的生态系统,但Meta的Llama模型提供了透明度和灵活性,允许开发人员针对特定用例微调模型。这种开源方法在希望对其AI部署进行更多控制的企业中越来越受欢迎

通过提供高速、开源的替代方案,SambaNova为开发人员和企业提供了一个可与OpenAI和Nvidia相媲美的新选择。

公司的可重构数据流架构优化神经网络层之间的资源分配,允许通过软件更新持续提高性能。这为SambaNova提供了流动性,使其在AI模型变得更大、更复杂时保持竞争力。

对于企业来说,能够在模型之间切换、自动化工作流程、以最小的延迟微调AI输出的能力将改变游戏规则。这种互操作性与SambaNova的高速性能相结合,使该公司成为蓬勃发展的AI基础设施市场的领先替代方案。

随着AI的不断发展,对更快、更高效平台的需求只会增加。SambaNova的最新演示清楚地表明,该公司已准备好满足这一需求,为业内最大的参与者提供引人注目的替代方案。无论是更快的令牌生成、开源的灵活性还是高精度的输出,SambaNova都在为企业AI树立新标准。

随着此次发布,AI基础设施主导地位的争夺战远未结束,但SambaNova已明确表示,它将继续存在并参与竞争。

原文链接

(机器翻译,轻度译后编辑,仅供参考。)

编辑:李旭媛

审校:章坚

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部