D-ID现可提供语音克隆和唇语同步的人工智能视频翻译服务

D-ID展示了其最新创新成果:一款由人工智能驱动的视频翻译工具,不仅能翻译口语,还能克隆原说话者的声音,并使其唇部动作与翻译音频同步。

这项技术被命名为“AI视频翻译”,其基础是D-ID之前在人工智能驱动的视频创作方面所做的工作。该公司后来获得了2500万美元的B轮融资,主要原因是美国的企业客户对D-ID的技术越来越感兴趣,他们利用D-ID的技术制作人工智能增强视频。

通过AI视频翻译,用户可以将视频翻译成30种不同的语言,包括阿拉伯语、普通话和西班牙语等广泛使用的语言。作为现有订阅计划的一部分,D-ID用户现在可以免费使用这项功能。

该工具支持长度从10秒到5分钟不等的视频,单人面对摄像头时效果最佳。D-ID的新工具进入了一个竞争激烈的市场,目前已有多家公司提供基于人工智能的视频翻译和配音服务。

此类工具的出现是让全球受众更容易获取视频内容这一更广泛趋势的一部分。此类工具的出现是让全球受众更容易获取视频内容这一更广泛趋势的一部分。Vimeo和微软等公司最近的发展也反映了这一趋势,它们都推出了类似的技术。

AI Video Translate背后的技术由D-ID的专利模型Rosetta-1支持。该工具为那些希望在全球范围内扩展其内容的公司提供了潜在的成本节约,同时也为那些以前认为此类技术遥不可及的小型创作者提供了新的机遇。

AI Video Translate的发布凸显了人工智能与视频制作之间日益增长的交集,这一领域仍在快速发展。随着人工智能能力的扩展,内容创作的可能性也在不断增加,使更多创作者能够跨越语言界限与观众互动。公司对视频翻译的关注与营销、娱乐和教育等各个领域对本地化内容日益增长的需求相一致。

随着人工智能在内容创作中的应用不断增加,像D-ID的人工智能视频翻译这样的工具可能会成为行业标准,为视频交流的可访问性和个性化提供一个新的水平。不过,此类技术对传统本地化实践和更广泛的内容创作行业的影响仍有待观察。

(机器翻译,轻度译后编辑,仅供参考。)

编辑:陈驭格

原文链接

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部