Author name: Lingotek_001

未分类

About NGTV

With approximately 1,200 members, the Netherlands Association of Interpreters and Translators (NGTV) is the largest professional association of interpreters and

动态摘编

研究人员结合DeepL和GPT-4以自动化(研究)问卷翻译

在2024年7月30日的一篇研究 论文中,来自阿尔托大学的Otso Haavisto和Robin Welsch展示了一个网络应用程序,旨在简化针对不同语言和文化调整问卷的过程。 本工具旨在协助研究者进行跨文化研究,提高问卷改编的质量和效率,同时促进研究实践的公平性。 Haavisto和Welsch强调,翻译问卷通常成本高昂,而且“资源密集”,需要多个独立的翻译人员和广泛的验证过程。根据作者的说法,这种复杂性导致了研究中的不平等,特别是在非英语国家和低收入地区,那里获得高质量问卷的机会有限。 在问卷翻译中,保持语义相似性是保证译文与原文意义一致的关键。正如作者所指出的,“语义相似性比逐字匹配更重要。”根据作者的说法,文化差异和口语化表达会使这一过程进一步复杂化,使准确的翻译变得困难。 为了应对这些挑战,他们开发了一个web应用程序,允许用户翻译问卷,编辑翻译,回译到源语言以与原文进行比较,并接受由大语言模型(LLM)生成的翻译质量评估。 该工具集成了用于初始翻译的DeepL和用于评估和建议改进的GPT-4。使用DeepL的决定是基于其“在翻译科学文本方面的可靠输出和有希望的结果”,作者说这对研究问卷的准确性至关重要。 他们说:“我们着手开发一个问卷翻译工具的原型,它将利用LLMs在自然语言处理任务中的多功能性,为进行跨文化研究的研究人员带来好处。” Haavisto和Welsch通过两项在线研究测试了该工具的有效性:一项涉及10名参与者测试英语-德语对,另一项涉及20名参与者测试英语-葡萄牙语对。根据作者的说法,这两项研究都显示了“在问卷翻译过程中采用法学硕士的有希望的结果” 比较有帮助 研究结果表明,在GPT-4生成的质量分数的补充下,机器翻译的翻译质量和语义相似度与传统翻译相当。参与者还发现GPT-4生成的建议“中等帮助”,并准确地代表了翻译质量。 Haavisto和Welsch还指出,LLMs生成的翻译质量评估可以帮助研究人员识别和解决翻译中的特定上下文问题,并强调“这是朝着更公平的基于人工智能的问卷研究迈出的第一步。” 该工具目前支持英语、德语、葡萄牙语和芬兰语的翻译——尽管芬兰语尚未经过测试。原型的代码在GitHub上是公开的,欢迎大家进一步探索和贡献。 (机器翻译,轻度译后编辑,仅供参考。) 编辑:陈驭格 原文链接

动态摘编

苹果公司和南加州大学提出机器翻译中性别偏见的解决方案

在2024年7月29日的一篇论文中,苹果公司和南加州大学的研究人员介绍了一种解决机器翻译(MT)系统中性别偏见的新方法。 正如研究人员解释的那样,传统的机器翻译系统通常默认使用训练数据中统计上最普遍的性别形式,这可能导致翻译错误地表达了预期的含义,并强化了社会刻板印象。他们补充说,虽然语境有时有助于确定适当的性别,但许多情况下缺乏足够的语境线索,导致翻译中性别分配不正确。 为了解决这个问题,研究人员开发了一种方法来识别源文本中的性别歧义,并提供多种翻译选择,涵盖了歧义实体的所有可能的性别组合(男性和女性)。  研究人员表示:“我们的工作倡导并提出了一种解决方案,让用户能够从所有同样正确的翻译方案中进行选择。” 例如,“秘书生老板的气了。”包含秘书和老板两个实体,根据每个角色的性别,可以产生四种语法正确的西班牙语翻译。 研究人员强调,提供反映所有有效性别选择的多种翻译选择是一种“合理的方法”。 与在句子级别操作的现有方法不同,这种新方法在实体级别运行,允许对特定性别的引用进行更细致的处理。  该过程首先分析源句子,以识别具有模糊性别引用的实体(如名词或代词)。一旦确定,就会产生两种不同的翻译:一种使用阳性形式,另一种使用阴性形式。最后一步是将这些翻译集成到一个输出中,以保持目标语言的语法完整性。 为了生成这些翻译,可以使用微调的机器翻译模型或大语言模型(LLMs)。 与MT模型无缝集成 研究人员强调,当与适当的用户界面相结合时,他们的方法可以让翻译人员为每个实体选择正确的性别。他们解释说:“我们的关键技术贡献是一种新颖的半监督解决方案,用于生成与标准MT模型无缝集成的替代方案。” 他们补充说,这种解决方案不仅促进了具有精确性别控制的新翻译界面,而且还通过自动识别歧义并建议替代翻译来帮助人工翻译人员。 为了鼓励进一步的研究,研究人员开源了五种语言对的训练和测试数据集:英语>德语、西班牙语、法语、葡萄牙语、俄语和意大利语。 展望未来,他们计划探索其他无性别的源语言,如汉语、韩语和日语,以及它们所带来的独特挑战。他们还打算扩展他们的方法,包括非二元和性别中立的形式。 (机器翻译,轻度译后编辑,仅供参考。) 编辑:陈驭格 原文链接

Scroll to Top