看看头条

机器翻译——同义句、原文理解、译文查证

机器翻译的一个缺点:在识别同义句时容易出错。同样一句话,如果我们换一种说法,机器翻译结果往往不统一,而且有错误。也有一些专门训练机器翻译的语料注意到了这一点,所以在做句对时充分考虑了同义句,尽量让译文不出错,一般看到一句话后尽量找到这句话的同义说法,列举越多越好,而且句子结构越相似越好,既不能有多余信息,也不丢失信息。机器下次看到同样的表达时会产出出相同的译文。这也给以语料训练机器翻译的人员提出了新的要求,在出现新的表达时,要努力穷尽与之相关的其他表达。目前所有的机器翻译在处理用户的原文时,基本都是只出一种译文,而不是出多种供用户选择,部分机器翻译会征求用户意见,在涉及个别词或短语的选择时,会显示几种表达,让用户自行选择,同时也会提供修改页面,进行翻译报错,以改进机翻效果。

如果机器翻译在选择一些表达时能够到语料库里自行验证所用词组是否正确,则机翻质量会提高,比如对机器翻译要用到的某个短语,当机器翻译不知道某个短语中该用哪个介词时,如果能直接到语料库验证,然后选择常常出现的介词,即语料库中出现该词组统计数字最高的介词,将使得译文的认可度提高。就以英文来说,如果对句中的各个表达都经过机器自动验证,那么,即使有时机器会把原文理解错,从而导致错误,但翻译出来的句子因为经过大量语料查证,所以句子本身的表达多时候会符合语言习惯。

引起机器翻译不准确的原因有很多,除了技术上的原因外,主要还是机器对原文的理解出现错误,产出的译文没有一套行之有效的检验方式。如果机器翻译在识别原文时,有相应的原文片段进行自动辨认或自动验证,即能调取相应原文语料库验证理解是否正确,如果对原文的理解有一套行之有效的方式的话,机器翻译的结果将会大不一样。

准确的理解,即对立即进行自动查证,加上好的翻译,即对翻译片段进行过自动查证的话,译文质量将会有大的改善。

比如七夕,如果机器没有收录这个词,而如果机器能够通过语料库、搜索引擎自动进行相关查证,在表达七夕快乐时,先明白七夕是个节日,以及什么节日,然后找这个节日相关的祝福词,然后根据常见英文产出译文。这样的译文思路基本和人工翻译相同,如果机器翻译能够把人工翻译的一些环节自动化模拟的话,机器翻译在翻译领域将大有作为。

希望人工翻译模式逐渐为机器翻译所模拟,然后加上机器翻译强大的语言数据处理能力,能够为译者减轻工作压力,但最终的把关、审校人员依然是人工译者,而这个量将很大,需要大量从业人员。

|\n|\r

赞 (0)
分享到:更多 ()