
近日,谷歌发布的新版神经机器翻译系统(GNMT:GoogleNeuralMachineTranslation)着实给各界带来了不小的震动。据官方宣称,这一系统将会帮助全球每天约1800万条谷歌翻译的使用者解决翻译错误率高的问题。
谷歌宣称,这款可以自主学习的先进技术,可以实现到目前为止机器翻译质量的最大提升。提升之处,就在于基于短语的翻译,提升到了基于句子的翻译,并大幅改进了对一些罕见词的翻译精度。测试者方面也给出了错误率大约减少了60%左右的反馈,而达到的错误率大抵已经和人工翻译水平相当。
此项技术一经推出,立刻掀起了一阵不小的风波。关于GNMT的讨论众说纷纭,给这一技术点赞之余,还有翻译者甚至联想到18世纪的纺织工人看到了蒸汽机时的那种忧虑。不少外语专业的学生也随之瑟瑟发抖,难道真的要被“第三次工业革命”淘汰了吗?
诚然,为科技的发展进步感到喜悦是好事,不过凡事也应客观看待。下面是我们进行的一些亲测,让我们从汉日互译的角度,来探究一下这两天被“神化”了的谷歌翻译究竟有了怎样的进步吧。
首先来看一个简单的句子,


没有错误,句子也很流畅。
接下来我们来看一段短文翻译。(节选自朱自清的《背影》)


由上面的短文翻译可以看出,与汉英互译时的流畅度与准确率不同的是,谷歌在汉译日上不仅存在行文不畅的问题,就连语法和标点都有很大的问题。就算我们不用“冬天能穿多少穿多少 夏天能穿多少穿多少”这种问题去“为难”它,普通的白话文翻译也有它不能完成的时候。
接下来,我们再检测一下它在的日译汉方面的能力如何。
首先是一个简单的句子。

没有问题。那么,我们再来测试一句日语古文。(节选自《源氏物语》)

这翻译出来的是什么?别说语法与用词,连单看这个译句都觉得一头雾水。
那么,我们来看看我国文人丰子恺先生是怎样翻译这句古日语的:
蝉衣一袭余香在,睹物怀人亦可怜。
不过两句话间,不仅再现了原句美丽的文字,也还原了源氏对藤壶的思念之情。
与一些简单生硬的文字不同,文学作品在机器的翻译下,那些隐藏在字里行间的感性与内涵很难被掌握。翻译真正的文学作品时,一个负责的翻译者,会为了一个词、甚至一个标点,去查阅无数文献典籍。而就算未来的翻译机器可以实现智能学习,在涉及到不同语境中的准确用词、和各国不同的文化环境与语言深层次的逻辑时,又如何能用简简单单的一个标准来抹平文化的差异呢?
对于仍然存在的缺陷,谷歌方面也给予了承认。官方表示这套系统的确并不成熟,而且也比不上人工翻译。因为这套系统依然会错误的翻译一些专有名词和术语,在联系上下文的能力方面依然无法与人类相提并论。谷歌方面表示,这项技术依然还有很多工作要做。
无法否认的是,谷歌翻译的直译已经进步了一大步。除了学术性、艺术性、专业性极强的领域,目前翻译覆盖的多数领域,像通识性、生活性、商务社会事务等翻译工作,在不久的未来都可以用机器完成。谷歌翻译的这一进步,不能说是翻译界的重大突破,这是机器或者说人工智能的重大突破。
机器学习的强大之处在于学习能力,它不会再像之前那样死板,可以学习就代表是可能分析体会语境的,甚至可能一句话给出不同的绝妙翻译也非常有可能的。即使现在还离接近人工翻译的准确度比较远,但仍然期待谷歌的下一次重大突破。

另一方面,这未来的一大步也确实会像人们担心的那样,砍掉许多的就业机会。但这对学习语言或从事语言工作的人们来说,也并非只有不利的一面。
对于科技发展中诞生的每一匹黑马,我们最先想到的应还是如何骑它,而不是如何无脑黑它。
与其恐惧和抵触,不如充实自己,认真对待语言或者其他任何一项工作,在科技进步的同时,促进自身的实力提高,才能在即将到来、或者说必然到来的那一天,在同机器竞争的激流中生存下来。
该贴被huang.wang编辑于2018-7-3 15:34:33