[分享]谷歌翻译新系统堪比真人？汉日互译还原真相_AI.人工智能讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 3173 | 回复: 0

主题： [分享]谷歌翻译新系统堪比真人？汉日互译还原真相

huang.wang

注册用户

等级：中将
经验：17623
发帖：407
精华：1
注册：1970-1-1
状态：离线
发送短消息息给huang.wang

加好友发送短消息息给huang.wang

发消息

发表于：

2018-7-3 15:34:01 | [全部帖] [楼主帖]

楼主

近日，谷歌发布的新版神经机器翻译系统（GNMT：GoogleNeuralMachineTranslation）着实给各界带来了不小的震动。据官方宣称，这一系统将会帮助全球每天约1800万条谷歌翻译的使用者解决翻译错误率高的问题。

谷歌宣称，这款可以自主学习的先进技术，可以实现到目前为止机器翻译质量的最大提升。提升之处，就在于基于短语的翻译，提升到了基于句子的翻译，并大幅改进了对一些罕见词的翻译精度。测试者方面也给出了错误率大约减少了60%左右的反馈，而达到的错误率大抵已经和人工翻译水平相当。

此项技术一经推出，立刻掀起了一阵不小的风波。关于GNMT的讨论众说纷纭，给这一技术点赞之余，还有翻译者甚至联想到18世纪的纺织工人看到了蒸汽机时的那种忧虑。不少外语专业的学生也随之瑟瑟发抖，难道真的要被“第三次工业革命”淘汰了吗？

诚然，为科技的发展进步感到喜悦是好事，不过凡事也应客观看待。下面是我们进行的一些亲测，让我们从汉日互译的角度，来探究一下这两天被“神化”了的谷歌翻译究竟有了怎样的进步吧。

首先来看一个简单的句子，

没有错误，句子也很流畅。

接下来我们来看一段短文翻译。（节选自朱自清的《背影》）

由上面的短文翻译可以看出，与汉英互译时的流畅度与准确率不同的是，谷歌在汉译日上不仅存在行文不畅的问题，就连语法和标点都有很大的问题。就算我们不用“冬天能穿多少穿多少夏天能穿多少穿多少”这种问题去“为难”它，普通的白话文翻译也有它不能完成的时候。

接下来，我们再检测一下它在的日译汉方面的能力如何。

首先是一个简单的句子。

没有问题。那么，我们再来测试一句日语古文。（节选自《源氏物语》）

这翻译出来的是什么？别说语法与用词，连单看这个译句都觉得一头雾水。

那么，我们来看看我国文人丰子恺先生是怎样翻译这句古日语的：

蝉衣一袭余香在，睹物怀人亦可怜。

不过两句话间，不仅再现了原句美丽的文字，也还原了源氏对藤壶的思念之情。

与一些简单生硬的文字不同，文学作品在机器的翻译下，那些隐藏在字里行间的感性与内涵很难被掌握。翻译真正的文学作品时，一个负责的翻译者，会为了一个词、甚至一个标点，去查阅无数文献典籍。而就算未来的翻译机器可以实现智能学习，在涉及到不同语境中的准确用词、和各国不同的文化环境与语言深层次的逻辑时，又如何能用简简单单的一个标准来抹平文化的差异呢？

对于仍然存在的缺陷，谷歌方面也给予了承认。官方表示这套系统的确并不成熟，而且也比不上人工翻译。因为这套系统依然会错误的翻译一些专有名词和术语，在联系上下文的能力方面依然无法与人类相提并论。谷歌方面表示，这项技术依然还有很多工作要做。

无法否认的是，谷歌翻译的直译已经进步了一大步。除了学术性、艺术性、专业性极强的领域，目前翻译覆盖的多数领域，像通识性、生活性、商务社会事务等翻译工作，在不久的未来都可以用机器完成。谷歌翻译的这一进步，不能说是翻译界的重大突破，这是机器或者说人工智能的重大突破。

机器学习的强大之处在于学习能力，它不会再像之前那样死板，可以学习就代表是可能分析体会语境的，甚至可能一句话给出不同的绝妙翻译也非常有可能的。即使现在还离接近人工翻译的准确度比较远，但仍然期待谷歌的下一次重大突破。