机器翻译(MT)有多好?据微软称,非常好。
本月早些时候,该科技公司宣布已经创建了一个MT系统,在将中文翻译成英文时达到了“人类平价”。换句话说,据说该系统已经完成了翻译,就像人类语言学家一样。
微软称翻译是使用newstest2017创建的一组新闻文章完成的。
微软聘请翻译人员对结果进行分析,将MT系统的输出与人类语言学家的输出进行比较。在其博客上,微软工程师赞扬了这一成就,称这是他们已经有一段时间的“梦想”。
然而,该公司指出,尽管该系统取得了成功,但MT并不是一个“已解决的问题”。值得注意的是,中英对话语有很多数据,微软将新闻报道称为“普通”词汇。”
神经MT系统训练的数据越多,它将翻译得越好,因为这有助于以更精确的方式调整神经网络权重。
微软团队使用人工智能(AI)来帮助翻译新闻剪辑,并使用双重学习,审议网络和联合培训方法来完成实验。
这一成就的新闻在全球范围内得到了体现,它展示了翻译技术的又一步。围绕MT的讨论已经在过去十年中达到顶峰,业内人士对该技术的真正潜力进行了推测。
当神经机器翻译(NMT)达到人工翻译的熟练程度时,其中一个较大的问题仍然存在。微软指出,由于努力本身的复杂性,衡量MT的准确性是困难的。
“机器翻译比纯模式识别任务复杂得多,”微软研究员Ming Zhou在公司博客上说。“人们可以用不同的词来表达完全相同的东西,但你不一定能说出哪一个更好。”
我们之前讨论过关于人类和机器的争论。在这一点上,人类语言学家具有批判性思考和理解文字中的细微差别的能力; 人类语言学家也更有能力对语言进化做出反应,并提供文化上的细微差别,以反映更有效参与的品牌或信息。
ULG新兴语言技术总监Juan Alonso对微软的说法持怀疑态度,称这一壮举可能被夸大了。
“尽管微软的成就确实令人印象深刻,但对'人类平等'的主张却显而易见。优秀的人工翻译不会逐句翻译文本; 他们关注整个文本,并利用这个整体背景来产生足够的翻译,“阿隆索说。
“这是微软的MT系统和任何其他MT系统都无法做到的事情。”
但是,正如我们过去所阐明的那样,仅仅因为MT不完美并不意味着它对特定内容类型无效。
Alonso表示,虽然微软提到的技术,如双重培训和审议网络是很好的技术,但它们还没有为类似人类的准确性铺平道路。
他说:“虽然他们有助于获得非常好的翻译结果,但'人类平等'的目标并非迫在眉睫。”