当前位置:首页 > 科技 >
2018-02-18    来源:网络整理    编辑:懒人网

新浪科技以百度上各类“出国英语XXX句”中随机挑选的10个出国常见语句为样本,输入到iOS版Google翻译App中测试(这里的测试语句除了常见的问路类型,还有相对比较复杂的),然后将这10句原文和翻译分成三类,分别是“有歧义”、“不常用”和“正确”类型,结果如下:

不会说人话?Google又被专业翻译diss IT业界 第3张

分类结果

这里要注意的是,这里分类的依据是可理解的程度,而不是语法。这就意味着只要能够被理解且不出现歧义,即使是有明显语法错误的,也可以被分到“不常用”类别,比如“How to get to the subway station”这种有语法错误的句子,但还能通过单词理解,就分到“不常用”类别中。

但即使按照这样不太严格的标准来分类,可理解与有误解的比例还是6:4,以下就来说说四个“有歧义”句子可能出现的误解:

“我要退这张票”翻译成“I want to withdraw this ticket”,可能会被误解成“我要拿走这张票”,因为“withdraw”有“拿走”的意思,而没有“退票”的含义;

“我想把这张50美元换开”中的“换开”不能翻译成“swap”,因为这个英语单词不能用于“换零钱”这个含义中;

“能给我张退税表吗?”的Google翻译“Can you give me a tax return?”,把“表格”(form)这个含义在翻译中丢失了,而且“tax return”是“报税”的意思,而不是“退税”的意思;

“这有免税店吗?”被Google翻译错译了“Is this duty-free shop?”(这家店是免税店吗?),这是一个只要稍微学过英语的人都会看出来的错误。

从随机的测试结果看来,Google翻译的准确度离满足游客的需要还是差了一些距离。

为什么有了人工智能加持,Google翻译还是不够好?

前文中说过,Google近期比较重要的更新是可以在中国大陆地区无障碍使用。但实际上,Google在前年有一次更重要的更新,那就是将翻译系统从原来的“基于词组的机器翻译”(PBMT)转变为“神经机器翻译”(NMT),也就是将神经网络技术引入到机器翻译中。

Google宣称,经过此次更新,翻译结果更加通顺,可用性更强。

按照百度百科的说法,神经网络“是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型”。这个定义非专业人士不太好理解,没关系,只要知道神经网络是实现人工智能的基础性技术就好了。

人工智能是这几年的大热新闻关键词和最流行的技术,连今年的春节晚会上都展示了人工智能技术加持的自动驾驶汽车。但新闻中常常被讲的神乎其神的人工智能怎么在语言翻译这方面都做不好?前文中那个dissGoogle翻译的作者霍夫施塔特给了我们一个解释。

霍夫施塔特认为,很多人其实对人工智能的期待过高,从而“脑补过度”,这在心理学上被称为“Eliza效应”,大概意思是说人会过度解读机器的结果。

这里的“Eliza”是上个世纪60年代的早期人工智能项目,能通过脚本理解简单的自然语言,并能进行类似于人类的互动,与它互动过的许多人都认为Eliza确实了解他们内心的感觉。在霍夫施塔特看来,即使是一些人工智能领域的研究者,也难免落入“Eliza”效应的陷阱中。

霍夫施塔特认为,人类的翻译是一个“阅读-内化-表达”的过程,人类读到文本之后,会联想到相关的现实场景,然后基于场景给出另一种语言对于这种场景的表达。

但Google翻译只是一个“解码”过程,即使是人工智能加持,Google翻译也没有真正理解文本,它只是将原文看成被加密的译文,只要解码即可翻译。这样的过程缺乏现实体验,谈不上理解,当然就难免出现错误。

有人也许会问,神经网络技术就不能模仿人类思维来翻译吗?霍夫施塔特也给出了自己的答案,他认为这类机器翻译目前还没有超越单词和短语层面,这样的人工智能在“读”到文本之后,只是联想到对应语言的单词,而不是联想到现实场景,尽管用了复杂的统计词语聚类算法,但这和人类的翻译思维还是不一样。

这种技术加持下的Google翻译,虽然能将原文和译文的词语对应起来,还有一定能力组织成句子,但还是难以理解。

霍夫施塔特的说法在新浪科技的测试中也得到验证。此前的出国常用语句翻译测试,从“退票”翻译成“withdraw ticket”和“换开”翻译成“swap”这两个例子中,就能看出Google翻译目前还停留在词对词或者短语对短语的层面,而不是联想到实际场景,即使按照正确的语法组织起来,也难以让人理解。

借用一位翻译学教授的话:“你每一个字看得懂,但连起来就不是人说的话。”

由此看出,Google翻译距离完全无障碍的应用还有一定距离。在这种情况下,出国的游客除了在手机装上几个翻译App之外,最好还是多学点常用英语,再不济也练一练画图技能,以备不时之需。

当然,人工智能的研究者还是要更深入的探究人类思维,并且开发出一款更好的翻译App;如果真有这么一天,专业译员也会对机器肃然起敬了。

最后,新浪科技祝大家春节假期快乐,不管你是在国外还是国内。

不会说人话?Google又被专业翻译diss IT业界 第4张



  • 相关内容:


  • 百度搜索“不会说人话?Google又被专业翻译diss(2)”
  • 懒人网本文地址:http://lazyren.com/html/tech/20180218/16269.html


    阅读延展

    过年备这些黑科技年货回家吧! 过年备这些黑科技年货回家吧!
    又到一年过年时,小编一想到大批叫我小姨的熊孩子和说不完的客套话,36D的胸口一阵绞痛...小编决定带些黑科技感满满的年货回家,做个懂事的大龄儿童~
    注意了:你以为微软雅黑免费的?字体侵权要赔几万块 注意了:你以为微软雅黑免费的?字体侵权要赔几万块
    很多人在电脑中使用的字体是Windows自带的微软雅黑字体,不过你要是随便用在淘宝海报或其他商业用途,就要小心被指控侵权遭受索赔了。不过真正的索赔方并非是微软,而是国
    有人泼脏水?大量成人视频现360水印 有人泼脏水?大量成人视频现360水印
    近日,一篇题为《一位92年女生致周鸿祎:别再盯着我们看了》的文章在网上流传,文章称部分360智能摄像机在餐厅、网吧等公共场所监控到的画面被放到水滴直播平台进行直播,
    一部只赚十块的尼彩手机如今怎么样了? 一部只赚十块的尼彩手机如今怎么样了?
    2011年,中国手机市场出现了这样一个手机品牌。它自称手机之王,性价比超高,它就是尼彩手机! 尼彩公司于2011年获得手机生产牌照。当时,市面上消费者反馈最好的智能手机是
    苹果TouchBar新专利曝光 未来应用于iMac 苹果TouchBar新专利曝光 未来应用于iMac
    据外媒报道,苹果日前在欧洲获得了一项全新的TouchBar相关专利,这份专利显示,未来TouchBar将会出现在MacbookPro和iMac等桌面电脑上。
    贫穷限制了我想象力,全球十大捡漏事 贫穷限制了我想象力,全球十大捡漏事
    《独立宣言》副本,美国人Michael,在田纳西州纳许维尔的二手店铺发现了这个纸张泛黄的《独立宣言》副本,这是1820年印刷的200份之一,现在已经基本见到当年的那批真迹了,