? AI干起了实时翻译,我们离跨越语言的鸿沟还有多远 翻译_天健网_IT行业资讯_互联网资讯_分享科技行业优质资讯 365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集 ?
当前位置:主页 > 科技趋势 >

AI干起了实时翻译,我们离跨越语言的鸿沟还有多远

2019-07-09 04:01 凯尔萨斯王子 编辑:admin 浏览数:天健网_IT行业资讯_互联网资讯_分享科技行业优质资讯

1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直...

  1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。

  直到近10年,以深度学习为代表的人工365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐从实验室走向普罗大众。

  在AI机器翻译这条赛道上,互联网巨头都在虎视眈眈

  自去年乌镇互联网大会上,百度、搜狗相继亮相人工365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集同声传译技术之后,又一次引发机器翻译是否会取代同声传译的激烈争论。

  尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性,但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。

  2016年9月,Google发布谷歌神经机器翻译(GNMT: Google Neural Machine Translation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了55%-85%。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。

  腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译,在365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译领域持续发力,推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译也被当作重要功能革新,搜狗手机浏览器推出365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译,集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。

  365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译架起了不同语种间人们便利沟通的桥梁,已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集口语翻译难点以及365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译有哪些需要解决的问题。

  各种花哨的技术概念,核心仍然是AI处理人类语言的三种方法

  实现让计算机处理人类自然语言是人工365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。

  1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。

  2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。

  3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。

  深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。

  作为365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译的制高点,AI口语翻译难在哪?

  与普通文字翻译相比,AI口语翻译难度更大,原因有二:

  一、想要译得准,首先要能听得清。AI要准确判断出指令发出者的语音、停顿,并在极短时间内进行语音断句,在涉及一些模糊音时能够根据上下文进行及时调整,这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子,然后才能进行文字翻译处理。

  二、想要译得准,还要包容口语的4个任性

  基于神经网络技术的365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译系统越来越多,翻译质量确有较大提高,但是能不能很好地包容口语的各种任性,我们来做几项测试,检验一下人工365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译的水平。为便于说明,选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译进行比对。

  1、日常口语具有不连贯的特性。在口语交谈中,经常会出现一些不连贯的成分,如:重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。

  原文:那六楼呢?咱们咱们,下午谈一谈吧?

  谷歌翻译:The sixth floor?Let's talk about us in the afternoon?

  搜狗手机浏览器365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译:What about the sixth floor? Lets Lets talk this afternoon.

  谷歌翻译在重复的处理上未真实体现原文,搜狗手机浏览器365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译如实还原。但是,两个翻译结果在表达上都不同程度地存在错误。

  2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子,而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的,例如口语中存在大量的代词,人类口语比较容易理解,但是AI不能结合上下文,缺乏背景知识,难以区分指代对象,导致翻译结果偏离原意。

  原文:Look, man, you dont got to do anything. This one means a lot to me.

  谷歌翻译:看,男人,你什么都不做。这对我来说意义重大。

  搜狗手机浏览器365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译:听着,伙计,你什么都不用做,这对我意义重大。

  翻译的关键在于两个词:look和man。谷歌的翻译也对,而看起来,搜狗手机浏览器的翻译结果更符合生活实际。

  3、没有明确的句子边界。口语中没有标点符号来标志句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。

  例如:这苹果不大好吃。那么该句有两种不同的理解结果:这苹果不大/好吃(苹果不大,但是味道好),这苹果/不大好吃(苹果味道不好)。两家AI都未能分清句子结构发音上的差别,都默认翻译为苹果味道不好。

  4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,生活化气息浓厚,多为非正式的语体材料,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译需要庞大的基础词汇库支撑。

  原文:近期我们注意到国际上有一种看法,认为中国已经成为世界上最大的经济体,一方面挑战了美国的领导地位,另一方面在很多国际事务上中国仍在搭便车。请问您怎么看待这样的看法?(总理记者会上中国日报记者的现场提问)

  谷歌翻译:We have recently noticed that there is a view that China has become the world's largest economy, on the one hand challenges the leadership of the United States, on the other hand in many international affairs, China is still free. What do you think of this view?

  搜狗手机浏览器365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译:Recently we have noticed an international view that China has become the world's largest economy. On the one hand, it challenges the leadership of the United States. On the other hand, the Chinese are hitchhiking in many international affairs. I would like to ask what you think of this view.

  专家译文:Recently we have noticed that there is a view in the international community that China has become the worlds largest economy, on the one hand challenges the leadership of the United States,on the other hand in many international affairs in China is still a free ride, how do you think of this view?

  可以说,两家AI对这段话的翻译,虽然都有些许瑕疵,但是总体都还是比较到位的,搜狗手机浏览器对于搭便车这个典型口语化词汇翻译相对更准确。

  中国古诗英译一直是文化翻译的一个难题,甚至被认为是可译性最小的文学形式。我们来试验一下两家AI对王维《九月九日忆山东兄弟》的理解和翻译能力。

  独在异乡为异客,每逢佳节倍思亲。遥知兄弟登高处,遍插茱萸少一人。

  谷歌翻译:Alone in a foreign land for the stranger,every festive times.

  Distinguished brother ascended the throne,who was full of cornelia.

  搜狗手机浏览器365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译:Alone in a foreign land, I miss my relatives more than anything else during the holidays. I know my brother has climbed up to the top and planted dogwood everywhere, but one person is missing.

  参考译文:Alone,a lonely stranger in a foreign land,I doubly pine for my kinsfolk on holiday. I know my brothers would, with dogwood spray in hand, Climbing up the mountain and miss me so far away.

  翻译古诗词,确实非常难为两家AI。不过,翻译的结果很有趣,搜狗手机浏览器对前两句翻译尚可,后两句翻译成了我的兄弟在高处到处种植茱萸,谷歌对最后两句完全是进行了想象性的拓展。

  要跨越语言不通的鸿沟,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译还需往哪加油

  365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译还存在短板,会有词不达意的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。

  1、大量补充口语化语料

  365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。

  2、提高语境理解能力

  365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。

  将神经网络学习的抽象表示和传统符号语义方法结合,建立新的基于语义的机器翻译系统,或许可以大幅提高AI对组合语义、复杂的递归语言结构的处理能力。

  但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。

  文 | 草原骑士

  来源 | 365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集相对论:2个前人工365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集这口井,评出咸淡,讲出黑白,道出深浅。

分享到:
上一篇:趋势之上-Android设计趋势分析10则
下一篇:没有了
标签:翻译(1)

版权与免责声明:

凡未注明"稿件来源"的内容均为转载稿,本网转载出于传递更多信息的目的;如转载稿涉及版权问题,请作者联系我们,同时对于用户评论等信息,本网并不意味着赞同其观点或证实其内容的真实性;


本文地址http://www.tycdo.com/a/kejiqushi/20190709/10131.html

转载本站原创文章请注明来源:天健网_IT行业资讯_互联网资讯_分享科技行业优质资讯

?

行业聚焦

微软研究院:搜索框将在2027年消失 搜索无处不在

搜索框或在2027年消失凤凰科技讯北京时间12月6日消息,据外媒报道,微软雷德...更多

那些岁月偷不走的爱与美

为了抓住岁月这个神偷人们发明了照相机将所有美好的记忆变成照片攒在手里于...更多

AR技术让通知书“动”起来

7月7日上午9点多,山东曲阜考生魏子腾终于接到了期盼已久的来自西北工业大学...更多

紫光展锐与英特尔5G合作

2月22日晚些时候他们与英特尔共同宣布达成5G战略合作,两家公司将面向中国市...更多

360手机2017年实现盈亏平衡

360手机总裁李开新日前对360手机2017年的发展进行了回顾与总结,并宣布2017年销...更多

科学频道

更多

科技创造

更多

2017365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电“觉醒” 摆脱

?

2017年,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电浪潮“涛声依旧”。一方面,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电市场规模....[详细]

2017365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电“觉醒” 摆脱

?

2017年,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电浪潮“涛声依旧”。一方面,365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电市场规模....[详细]

张仲景大药房有“病”待

?

张仲景大药房门口醒目的坐堂医招牌。河南张仲景大药房股份有....[详细]

改进多Bug少 Win10新预览版

?

国庆长假刚刚结束,用户就迎来了Windows10Build14942的更新推送,和....[详细]

  • <strong><font color='#000000'>2017365jpk棋牌官网苹果_www.365棋牌游戏中心_365棋牌安卓全民合集家电“觉醒” 摆脱</font></strong>
  • <strong><font color='#000000'>张仲景大药房有“病”待</font></strong>
  • 改进多Bug少 Win10新预览版
  • <strong>Gmail通讯簿联系人管理</strong>
  • <strong>大多数美国人相信AI会帮助</strong>
一周排行每月关注

最新标签