1. 请下面哪一个选项是最早出现的机器翻译的类型?

A. 基于规则的机器翻译B. 统计型机器翻译C. 基于语料的机器翻译D. 基于短语的机器翻译

基于规则的机器翻译依赖于预先人工设置的语法规则模块作为语法分析的凭据,这也是最早出现的机器翻译类型。

2. 下面哪一项是最新出现的机器翻译类型?

A. 基于语料型机器翻译
B. 统计型机器翻译

C. 神经网络机器翻译

D. 基于短语的机器翻译

神经网络机器翻译技术在2014年被提出。自2015年到2016年,百度、谷歌、微软相继推出了神经网络机器翻译的服务。这也是最新出现的机器翻译类型。自此,机器翻译也由最初的基于规则,后来的统计型,进化到了采用人工智能技术的神经网络机器翻译的时代。

3. 下面哪一项是目前商业应用最为广泛的机器翻译类型?

A. 基于规则的机器翻译 B. 统计型机器翻译 C. 神经网络机器翻译 D.  云计算机器翻译  


 统计型机器翻译 SMT 是通过对大量的平行语料进行统计分析,找出常见的词汇组合规则,尽量避免奇怪的短语组合。统计型机器翻译在自90年代起经历了十几年的高速发展,在商业领域得到了广泛应用。

4.下面哪一项不是统计型机器翻译的特点?

A.  需要大量语料对文字

B. 统计型机器翻译除了用数学模型来处理语言,还考虑到了语言本身的语义、语法因素

C. 统计型机器翻译经过多年的发展已经进入了一个稳定期和成熟期

D. 统计型机器翻译需要在前期进行语料训练、组件配置,并结合后期编译才能满足商用需求 

单纯的统计型机器翻译并不考虑语言本身的语义、语法因素,就是从统计学的角度来处理语言。因此也有一定的局限性,这也是在1949年,当统计型机器翻译第一次被提出后不久就遭到抵制和打压的原因,直到1990年代IBM 从新提出这一模型,才又得到发展和应用。现实应用中,也会把统计型机器翻译和基于规则的机器翻译相结合,来应对这一弊端。

5. 下面哪一项不是神经网络机器翻译相较于其他类型的机器翻译的优势? 

 A. 可以自主学习未知术语,对专业术语翻译的准确性大大提升

B. 通顺性大幅提升

C. 程序精短

D. 对于当前的机器翻译并不适用的长尾小语种语言,神经网络机器翻译具备优势

神经网络机器翻译解决了很多机器翻译的瓶颈问题,比如东亚语言和西欧语言互译时的通顺性,比如统计型机器翻译并不适用的小语种语言。但是神经网络机器翻译依然需要面对一些难题,比如如何处理未知术语,如何在专业内容的翻译上提高准确性,如何不漏翻,所以这些难题的解决还仍需时日。神经网络机器翻译中有可能出现的一些非常奇怪的,难以预知的错误类型仍是商业应用前需解决的问题。


6. 对于神经网络机器翻译所依赖的神经网络技术,下面哪一项说法不正确?

A.  神经网络技术的特点是机器模拟了人脑的学习能力
B.  神经网络的计算模型灵感来自动物的中枢神经系统(尤其是脑)

C.  神经网络技术早已在其他领域广泛应用,比如图片搜索和语音识别

D.  神经网络机器翻译技术将会大大减轻译员和后期编辑人员的工作负担,但是会给程序员加大编码的工作量

在统计型机器翻译中上百万行的代码,在神经网络机器翻译领域只需要280行。所以从程序员的角度来说,效率也有大幅提升。

7. 关于统计型机器翻译,下面哪个说法不属实

A.  需要大量语料训练
B.  统计机器翻译的难点主要在于模型中所包含的句法、语义成分较低,因而在处理句法差别较大的语言对,例如中文-英文时将遇到问题。有时翻译结果虽然“词词都对”却无法被人阅读。

C.  翻译质量的高低主要取决于概率模型的好坏和语料库的覆盖能力

D.   统计机器翻译依赖巨大的语料库,随着语料库资源越来越丰富和算法的日趋复杂,处理这些语料需要越来越强大的计算能力。因为计算机性能的制约,普通人几乎不可能接触和使用统计型机器翻译的成果

除了最先推出的中文-英文语言对,2016年11月,谷歌又将神经网络技术推广到了西班牙语、葡萄牙语、法语、德语、土耳其语、日语和韩语的翻译过程中,在2017年3月,又添加了印地语、越南语和俄语。后来又添加了希伯来语、阿拉伯语以及9种印度语言。不过目前谷歌翻译支持上百种语言,其所支持的的其他大部分语言对采用的仍是统计型机器翻译。所以在谷歌翻译的平台上,人人都可以尝试和应用统计型机器翻译和神经网络机器翻译的成果。

8. Google 在线实时翻译系统里第一个应用神经网络机器翻译技术的语言对是:

A.  英语对西班牙语
B.  韩语日语

C.  英语对中文

D.  英语对印地语

2016年9月,谷歌选择了英语-中文这个语言对,发布了线上神经网络翻译系统。东亚语言因为语序和西欧语言差距很大,所以在统计型机器翻译中一直是个难点。神经网络机器翻译在这样的语对中,通顺性的优势就比较明显。

9. 对于机器翻译引擎的保密性,下面哪一个说法是误解:

A. 当你使用 Google、微软等供应商的免费机器翻译服务的时候,你的翻译搜索结果有可能会被用于提高翻译引擎的翻译质量

B. 当你通过 Trados、Déjà vu 或者 Across 这样的翻译工具来使用 Google 机器翻译引擎的时候,Google 不会以任何形式利用你的翻译内容

C. 微软有付费账号,通过这个账号当你使用微软机器翻译服务的时候,将不会留下任何 log 文件,彻底避免了任何形式的信息泄露

D. 如果你不使用付费账号,那么根据已有的案例,你的翻译内容有可能被泄露给第三方

在使用免费的机器翻译服务的时候,你的翻译内容确实有可能被应用于提高翻译引擎本身的准确性,但除此之外,没有任何已有案例显示,你的翻译内容会被泄露给第三方。

10. 神经网络机器翻译对翻译行业带来的变化,下列的哪一项不能代表目前业内的预测的趋势:

A. 神经网络机器翻译如果得到商业应用,可能会降低机器翻译的成本,从而影响到价格
B. 神经网络机器翻译的通顺性将会大幅提高译后编辑的效率,但是也有可能对译后编辑产生一定的误导
C.  神经网络机器翻译将会给大量小语种语言的机器翻译带来突破
D.  人工智能技术将会让机器翻译越来越接近人工翻译的水平,神经网络技术的成熟和广泛应用会大大降低市场对人工翻译的需求

到目前为止,神经网络机器翻译还主要处于研发和测试阶段,究竟什么时候、以何种形式进入广泛的商业应用阶段,到现在为止,还没有定论。业内普遍并不认为,神经网络机器翻译可以达到取代人工翻译的水准,更多的会是一种翻译的辅助工具,在翻译项目中,提高效率。

如果您有翻译需求,请联系正规翻译公司