机器翻译的历史
>> 欢迎您 登陆翻译论坛 您的身份:游客 | 登陆 | 注册 | 帮助信息 | 精华

统一坊在线翻译网
中国译典
     译典论坛

>>>>译典添词*****译典评注*****公告求译*****博客文章*****会员排行榜 <<<

中国在线翻译网>>译典论坛>>
您是本主题第 6161 个阅读者 == 回贴倒排
作者
主题: 机器翻译的历史 []
忘穿秋水


贡勋等级:伯爵
经验值:1494
技术等级:进士
技术分:10021.4
共发贴31篇
共回贴63篇
共登录217次
注册:2004/8/3 18:47:00
发表于 2004/11/18 21:48:00
面向计算机的语言研究(一) 
 
国家语委语言文字应用研究所 冯志伟 
 
  传统的语言研究是为语言教学、文献整理、社会历史研究服务的。这样的研究完全是面向人的,这样的研究搞了近两千年,已经取得了可观的成绩。  

  电子计算机出现以来,人与计算机之间要进行信息的传输和交流,因此,除了继续进行面向人的语言研究之外,还要开展面向计算机的语言研究。学者们开始采用计算机技术来研究和处理自然语言,在计算机上建立各种自然语言处理系统。  

  面向计算机的语言的研究是本世纪五十年代才开始的,四十年来,这项研究取得了长足的进展,成为了一门重要的新兴学科--自然语言处理。  

  计算机对自然语言的研究和处理,一般应经过如下三个方面的过程:  

  第一,把需要研究的问题在语言学上加以形式化(linguistic formalism),使之能以一定的数学形式,严密而规整地表示出来;

  第二,把这种严密而规整的数学形式表示为算法(algorithm),使之在计算上形式化(computational formalism);

  第三,根据算法编写计算机程序,使之在计算机上加以实现(computer implementation)。  

  因此,为了研究自然语言处理,我们不仅要有语言学方面的知识,而且,还要有数学和计算机科学方面的知识,这样自然语言处理就成为了一门界乎于语言学、数学和计算机科学之间的边缘性的交叉学科,它同时涉及到文科、理科和工科三大领域。  

  面向计算机的语言研究首先是从机器翻译系统的研究开始的。1946年电子计算机刚一问世,人们在把计算机广泛地应用于数值运算的同时,也想到了利用计算机把一种或几种语言翻译成另外一种语言或另外几种语言。从50年代初期到60年代中期,机器翻译一直是自然语言处理系统研究的中心课题,当时采用的主要是“词对词”翻译方式,这种不是建立在对自然语言理解的基础上的简单技术,没有得到预期的翻译效果。60年代中期,人们开始转入对自然语言的语法、语义和语用等基本问题的研究,并尝试着让计算机来理解自然语言。许多学者认为,断定计算机是否理解了自然语言的最直观的方法,就是让人们同计算机对话,如果计算机对人用自然语言提出的问题能作出回答,就证明计算机已经理解了自然语言,这样,就出现了“人机对话”系统(或“自然语言理解”系统)的研究。自然语言处理的理论和方法也就在这些具体的研究中逐渐形成、成熟并完善起来。

  机器翻译系统的研究是面向计算机语言研究的一个历史悠久的部门。  

  关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。当时,人们曾经试图设计出一种理想化的语言来代替种类繁多形式各异的自然语言,以利于在不同民族的人们之间进行思想交流。曾提出过不少方案,其中一些方案就已经考虑到了如何用机械手段来分析语言的问题。  

  本世纪三十年代之初,法国科学家阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法。  

  1933年,苏联发明家特洛扬斯基(П.П.ТРОЯНСКИЙ)设计了用机械方法把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。但是,由于三十年代的技术水平还很低,特洛扬斯基的翻译机没有制成。  

  机器翻译系统的研制是从四十年代末期开始的。可以分为草创期、复苏期、发展期三个时期。  

  (1)草创期(1954年-1970年):  

  1946年,美国宾夕法尼亚大学的埃克特(J. P. Eckert)和莫希莱(J.W.Mauchly)

  设计并制造出了世界上第一台电子计算机ENIAC,电子计算机惊人的运算速度,启示着人们考虑翻译技术的革新问题。因此,在电子计算机问世的同一年,英国工程师布斯(A.D.Booth)和美国工程师韦弗(W.Weaver)在讨论电子计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。1949年,韦弗发表了一份以《翻译》为题的备忘录,正式提出了机器翻译问题。在这份备忘录中,他除了提出各种语言都有许多共同的特征这一论点之外,还有两点值得我们注意:  

  第一,他认为翻译类似于解读密码的过程。他说:“当我阅读一篇用俄语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”

  第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着,从语言A出发,经过某一“通用语言”(Universal Language)或“中间语言”(Interlingua),然后转换为语言B,这种“通用语言”或“中间语言”,可以假定是全人类共同的。  

  可以看出,韦弗把机器翻译仅仅看成一种机械的解读密码的过程,他远远没有看到机器翻译在词法分析、句法分析以及语义分析等方面的复杂性。  

  由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。1954年,美国乔治敦大学在国际商用机器公司(IBM公司)<








你还没有个性签名,点击此处可以添加。
发贴者的其它发贴: 上一篇: 美语口语分类知识十一: 南方 下一篇: 什么都在涨,就是翻译的价格不能涨


||给作者留言

2楼: Fane

贡勋等级:伯爵
经验值:393
技术等级:童生
等级分:0
共发贴3篇
共回贴31篇
共登录93次
注册:2004/8/12 9:34:00
Re. 发表于2004/11/24 11:35:00
未来的翻译领域如果要出现精品佳作,很大部分是需要依靠"查"出来的,而手工翻查纸质献或

资料,将是一项苦不堪言的工作;伴随网络的逐步深入,翻译界也迫切需要提供强大功能的翻

译利器,充分发挥功能强大的机器翻译,而在网络中,还没有出现过一个像样的在线翻译网站,

而中国译典的发展方向似乎是朝这个方向的发展的.因为就我的个人经历来说,交少量的费

用,就能很简单地实现地道翻译,何乐而不为呢.当然这个译典词库,句库量还不是很大,有很

多待改提高的地方,但总的来说,还是很值得去使用的.也希望斑竹继续把网站建好,让它真正

成为中国翻译界的翻译利器.

让我多多关注这个兴新的东西,把实际翻译工作中遇到的问题反映上来,把中国译典真正建译

成专业性权威性的在线翻译网站.




你还没有个性签名,点击此处可以添加。


||引用回复||
1楼: 忘穿秋水

贡勋等级:侯爵
经验值:1494
技术等级:进士
等级分:10021.4
共发贴31篇
共回贴63篇
共登录217次
注册:2004/8/3 18:47:00
Re.续上页 发表于2004/11/18 21:49:00
(2)复苏期(1970-1976年):  

  在这个复苏期,研究者们普遍认识到,原语和译语两种语言的差异,不仅只表现在词汇的不同上,而且,还表现在句法结构的不同上,为了得到可读性强的译文,必须在自动句法分析上多下功夫。  

  早在1957年,美国学者英格维(V.Yingve)在《句法翻译的框架》(Framework for syntactic translation)一文中就指出,一个好的机器翻译系统,应该分别地对原语和译语都作出恰如其分的描写,这样的描写应该互不影响,相对独立。英格维主张,机器翻译可以分为三个阶段来进行。  

  第一阶段:用代码化的结构标志来表示原语文句的结构;

  第二阶段:把原语的结构标志转换为译语的结构标志;

  第三阶段:构成译语的输出文句。  

  第一阶段只涉及原语,不受译语的影响,第三阶段只涉及译语,不受原语的影响,只是在第二阶段才涉及到原语和译语二者。在第一阶段,除了作原语的词法分析之外,还要进行原语的句法分析,才能把原语文句的结构表示为代码化的结构标志。在第二阶段,除了进行原语和译语的词汇转换之外,还要进行原语和译语的结构转换,才能把原语的结构标志变成译语的结构标志。在第三阶段,除了作译语的词法生成之外,还要作译语的句法生成,才能正确地输出译文的文句。  

  英格维的这些主张,在这个时期广为传播,并被机器翻译系统的开发人员普遍接受,因此,这个时期的机器翻译系统几乎都把句法分析放在第一位,并且在句法分析方面取得了很大的成绩。  

  这个时期机器翻译的另一个特点是语法(grammar)与算法(algorithm)分开。  

  早在1957年,英格维就提出了把语法与“机制”(mechanism)分开的思想。英格维所说的“机制”,实质上就是算法。所谓语法与算法分开,就是要把语言分析和程序设计分开,程序设计工作者提出规则描述的方法,而语言学工作者使用这种方法来描述语言的规则。语法和算法分开,是机器翻译技术的一大进步,它非常有利于程序设计工作者与语言工作者的分工合作。  

  这个复苏期的机器翻译系统的典型代表是法国格勒诺布理科医科大学自动翻译中心的机器翻译系统。这个自动翻译中心的主任沃古瓦(B.Vouquois)教授明确地提出,一个完整的机器翻译过程可以分为如下六个步骤:  

  (1)原语词法分析,(2)原语句法分析,(3)原语译语词汇转换,(4)原语译语结构转换,(5)译语句法生成,(6)译语词法生成。  

  其中,第一、第二步只与原语有关,第五、第六步只与译语有关,只有第三、第四步牵涉到原语和译语二者。这就是机器翻译中的“独立分析-独立生成-相关转换”的方法。他们用这种研制的俄法机器翻译系统,已经接近实用水平。  

  他们还根据语法与算法分开的思想,设计了一套机器翻译软件ARIANE-78,这个软件分为ATEF,ROBRA,TRANSF和SYGMOR四个部分。语言工作者可以利用这个软件来描述自然语言的各种规则。其中,ATEF是一个非确定性的有限状态转换器,用于原语词法分析,它的程序接收原语文句作为输入,并提供出该文句中每个词的形态解释作为输出;ROBRA是一个树型转换器,它的程序接收词法分析的结果作为输入,借助语法规则对此进行运算,输出能表示文句结构的树形图;ROBRA还可以按同样的方式实现结构转换和句法生成;TRANSF可借助与双语词典实现词汇转换;SYGMOR是一个确定性的树-链转换器,它接收译语句法生成的结果作为输入,并以字符链的形式提供出译文。  

  通过大量的科学实验的实践,机器翻译的研究者们认识到,机器翻译中必须保持原语和译语在语义上的一致,一个好的机器翻译系统应该把原语的语义准确无误地在译语中表现出来。这样,语义分析在机器翻译中越来越受到重视。  

  美国斯坦福大学威尔克斯(Y.A. Wilks)提出了“优选语义学”(Preference Semantics),并在此基础上设计了英法机器翻译系统,这个系统特别强调在原语和译语生成阶段,都要把语义问题放在第一位,英语的输入文句首先被转换成某种一般化的通用的语义表示,然后再由这种语义表示生成法语译文输出。由于这个系统的语义表示方法比较细致,能够解决仅用句法分析方法难于解决的歧义、代词所指等困难问题,译文质量较高。  

  (3)繁荣期(1976-现在):  

  繁荣期的最重要的特点,是机器翻译研究走向了实用化,出现了一大批实用化的机器翻译系统,机器翻译产品开始进入市场,变成了商品,由机器翻译系统的实用化引起了机器翻译系统的商品化。  

  机器翻译的繁荣期是以1976年加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发的实用性机器翻译系统TAUM-METEO正式提供天气预报服务为标志的。这个机器翻译系统投入实用之后,每小时可以翻译6万-30万个词,每天可以翻译1500-2000篇天气预报的资料,并能够通过电视、报纸立即公布。TAUM-METEO系统是机器翻译发展史上一个里程碑,




你还没有个性签名,点击此处可以添加。


||引用回复||
页次:1/1 页 转到:
[首页] [上一页][下一页] [尾页]

您要搜索的字符
搜索范围



Sponsored by Totra Technology