摘 要:为了提高英语语句翻译的准确率,本文在英语语句翻译的分析方面,通过语句成分分析的方式优化英语翻译过程,该翻译系统能够实现把目标英语语句依据语句成分的相关程度而进行聚集处理,进而形成一个基于聚類树结构的数据分层翻译模式。在聚类树中较外层的目标英语语句与其他英语语句的语句成分差别明显,因此其翻译方式的相似度较低,再将其反馈给其他聚类中心进行分析,直至找到聚类度高的聚类树以完成翻译。该英语语义分析系统在单词含义的基础上,可以依据语句中的语句成分而实现对英语语句的高准确率翻译。研究结果表明,在设置合理的语句成分相似度阈值基础上,本系统可以有效地提升英语翻译的准确率。
关键词:聚类算法;语句分析;英语翻译
1. INTRODUCTION
当我们需要对一些英文信息进行研究时,尤其在科研和文献查阅方面,对英语理解的准确程度及其重要,但国内大多数人的英语熟练程度远远低于对母语的熟练程度,因此,如何通过智能算法技术实现对英语的准确翻译已成为当下研究热点。国内外在当下对英译汉的翻译方式中,多数均为按照组成英语语句的单词含义进行直接式翻译,这种翻译方式虽然能够大致保证其中文含义,但是由于中英文本身的差异性,无法从语法的角度去进行优化,也就会出现比较常见的语法错误,因此如何实现对英语的高质量翻译早已经成为我国针对自然语言处理研究的重要挑战。
2. STATE OF THE ART
根据目前的研究成果发现国内目前在英语语义分析方面大多为依据单词释义来进行智能化翻译的,这种翻译方式虽然基本上能够理解英语语句的中文语义,但是由于忽略了英语语句之间的语境,时常会出现错误的翻译结果。此外,由于国内外的相关算法和人工智能的技术瓶颈难以突破,使得英语语义翻译系统处于“浅发展阶段”,仍旧有较大的发展空间。而且国内外在对英语语义智能翻译方面,很少涉及到基于语句成分的英语翻译算法,如果当下的英语翻译系统在识别英语语句单词的含义基础上,实现对单词群的语法分析,就会大大提高对英语语句翻译的准确率,也会很好地考虑到相同语句不同语境下的含义。基于此,本文研究了基于语句成分分析的英语翻译方法及应用。
3. METHODOLOGY
3.1基于聚类分析算法的英语翻译模型构建及应用思想
我们所常见的聚类算法要解决的是“把目标文本集合按照一定的规律分成多个组,通俗来讲就是文本相同归为一组、文本不同归为不同组的过程”,该算法已成为信息挖掘和目标内容相似度分析等国内外许多领域的研究热点,此外文本聚类也是一种自学习的基本方法。在本英语翻译模型中,聚类算法会将英语语句文本信息按照语法的相似性来归结于同一个簇,这就是说不同的簇组成员(目标英语语句)则没有相似性,并且选择不同的聚类方式会使得簇内成员具有不同的相似度。本英语语义分析模型的核心环节就是通过对不同的英语文本目标进行聚类,将目标英语语句按照语法的相似性和组成语句的单词含义相似性进行聚类,从而避免中英文语法之间的差异性。
由于本英语语义分析模型是从语法方面进行深入分析的,因此我们把目标英语语句文本的信息通过一定的模式翻译为计算机可以识别的语言信息(一般为二进制数或者十六进制数)。针对这一问题,我们采用向量空间模型的方式进行对目标文档的信息处理。首先,针对目标英语语句,本英语翻译系统会对目标英语语句进行特征信息提取,再进行计算机语言处理,转化为二进制数,从而使得计算机进行存储并且和已有的数据库信息进行对比分析。其基本实现过程如图1所示。当遇到一些特殊的英语语句信息时,本翻译模型会通过特殊的识别通道进行智能识别。然后通过计算机的数据库信息和预先设置好的判断程序,对一些英语语句文本信息进行语法还原,从而实现二次文本信息的处理。最后、则是针对一些低频或者无意义的英语单词信息进行有目标性地删减或者移除,并通过向量的方式进行记录,形成特殊文本信息记录,实现了将文本信息转换为向量信息,并且进出存储。例如当需要进行同类英语语句中的语法内容分类时,就可以依据这些具有特殊信息标记作用的向量进行比对。当相关英语语法的吻合度满足预先设定的要求时,就可以实现对目标英语语句的数据处理和语法分析,进行判断和分类,实现更加精准的翻译。
3.2本英语翻译模型中的优化过程
为了使得本英语翻译系统的整体分析结果更加偏向于中文的表述习惯,尽量减小中英文语法之间的差距,我们按照目标英语语句文本在聚类后的特征元素属于所划分的类别的概率,将这些聚类分为硬聚类(指一个特征元素只属于一个目标类别)和软聚类(指一个特征元素可以同时属于多个类别,用文本信息在聚类时的概率表示属于每个类别的程度)。在对本基于语句成分的英语翻译模型的优化环节,本研究把聚类过程中对目标英语文本信息处理的过程分成层级聚类和非层级聚类两种方式。其原因如下:层级聚类的直观原理可以通过一个树状结构来表现,每个树枝的节点就是一个独有的聚类集合(即可通过对语句成分之间的差异性进行优化翻译)。而非层级的聚类结构则没有层级聚类那么复杂,它是依照我们所常见的迭代法,从原始文本信息数据到最后一个文本信息通过的多次的迭代进行不同的归类(即根据不同的语句进行无差异性地翻译)。在本研究中共设有n个待翻译的语句,每个待翻译的语句共有m个语义特征数据,得到的聚类序列如下:
本英语翻译模型在对语句的具体翻译过程中,其分析流程如图4所示。
4. CONCLUSION
根据上述研究,本文首先回顾了当前英语翻译领域对语义和语句内容分析的研究现状和存在的问题,然后提出了针对英语语句中的语句成分的翻译模型,从语句成分方面对英语语义分析进行了研究,运用聚类算法,在对英语语句中的单词释义基础之上,将英语中的语法因素进行了考虑,并且按照不同的聚类中心将其分析,从而提高了传统英语语句翻译中的准确率,这也是本研究的创新点。虽然本研究能够很好地提升英语翻译的准确率,但只注重了从语句成分的差异性方面进行优化,因此本研究存在一定的不足。
Reference
[1].Figen ?ZTEMEL. TRANSMISSION OF CULTURAL SPECIFIC ITEMS INTO ENGLISH TRANSLATION OF "DEAR SHAMELESS DEATH" BY LAT?FE TEK?N[J]. International Journal of Languages Education & Teaching, 2017, 5(Volume 5 Issue 1):302-320.
[2].Hiley David. The Scientia artis musice of Hélie Salomon: Teaching Music in the Late Thirteenth Century: Latin Text with English Translation and Commentary[J]. Music and Letters, 2018(3):3.
[3].Léglu Catherine. \n, Robert the Devil: The First Modern English Translation of ‘Robert le Diable’, an Anonymous French Romance of the Thirteenth Century. Translated by Samuel N. Rosenberg[J]. French Studies, 2018(3):3.
论文指导 >
SCI期刊推荐 >
论文常见问题 >
SCI常见问题 >