树人论文网一个专业的学术咨询网站!!!
树人论文网

基于 B/S框架的交互式英汉机器翻译系统设计

来源: 树人论文网发表时间:2021-12-20
简要:摘 要:英语和汉语在很多方面都存在不同,因此在交流中经常出现理解错误的现象。各种英汉翻译系统的交互体验感都较差,主要表现在用词不准确、语法错误、系统发音不清楚、翻译反馈速

  摘 要:英语和汉语在很多方面都存在不同,因此在交流中经常出现理解错误的现象。各种英汉翻译系统的交互体验感都较差,主要表现在用词不准确、语法错误、系统发音不清楚、翻译反馈速度迟缓等方面。为此,文中设计一种基于 B/S 框架的交互式英汉机器翻译系统,以期辅助英汉语之间的交流。该系统以 B/S 三层架构为基础设计系统框架,在系统硬件部分,主要对关键的语音识别硬件、英汉翻译硬件和翻译结果输出硬件进行具体分析;软件部分主要对三个关键程序,即用户登录程序、语音识别程序、英汉翻译程序进行设计。系统测试结果表明,利用所设计系统进行翻译,译文经过专家评测后,人工评测综合得分为 3.769分,大于 3.5分限定值,证明系统的翻译质量较高,可满足用户需求。

  关键词:交互式翻译;英汉翻译;B/S框架;语音识别;系统设计;翻译性能测试;系统测试

基于 B/S框架的交互式英汉机器翻译系统设计

  张启振; 孙先洪 现代电子技术 2021-12-15

  0 引 言

  种族之间最大的不同在于语言体系的不同,这就导致跨种族交流十分困难。英语作为全球通用语言,是外交中最常用的语言,而我国的母语为汉语,英汉语在词汇、语法、语序、背景文化之间都存在极大的差异,这种差异使得彼此交流变得十分困难[1] 。因此,如何降低英汉语言之间的差异性,实现顺畅交流成为研究的重点。基于上述背景,各种英汉机器翻译系统被设计并广泛应用。例如,胡永久在规则策略的基础上设计了一种英汉机器翻译系统,该系统的关键在于翻译引擎和机器字典两部分。该系统经测试,可提高译文质量和分析效率。邢蕾基于双层分析的思路提出并设计一种英汉机器翻译译文自动生成系统,实现了英汉文本之间的自动转换。郭永辉等人通过计算与实例库之间的相似程度来进行机器翻译,然后结合规则方法,提出基于混合策略的英汉机器翻译系统。该系统经测试,具有译文正确率高和翻译速度快的特点。

  尽管已设计出各种英汉翻译系统,但是这些系统的交互体验感都较差,主要表现在用词不准确、语法错误、系统发音不清楚、翻译反馈速度迟缓等方面。针对上述问题,本文设计一种有效的交互式英汉机器翻译系统具有重要的现实意义。B/S框架是现代系统设计和开发中常用的框架架构,具有分布性好、业务扩展方便、维护和开发简单、共享性强、成本低等优点。文中以 B/S 框架为基础进行交互式英汉机器翻译系统设计。最后通过功能测试,证明系统翻译功能满足用户要求,验证了系统的有效性。

  1 基于 B/S 框架的交互式英汉机器翻译系统设计

  语言是人与人之间最直接的交流方式,一旦听不懂对方的语言,就无法明白对方要表达的意思,也就无法进行交流。以往在很多外交场合,都需要一名翻译作为双方沟通的桥梁[2] 。而这种方式受到翻译自身业务水平和职业素养的直接影响,存在很高的风险性。为此,机器翻译系统被设计出来并广泛应用[3] 。针对上述机器翻译系统存在的问题,本文设计一种基于 B/S 框架的交互式英汉机器翻译系统。

  1.1 系统框架设计

  交互式英汉机器翻译系统框架是在 B/S 三层架构的基础上设计出来的。B/S 三层架构全称为浏览器/服务器体系结构,是在 C/S 双层架构基础上发展而来的,在很多方面都得到了优化[4] 。表 1为 B/S架构和 C/S 架构具体优缺点对比。

  基于 B/S 的交互式英汉机器翻译系统框架主要由界面层、业务逻辑层、数据访问层 3层组成,如图 1所示。各层的具体功能如下:界面层:主要负责用户与系统之间的交互[5] 。业务逻辑层:负责响应用户请求,实现各种业务处理,然后将结果反馈给用户,是系统的核心层次。数据访问层:负责对数据库进行读写及管理。

  1.2 系统硬件设计本系统硬件主要分为三部分,包括语音识别硬件、英汉翻译硬件和翻译结果输出硬件。下面对这三部分硬件中的关键元件进行分析[6] 。

  1.2.1 语音识别硬件语音识别硬件是一个以 STM32F103VET6大容量芯片为载体,搭载若干电路与接口的微处理器,其硬件组成结构如图 2所示。

  STM32F103VET6芯片是一款基于 CM3内核的高性能 32位处理器,具有低功率、低电压,并结合实时功能的极佳性能[7] 。该芯片技术参数如表 2所示。此外,该处理器主要硬件还包括话筒、放大滤波电路、液晶显示器、音频转换芯片、扬声器等部分[8] ,各部分的作用如下:

  1)话筒的作用是收集发声者的话语; 2)放大滤波电路的作用是对语音进行增大和去噪处理,提高语音信号质量; 3) 液 晶 显 示 器 的 作 用 是 显 示 语 音 处 理 过 程 和结果; 4)音频转换芯片的作用是将语音转换文本形式或是将翻译过来的文本语言转换为目标语音; 5)扬声器的作用是将翻译的目标语言播放出来[9] 。

  1.2.2 英汉翻译硬件

  英汉翻译硬件是本系统的核心和关键硬件,该硬件是一块用来进行嵌入式系统开发的电路板。该开发板上装载了各种相关英汉翻译程序,以便进行业务处理[10] 。本系统中的开发板为 DE2⁃70 开发板,其结构如图 3 所示。该方框图中包括 Cyclone Ⅱ 2C70 FPGA、串行配置设备、USB Blaster电路、同步动静态随机存储器、闪速存储器、SD 卡槽、按钮开关、编码解码器、主从控制器、收发器等。

  1.2.3 翻译结果输出硬件

  翻译结果输出硬件是系统末端部分,主要是将翻译出来的目标语言进行语音输出和翻译结果显示。在本系统中,翻译结果输出硬件为一个翻译输出机[11] 。该翻译输出机技术参数如表 3所示。

  1.3 系统软件翻译程序设计

  基于 B/S 框架的交互式英汉机器翻译系统主要包括 3 个关键程序,即用户登录程序、语音识别程序、英汉翻译程序[12] ,下面进行具体分析。

  1.3.1 用户登录程序

  用户登录程序是整个系统的初始程序,所有用户都是通过这个程序进入系统,进行相关业务操作。该程序包括三个页面,即登录页面、新用户注册页面及身份密码验证页面。具体过程为:首先用户根据登录窗口进入页面;如果是未经注册的新用户,则需要通过登录页面转入到新用户注册页面,输入相关信息,进行新用户注册;注册成功后,转回登录页面,输入验证信息,进入到系统中[13] 。系统根据用户等级分配权限,包括考务管理员和用户两个权限等级。所有用户只有在确定分配权限后才能进入开发系统,然后进行相关业务操作。

  1.3.2 语音识别程序

  语音识别程序是指对一方用户发出的源语言进行识别。具体过程分为四部分,即预处理、特征提取、模板库建立和语音识别[14] 。

  1)预处理。采集到的一方用户发出的源语音受到周围环境的影响,质量较差,因此需要进行预处理,具体包括去噪、放大、分帧和加窗等操作。

  2)特征提取。利用数字处理技术对语音进行特征提取,降低后续识别难度。提取出来的特征可以是波形、幅度、能量、频谱等。

  3)模板库建立。需要输入大量语音资料,建立模板库,以便为识别提供对比资料。

  4)语音识别。将提取出来的特征与模板库进行测度匹配,计算相似度,得出识别结果。

  1.3.3 英汉翻译程序

  英汉翻译程序是系统的核心程序,主要任务是将一方用户的源语言翻译成另一方用户可以理解的目标语言,具体过程如图 4所示[15] 。

  2 系统测试与分析

  为测试所设计系统翻译功能,在 Matlab 平台上进行系统翻译仿真测试。

  2.1 系统运行环境

  系统测试与分析在如表 4所示的环境中进行。

  2.2 语料库

  本 翻 译 系 统 语 料 中 的 资 料 主 要 来 自 Corpus of Contemporary American English(COCA)和现代汉语平衡语料库,具体情况如表 5 所示。在该语料库中包括由口语转写而来的文本,也包括语音文件。

  2.3 待翻译材料

  本实验选取的待翻译材料来自一篇演讲稿,具体内容如图 5所示。

  2.4 评估方法

  本系统的评估采用人工评测的方法,该方法流程如图 6所示。

  该方法是由翻译专家(在这里选择 10 名专家)对本系统翻译出来的译文进行两个方面的评测,具体包括可懂度(英文翻译可以被人理解的程度)和忠实度(译文对原有英文语义的忠实程度)。这两个指标共分为 4 个等级,具体如表 6所示。

  对可懂度和忠实度各个等级进行量化,计算公式为: F = 0.3A + 0.7B 式中:A为可懂度;B为忠实度;F为得分,分数值大于 3.5 时,认为翻译较为准确,达到用户的翻译要求。

  2.5 系统翻译结果

  利用本系统对 2.3 节待翻译材料进行翻译,翻译结果如图 7所示。

  2.6 系统翻译性能评价结果

  系统翻译性能评价结果如表 7所示。从表 7可以看出,利用所设计系统进行翻译,译文经过专家评测后,得到3.769的分数,大于3.5限定值,认为译文能准确地表达出原文的含义,没有出现较多的错误,满足用户的需求。

  3 结 语

  随着世界各国联系的加强,英语作为国际通用语言,在很多社交场合的交流中都起到了关键作用。然而,由于我国汉语与英语语言体系的不同,理解上经常出现偏差。为此,本文设计一种基于 B/S 框架的交互式 英汉机器翻译系统。构建由界面层、业务逻辑层、数据访问层组成的基于 B/S 的交互式英汉机器翻译系统框架,对语音识别硬件、英汉翻译硬件和翻译结果输出硬件等系统硬件进行分析,对用户登录程序、语音识别程序、英汉翻译程序等系统软件进行分析。经测试与分析,证明该系统的翻译性能良好,能够满足用户需求。然而,受到时间和经验的限制,系统测试上还存在不足,仅对一个国家语言的英语翻译进行了测试,而不同的国家语言也存在一定的差别,因此有待进一步扩展测试,增加系统的适用性。