摘要 智能语音技术作为人机交互的实现形式,广泛应用在社会生产生活的各个领域。近十年来我国城市轨道交通行业迎来了最快发展的阶段,智能语音技术也应用到了城市轨道交通自动售检票系统购票终端、多功能客服等子系统的建设中。文章结合智能语音技术的应用环境,分析了该技术在城市轨道交通自动售检票系统中的应用现状及发展前景,为自动售检票系统的建设与发展起到促进作用。
关键词 智能语音技术;城市轨道交通;自动售检票系统;人机交互
0 引言
智能语音技术是机器获取人类语言信息的技术,通过该技术可以实现人机交互。一方面,智能语音技术可在不同场景内进行语言的录入,实现人对机器控制的多样化、高效化。另一方面,可实现机器的即兴口语和自然对话以及多种语种的同声翻译。
1 智能语音技术概况
智能语音技术,是人类实现人机交互的重要手段,在各行业中有着较为广泛的应用,该技术主要包括自动语音识别技术(ASR)和语音合成技术(TTS)。
1.1 自动语音识别技术
自动语音识别技术:ASR,即Automatic Speech Recognition,可实现将人类语言的声音信号,通过设备拾音、信号处理转化为计算机识别的文本文件,用于各种计算机软件的数据处理。
1.2 语音合成技术
语音合成技术:TTS,即Text To Speech,通过计算机专用软件和预置语音库数据库,可将任意机器内文字用标准流畅的语言,通过音频输出设备朗读出来。
智能语音技术结合了声学、数字与模拟电路学、语言学、计算机科学等学科,实现了实时的语音输入输出,它与当今前沿的AI技术相结合,实现了不同应用场景下的人机交互,并从不同程度上替代了手动录入信息及显示屏上的文字输出,极大提高了工作、生产效率及人机交互多样性。
2 智能语音技术的应用
21世纪被称作是IT时代,随着集成电路技术飞速发展,芯片算力不断提升,AI智能、物联网、云计算已成为科技发展的重要方向,与此同时,智能语音技术也不断推陈出新,支持方言输入、俗语、多国语言兼容等功能。智能语音技术广泛应用在移动设备、智慧交通、智能家居、机械制造等领域[1]。
2.1 移动设备
移动设备:移动设备是最早具有智能语音技术实现场景的终端设备,通过设备自身具备的音频输入输出模组,让用户通过语音唤醒、即时对话,实现了用户通过口语对移动电话、个人计算机等设备内各程序软件的操作及控制。该技术领域技术较为成熟且应用较为广泛的产品有苹果公司的Siri及微软的Cortana,都满足了以触发式语音人机交互为核心的用户体验。
2.2 信息处理
智能语音技术被广泛应用到国际会议现场、政商文体新闻报道等领域。通过智能语音设备进行实时的文字录入,可实现多语言机器翻译、新闻实时播报等功能。
2.3 智能客服
智能客服中的智能语音技术可分为线上与线下两类[2]。随着智能语音技术的日益成熟,已有大量物流、金融、保险、通信运营商等消费型企业上线智能语音客服,并在消费查询、业务办理、问题处理等部分基础业务中替代了人工客服;在大型商超或是机场车站中,带有智能语音功能的客服终端可提供方便快捷的地图索引、消费指南、实时的交通与天气信息。
智能语音客服的优势主要有3个方面:
(1)企业客服实现流程标准化,减少人的情感波动对问题处理的干扰;
(2)人机交互过程中信息的录入准确且高效,大大提高了客服接待的效率;
(3)企业人工成本及管理运维成本大大降低。
3 智能语音技术在城市轨道交通自动售检票系统的应用
在城市轨道交通建设中,智能语音技术用于自动售检票系统,当乘客因为对乘车城市不熟悉或是因为当地轨道交通线路复杂而导致无法确认目的地站点时,带有智能语音功能的自动售票机可通过乘客语音输入的目的地信息,为乘客进行后台地图模糊查询。北京、广州、南京、合肥、石家庄等城市先后将带有语音辅助购票功能的自动售票终端引入了地铁工程建设中。
在车站多功能客服终端上,可通过智能语音功能进行储值票充值、站点信息查询、更新票卡信息、远程客服连线等功能。多动能客服终端通过预置的对话情景引导乘客进行一系列票卡服务。
3.1 带有智能语音功能的自动售票终端
带有智能语音功能的自动售票终端是在传统TVM终端设备上加装智能语音模块、路由或通信模块,通过城市轨道交通专用数据传输连接云服务器进行后台数据处理,并以原路径回传至售票终端,实现人机语音交互购票。智能语音售票终端连接见图1。
該智能语音售票终端主要由5部分组成:
(1)自动售票机,包括3合1、4合1自动售票机。
自动售票机是轨道交通系统票务系统的核心设备终端,终端设备上的智能语音模组以串口通信或网线连接,此类售票终端配备了运行内存和存储空间较大的工控机(控制单元)用于软件的二次开发。
(2)智能语音模组,包括拾音麦克风、定位摄像头、音频信号处理单元。
1)拾音麦克风为多麦克风组合阵列,见图2,安装位置一般在TVM运营状态显示屏与乘客用触摸屏之间,位置大致与成年人面部位置相平,可更准确地收集乘客语音信息。带有智能语音模组的售票终端见图3。
2)定位摄像头,该设备可在售票终端前站立的多个乘客当中准确选中正在进行购票操作的乘客,根据摄像头对乘客口型的捕捉,乘客的语音会被标记为需要处理的音频信号。
3)音频信号处理单元主要具有声音信号降噪处理、数字模拟信号转换、数据发送接收、数据解码的功能。麦克风收集的大量环境音频信号后,该设备主要处理被标记的购票者的声音信号。信号处理过程见图4。
推荐阅读:文明交通相关新发表的论文
论文指导 >
SCI期刊推荐 >
论文常见问题 >
SCI常见问题 >