SCI期刊 | 网站地图 周一至周日 8:00-22:30
你的位置:首页 >  音乐研究论文 » 正文

歌唱发音质量评估论述

2021-4-9 | 音乐研究论文

作者:苗雨 单位:江苏师范大学

一、歌唱声音质量客观评价研究历史追溯

歌唱声音质量客观评价的研究是以声乐艺术科学化研究为前提的,这种科学化的研究始于欧洲,它的研究历史最早可以追溯到18世纪。

(一)轻缓起步阶段

早在1703年,法国医生杜达(Dydart)发表了《发声原理的研究报告》(MemoiresSurlacausedelavoix)一书,提出了“旋涡”(Vortex)理论,从生理学的角度对歌唱发音的科学性进行了开创性的研究①。1854年,西班牙著名声乐教育家和理论家玛努埃尔•加尔西亚(M.P.R.Garcia,1805-1906)发明了喉镜,促进了人们对嗓音生理学的研究,同时也开创了以人体发声机理作指导的新的教学方法(机理教学法),使人类声乐发展史进入了一个崭新时代。1863年德国海德堡大学教授亥姆霍兹(HermannVonHelmholtz,1821-1894)发表了近代世界声学史上划时代的巨著《作为音乐理论生理基础的音的感觉》(又译《声音感觉论》),将基础生理学及解剖学的研究和数学与物理学分析结合起来,驱使吸引人们运用声学的普遍原理去解释歌唱发音的现象,在声乐界产生了强烈反响。经过一个半世纪的发展,对声乐演唱和教学领域的研究,终于从纯粹的以人的主观意识为主的经验主义进入了以生理学和物理学原理为基础的客观科学主义研究的新高度。

(二)快速发展阶段

自20世纪20年代苏联国立莫斯科大学物理学教授尔谢夫金(SergeyNikolayevitchRzhevkin)和卡赞斯基(VladimirSergeyevitchKazansky)发现歌手共振峰以来,西方学者对歌唱声音质量进行实证性评价研究进入快速发展的阶段。美国的巴索洛缪(WilmerT.Bartholomew),威廉•范纳德(WilliamVennard),瑞典的桑德柏格(JohanEmilFredrikSundberg)等是这一研究领域的代表。我国自20世纪80年代开始,包紫薇(1981)、王士谦(1986)、韩宝强(1996)、吴静(2007)、于善英(2010)等学者相继在此研究领域取得了一系列的成果。他们的研究主要是运用频谱分析等技术,为歌唱声音的不同形态找到相对应的声学评价参数,并探索在歌唱评价和声乐教学中的应用价值。这一时期,王建群(2005)、刘加林(2006)等学者还从基频、标准化噪声能量、声强等方面研究影响歌唱发声质量评价的相关参数。以上相关研究为基于人工智能技术的歌唱发声质量客观评价研究奠定了基础。

(三)纵深拓展阶段

21世纪以来,计算机信息处理技术与神经生理学、非线性动力学、模糊数学等学科的快速发展,为基于人工智能技术的歌唱声音质量评价研究提供了更为丰富的研究手段。我国有关基于人工智能技术的歌唱声音质量评价研究始于2007年,迄今成果单薄,其中代表性的成果有:王修信等(2007)、罗兰娥(2008)、李文娟等(2009)、袁剑(2010、2011)。这类研究或利用语音分析技术对艺术嗓音进行声音样本提取,并与标准化声音或专业评委的主观评价进行比较;或制定涉及多项评价标准的评价方案,然后利用计算机、人工智能、模糊数学等知识原理对不同声音评价参数进行分析,最后在此基础上建立歌唱发声质量客观评价机制。以下本文将以主流研究中的两种体系———基于歌唱声音评价参数提取的和基于主观评价标准量化的客观评价机制为研究对象,分别以研究思路和方法、研究内容、研究结果、存在问题等方面对其研究成果作出归纳梳理和评价。

二、基于人工智能技术的两种评价体系

之所以确定为两大体系,是因为前者的研究基础是歌唱声音,后者是建立在主观评价标准量化指标的基础之上的;之所以都确定为客观评价体系,是因为二者均运用了人工智能技术。

(一)基于歌唱声音评价参数提取的客观评价研究

直接以歌唱声音本身作为评价参数的客观研究目前主要采用两种方法———神经网络研究方法和特征匹配研究方法。

1.利用神经网络方法建立评价机制的研究

此种研究方法以广西师范大学计算机科学与信息工程学院的王修信、物理与电子工程学院的罗兰娥为代表。(1)研究思路与内容王修信等先后发表了《几种声学参数在艺术嗓音客观评价中的应用》(2007)、《艺术嗓音歌声客观评价初探》(2007)两篇文章,提取歌声平均能量(表征相同环境下歌声信号的相对大小)、平均频率误差(判别测试者的歌声频率与标准频率中心是否对准)、平均音域误差(表征测试者音域与曲谱音域的偏离程度)作为客观评价的3个声学参数。在MATLAB计算机培养编写程序②环境下,使用BP(backpropaga-tion)神经网络方法③客观评价艺术嗓音歌声质量。后篇文章较前篇文章有所深化,将声源分析样本从36人增加到48人,明确了性别比例(其中女31名,男18名);在分析方法上增加了多元线性回归方法。研究认为,使用BP神经网络方法和多元线性回归方法基本都能正确客观评价歌声质量,且与资深专业教师的主观评价一致。BP神经网络方法误差在4%之内,线性回归方法误差在6%之内,BP神经网络方法(模型)客观评价效果较优。罗兰娥与王修信为师承关系,其研究以王修信的研究为基础。因此,罗兰娥在研究方法和观点上与王修信有不少相似之处,包括如录音环境、录音设备(软件、硬件)、声音样本提取标准、存储格式、MATLAB分析程序的选择等方面。相对于王修信等的研究,该文的创新之处在于:①明确了歌唱声音信号采集的类型,使该研究与歌唱实践更加契合;②声音评价提取的参数由原有研究的3项增加到8项,对被评价声音的反映更加全面;③评价网络建立所依据的类型增加了评价精度更高的小波神经网络。研究认为,神经网络方法能正确客观地评价歌声质量,评价分数最高的歌唱者声学参数呈规律变化;小波神经网络方法较BP神经网络方法评价精度更高;声学参数对评价结果影响度排序依次为第三共振峰、第一共振峰、音域、基频、平均能量、第三共振峰微扰、第一共振峰微扰、基频微扰等。(2)评价及存在问题王修信等的研究在歌唱声音采样时对于录音环境、录音设备(软件、硬件)、声音样本提取标准、存储格式、被录制对象的年龄、人数、唱法等方面都有明确的界定,在规范性和严谨性方面达到了较高的要求。该研究对被录制对象的性别和声部在(2007)中不明确,在(2007)中区分了男女性别,对歌唱者的声部依然未见说明。遗憾的是,两项研究对歌声信号采集类型(单音、练声曲、歌曲片段)及演唱音域未作说明,在歌唱艺术实践中,以上内容都是对歌唱发音评价产生影响的重要因素。罗兰娥(2008)中涉及到一些与音乐相关的概念值得商榷。分析结果中有:“1号歌唱者E、F、G三种调试的第一共振峰均接近450Hz,第三共振峰均接近2500Hz,音域3.5个八度左右,明显宽于其他歌唱者”。这里存在两个问题。首先,这句话中提及到两个音乐概念———“调试”和“音域”。在音乐术语中没有“调试”这个概念,结合多次提到“调试”的上下文可以推断,作者指的应该是“调式”。但“调”和“调式”的概念在乐理中的含义是不同的。一般来说,孤立的一个音或毫无逻辑关系的若干个音无法构成音乐语言,只有把若干个音按照一定的关系组织起来才能塑造音乐形象,表达思想感情。主音与它构成一定的关系(主要是倾向性关系,音程关系与和弦关系)的若干个音所结合成的音的体系叫做“调式”。“调”主要是指主音的音高,亦即整个调式的音高。④作者在文中实际要表达的意思应是用E、F、G三种不同的调来演唱歌曲。其次,此句提到歌唱者的“音域3.5个八度左右”。这个3.5个八度如何解释?以男高音声部为例,理论上说,男高音音域的应用范围一般在C1-C3的两个八度之间。歌唱实践中,因为嗓音条件和高音技术原因,能达到这个音域范围的男高音也并不多见。罗兰娥(2008)的研究中,歌唱声音样本录制对象为音乐学院声乐专业19名21岁-25岁的本科大学生,就国内的声乐教学现状分析,这些学生的演唱音域如果能达到两个八度已经进入优秀的行列了,而结果显示1号歌唱者的音域达到3.5个八度左右是不可能存在的。

Top