SCI期刊 | 网站地图 周一至周日 8:00-22:30
你的位置:首页 >  音乐 » 正文

音乐美欣赏中计算机的重要性

2021-4-9 | 音乐

 

音乐具有感染人心的魔力,可以拉近人与人之间的距离、创造共同的回忆、增加活动或戏剧的气氛,更能轻易地引起我们的喜怒哀愁。热情的歌曲让我们慷慨激昂、悲伤的歌曲说出人们的心伤、悠扬的歌曲则让我们心情平静。人们对于音乐的情绪具有这样的欣赏力与鉴别力,但计算机却还没有。

 

如何让计算机如人脑一般,具有辨别音乐情绪的能力呢?这就是“音乐情绪辨识”(MusicEmotionRecognition)所要研究的。

 

为什么要做音乐情绪辨识?

 

音乐与情绪有密不可分的关系,自古以来便有许多不同学科的学者在探究音乐与情绪的关系,包括哲学家、社会学家、音乐学家、人类学家、神经科学家、音乐治疗学家等,但在信息领域真正大量投入人力研究自动化音乐情绪辨识系统,却是迟至21世纪初期的事。

 

音乐情绪辨识的兴起,主要是源于数字化时代的来临,MP3压缩技术以及硬盘储存能力长足的发展。不仅储存媒体空间越来越大,价格也越压越低,人们能轻而易举地在个人计算机或是便携装置上储存成千上万首的歌曲,可是如何在那么庞大的音乐库中找到想听的歌曲,就成了个棘手的问题。

 

传统上,一般使用者还是习惯将歌曲以歌手名称、专辑名称等分文件夹存放,就如同一片片的光盘一样。想要听歌的时候,使用者必须在文件夹间浏览,选取自己想要聆听的专辑,或是从不同专辑中挑出部分歌曲。较为熟练的使用者会将不同专辑的歌曲组合、储存成播放列表,在不同的时机挑选不同的播放列表来听。

 

然而,手动地挑歌是非常耗时的,播放列表的使用也造成只有少数部分歌曲被反复地聆听,大多数的歌曲其实很少会被使用者选到,降低了音乐库实质上的丰富性。况且,在许多时候使用者并不清楚或不愿意选择要听哪些歌曲,而只想跟着当下的情绪或是情境,聆听符合那种感觉的歌曲。比如说,无聊的时候想要听点让人亢奋的音乐;专心念书或是工作的时候想要听点优雅安静的音乐。这样的需求必须透过音乐情绪辨识的帮助,深入分析音乐的内容及情绪,方才能够被满足。

 

有了音乐情绪辨识系统,用户可以以情绪为索引来找寻歌曲。比如说,使用者可以指定特定的情绪,要求系统提供带有这一类情绪的歌曲;用户也可以指定一系列的情绪,例如说从平静到亢奋再回归平静,从而产生一个音乐播放列表,其中歌曲情绪的变化依照使用者的设定。这样的检索方式不但便利、有趣也更加人性化。

 

除了让用户选择音乐的情绪外,科技也可以让计算机根据用户的心情、状态“主动地”推荐音乐。

 

例如某个特定空间,比如说客厅或是汽车内,计算机可以通过摄影机或是麦克风捕捉用户的表情、动作、音量等信息,自动判断使用者当前的心情,再主动地推荐符合该心情的歌曲。智能型手机或是音乐播放器也可结合时间、地点或是一些传感器搜集到的资料,判断使用者可能在从事怎样的活动,比如说起床、运动、工作或通勤等,借此来推荐适当的歌曲。有了音乐情绪辨识,音乐将能更好地融入我们的日常生活。情绪标定音乐情绪辨识本身是个跨领域的研究,需要心理学、音乐学及信息科学方面的相关知识。由于音乐情绪辨识关心的是人对于音乐的感受,因此也可以说研究的是一个艺术与科学的交会点。

 

就像我们教孩子认字会使用许多范例一样,要教计算机辨识音乐中的情绪,也需要先准备一个标定好的数据库,在这个数据库里面,我们很明确地知道哪些歌是属于快乐的情绪、哪些歌是属于悲伤的情绪,如此一来,计算机方能利用这些资料来找出各种音乐的特征与情绪的关系,分析出具有怎样特性的音乐会引起怎样的情绪。就像是有个老师在旁边给小孩子许多范例,教导她学习,这样的过程也被称之为“监督式学习”(SupervisedLearning)。

 

音乐情绪数据库的建立关系到心理学的“实验设计”理论。由于情绪的感受没有客观的答案,因此通常还需要邀请一些受测者来替歌曲作情绪的标定。这些标定会被当成是歌曲情绪的“标准答案”。

 

计算机会被要求能够像人类受测者一样准确地判断出这些歌曲的情绪。

 

由于情绪受到听者个性、性别及年龄等等的影响,因此必须让不止一名受测者听我们选定的音乐,并记录这些受测者聆听之后所感受到的歌曲情绪。如果一首歌曲的情绪无法取得多数人的共识,那代表所要传达的情绪是比较模糊的,或许就不适宜纳入数据库内。使用者的选定必须均衡,例如一半是男生、一半是女生,背景皆固定为大学院校中的学生等;歌曲的选定则必须多元,我们希望数据库里包含的音乐尽量越丰富越好,能涵盖各种不同类别、不同情绪的音乐,如此数据库才能具有代表性。另外,也需要注意实验设计不能给受测者太多的负担,且标定情绪的过程要明确且统一,例如,究竟是要以音乐旋律所传达的情绪为准,还是以歌词为准,或是两者皆考虑?这些因素都必须被仔细考虑并设计,否则可能会影响标准答案的质量,进而限制了情绪辨识的可学习性。

 

情绪运算

 

有了标准答案之后,我们还必须用到数字信号处理的技术,结合音乐学知识和图形辨认技术,分析音乐信号的特征,方能将音乐的特征与音乐的情绪做链接。

 

哪些音乐特征会跟情绪有关呢?我们不难猜到,情绪的亢奋与否和歌曲的音量大小、节奏快慢、音调高低以及音色是否明亮有关;情绪是快乐或悲伤则可以从乐曲是大调或是小调、音色是否和谐顺畅有关。虽然这些信息都可以在乐谱中得到,但在实际的情况中,许多时候我们只有音乐信号,并没有相对应的乐谱。再加上对现代科技而言,计算机还没办法像受过音乐训练的人脑一样,精准地将歌曲的乐谱从声波中还原出来;计算机能够做到的,是透过数字信号处理技术,尽量去估测出这些音乐特征的值,例如估测一首歌一分钟大约会有几个拍子、或是估测一首歌音高的分布情形等。由于目前计算机尚无法精确地以音乐的语言来描述音乐,只能透过一些统计值及估计来大略评估,音乐情绪辨识的准确率也因而受到影响。

Top