音乐情绪辨识(Music Emotion Recognition)是借由分析音乐资讯,自动化地辨识音乐中要表达的情绪。音乐情绪辨识本身是个跨领域的研究,同时需要心理学、音乐学及资讯科学的知识。
此类系统利用讯号处理以及机器学习算法训练模型,对音乐抽取特征并加以分析,借此找出音乐特征与受测者对音乐情绪标示的关联。以下列出最常使用的机器学习方法:
借由寻找最佳分界平面将资料分开,如此一来便可以利用最佳分界平面将新的测试资料归类。
SVR与SVM的概念类似。不同之处在于SVM所找的平面将空间一分为二,但SVR要找的是能准确预测资料分布的平面。 机器学习后,通常使用交叉验证来对准确度加以验证。交叉验证主要是将数据库随机分成数个不重叠的部分,每次提取一个部分做测试资料,剩余的作为训练资料。其作法是基于:
而机器学习最常使用的流程如下:
使用各种形容词当作情绪标签者称之。例如:有趣的(fun)、强烈的(intense)、甜蜜的(sweet)等。此法常用SVM作为机器学习的算法,训练出一个或多个模型。
借由定义出二维或三维的情绪座标,将情绪展开成为平面或空间。
最常被使用的情绪平面是泰尔二维情绪平面,纵轴与横轴皆介于-1到1之间,其中纵轴为激昂度,越上方表情绪越激昂;横轴为正向度,越右方表情绪越正向。如此一来,每一首歌都可以被标示在情绪平面中。不同于分类法,座标法中的情绪是连续,此处选择的机器学习方法为SVR。
除了使用分析音乐讯号的方法,还可以利用文字资讯以及资料探勘的技术对音乐情绪加以分析。