题目 :基于情感感知的个性化音乐推荐技术研究
英文论文题目: Research on personalized music recommendation technology based on emotion perception
摘 要
在音乐举荐方面,目前大部分的举荐体系仍然以固有的办法为基础,情境感知在特色化的音乐举荐方面的使用仍然处在开始环节。固有的举荐办法通常仅仅重视“客户-项目”间存在的关联关系,很少思考客户行为产生的时候对照的情境数据(比如时间、天气等相关部分)。以情境感知为基础的特色化音乐举荐,举荐经过把情境数据引进举荐计算方法,不但可以符合客户特色化的举荐需要,能够从大量音乐库内协助客户迅速定位至符合本身喜爱的音乐,另外可以较佳地展现普适核算的价值,也就是数据与核算资源的获得和连入能够出现在任意时间、任何地点、通过任意模式。这篇文章探究的情境感知举荐方法,关于目前音乐举荐方面具备某一程度的真实参照价值。这篇文章从选题探究的有关环境着手,先是陈述音频划类和检查搜索技术的前提,之后具体的剖析纯音乐和语音-音乐混合型片段的高准确识别算法,接着又探析了基于MFCC(Mel-Frequency Cepstral Coefficients)和GMM(Adaptive background mixture models for real-time tracking)的歌曲个性计算方法,最后重点的研究了歌曲个性计算与推荐原型系统设计与实现。
关键词:音频检索;歌曲;个性计算;音乐推荐
Abstract
In the field of music recommendation, most of the current recommendation systems are based on traditional methods, and the application of situational awareness in personalized music recommendation is still in its infancy. The traditional methods of recommendation tend to focus only on the two dimensional relationship between the “user project” and less consideration of the situational information (such as time, place, weather, etc.) when the user's behavior occurs. The personalized music recommendation based on situational awareness is recommended by introducing the scene information into the recommendation algorithm. On the one hand, it can not only meet the personalized recommendation requirements of the users, that is, it can help the users to quickly locate the music to satisfy their own preferences from the mass music library, on the other hand, it can also reflect the value of pervasive computing, that is, the value of the pervasive computing is more important. Access and access to information and computing resources can occur at any time, anywhere, in any form. The scenario aware recommendation algorithm proposed in this paper has some practical reference value for the current music recommendation field. Starting with the relevant background of the research, this paper first expounds the basis of audio classification and retrieval technology, then analyzes the high accurate recognition algorithm of pure music and speech music mixed fragments, and then analyses the method of song personality based on MFCC (Mel-Frequency Cepstral Coefficients)and GMM(Adaptive background mixture models for real-time tracking), and finally studies the character calculation and recommendation of the song. The design and implementation of the type system.
Keywords: Audio Retrieval; Song; Personal Computing; Music Recommendation
目 录
摘 要 I
Abstract II
目 录 III
第1章 绪论 1
1.1 研究背景 1
1.2 研究目的和意义 1
1.2.1 研究目的 1
1.2.2 研究意义 1
第2章 情景感知相关理论 3
2.1 情景的定义和获取 3
2.2 情景用户偏好提取 3
2.3 情景建模相关技术 4
第3章 纯音乐与语音-音乐混合片段的高准确识别算法 6
3.1 引言 6
3.2 音频识别分类技术发展和主要算法分析 6
3.3 纯音乐和语音-音乐混合音频识别算法模型 7
3.3.1 音乐信号预处理及特征提取 7
3.3.2 音频识别规则 10
3.3.3 融合判决(音频片段识别) 10
3.4 实验及结果分析 11
3.4.1 实验目的和数据资源 11
3.4.2 实验环境和条件 12
3.4.3 实验结果评价指标 12
3.4.4 实验过程和参数说明 12
3.4.5 实验结果分析 12
第4章 基于MFCC和GMM的歌曲个性计算方法 15
4.1 引言 15
4.2 歌曲个性计算模型 15
4.2.1 特征提取处理 16
4.2.2 高斯混合模型(GMM)算法 16
4.2.3 EM算法 19
4.3 实验及结果分析 20
4.3.1 实验目的和数据资源 20
4.3.2 实验结果评价指标 20
4.3.3 实验过程和参数说明 21
4.3.4 实验结果分析 21
第5章 歌曲个性计算与推荐原型系统设计与实现 23
5.1 引言 23
5.2 系统总体设计 23
5.2.1 设计目标和技术路线 23
5.2.2 功能需求分析和设计原则 23
5.2.3 系统的总体架构 24
5.2.4 交互界面设计 27
5.3 系统关键功能模块的实现 28
5.3.1 歌曲预处理模块 28
5.3.2 歌曲特征提取模块 31
5.3.3 系统训练模块的具体实现 33
5.3.4 系统识别模块的具体实现 34
5.4 实验及结果分析 35
5.4.1 实验目的和数据资源 35
5.4.2 实验过程和参数说明 35
5.4.2 实验结果分析 36
第6章 结束语 37
6.1 总结 37
6.2 工作展望 38
参考文献 39
作者简历 43
致谢 44
第1章 绪论
1.1 研究背景
音乐其实是一类关键的媒体资源,对音乐实施检查搜索,这对音乐数据库、数字图书馆的建造具备特别关键的价值。网络中的多媒体具有特别庞大的资源量,民众要求有效的搜寻引擎从大量的信息内找到所需的音乐资料。此外,音乐的检查搜索在卡拉的检查搜索、协助视频检查搜索等相关部分均具备宽阔的探究远景与庞大的使用价值。因为音乐自身的特征,音乐的检查搜索有别于普通的音频检查搜索,和固有的文字检查搜索更是不一样。当前的音乐检查搜索样式大部分以文本为基础,参照音乐名、词作者、国别、文件样式、划类等一系列相关的人为标记实施检查搜索。对于持续增加的大量资源和大家对于音乐检查搜索的较高规则,鉴于近似歌唱人员的声音或近似格调、节奏乃至近似背景音乐音色的音乐检查搜索持续获得重视。这种问题具有极强的交叉性,牵涉的内容比较普遍,具有较强的综合特性,牵涉电脑科学、声学、心理学等相关部分。
1.2 研究目的和意义
1.2.1 研究目的
这篇文章指出“歌曲个性”这个概念,用来归纳歌曲的格调、歌唱人员的声音特征等相关性能;指出一类鉴于的歌曲特色模型创建、核算与搭配办法,能够确保客户导入1首歌曲,以后抽取此首曲的相关性能,从而在歌曲库内搜寻歌曲特色近似的曲目,在软件页面中为客户展现,另外,客户能够从歌曲库内以自动方式选定自身喜欢的曲目,符合特色化曲目的举荐与服务。
1.2.2 研究意义
情境感知举荐当前正在逐渐被更多探究成员的重视,并且获得某一程度的探究成绩,然而这个方面依旧是1个充斥着挑衅的新式探究领域,另外许多难题需要进行处理,对于这部分难题的改良同样是这篇文章探究的价值。情境感知举荐需要面对的难题首要展现在信息比较稀松与多维信息处置这2个部分。信息稀松特性其实是长时间扰乱举荐体系的一个较大的问题,情境数据的引进能够深层面加重了信息的稀松特性。在多维的评测矩阵内,一来,客户极难和多维情境实例进行关联,二来,即便客户和有关的情境实例具备一定的交集,然而同样未必可以较佳地在此情境下和特殊的音乐产生互动,许多情况下客户偏爱矩阵内极大部分元素均为0或是空值,极大程度上干扰了计算方法的举荐成效,怎样处理此类信息稀松特性问题早已是情境感知举荐方面的一个较大的探究焦点。对于多维信息处置难题,探究成员试着使用张量分解等相关技术,尽管在某一水平上可以得到优质的举荐成效,然而这部分办法通过舍弃较高的时间繁杂度作为成本,不能符合客户真实条件下的情境多元化特性的改变需要,当前对于多维信息处置依旧并无让人中意的处置方法。所以,这篇文章对于上述2点实施探究,关于处置情境感知举荐具备比较实用的价值。
第2章 情景感知相关理论
2.1 情景的定义和获取
关于情境的探究跨过了差别的学科边界,涵盖认知科学、核算科学、哲学等相关部分。情境感知这种技术源自普适核算的探究,最初经等在公元1994年指出,把情境归于方位、人、物体周边的标记还有这部分物体的改变[37]。从情境概念指出以来,学术方面对情境的界说并没有具备统一的认识。等[38]指出的获得普遍调用的情境界说为:情境是任意能够用于陈述实体形态的数据,实体能够是人物、地点,同样能够是程序和客户间交互有关的对象。
依据获得样式的差别,情境数据的获得首要涵盖显型获得、隐型获得、推导获得这3类。显型获得首要源自客户自主设置、客户咨询等。隐型获得通常鉴于本有的信息和周边环境数据以间接方式抽取有关的情境数据。推导获得要求依靠信息挖掘这种技术或是统计学的有关办法