资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
计算机应用技术专业毕业论文计算机应用技术专业毕业论文 精品论文精品论文 基于词网语言模型的基于词网语言模型的连续语音识别系统的研究与实现连续语音识别系统的研究与实现关键词:语音识别关键词:语音识别 静音检测静音检测 似然率计算似然率计算 词网语言词网语言 语言模型语言模型 检测算法检测算法 频谱频谱 特征特征摘要:随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主 要工具。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用, 正在渐渐地改变着人们的生活方式。 语音识别在各个领域得到了广泛的应用, 如语音电话拨号、语音指令、语音菜单、语音导航等。本文研究了语音识别中 的关键技术,设计开发了一套基于词网语言模型的连续语音识别系统-MYASR。 通过 MYASR 提供的功能模块可以容易地搭建一套基于词网语言模型的连续语音 识别应用系统。本文以它作为实验平台,对语音识别中的关键问题进行深入系 统的研究。 本文深入研究了静音检测算法。为了提高声音活动检测的鲁棒性, 提出了一种基于 GMM 模型的声音活动检测方法,此方法在频谱特征空间中建立 背景噪音和语音的 GMM 模型,然后采用模型匹配的方法对被测信号进行区分。 而且此方法自适应更新 GMM 模型的参数,使之可以适应环境的变化。实验结果 显示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 语 音识别中通常采用连续概率密度的 HMM 模型,状态用 GMM 模型表示。由于 GMM 模型的似然率计算占用了语音识别的大部分时间,实时性能难以保障。因此, 通常采用似然率的近似算法。实验表明,似然率近似算法可以使识别时间减少 10以上。本文通过对各种 GMM 似然率的近似算法进行深入的研究分析,在动 态高斯选择算法(DGS)的基础上引入误差控制参数,使得算法可以把误差限制在 一定的范围内,解决了传统似然率近似算法中误差不可知的问题,保障了语音 识别的准确率。同时,针对不同高斯分量个数的 GMM 模型,本文还给出了误差 控制参数的参考取值。通过在 TIMIT 语料库上的单音子连续语音识别实验,对 各种似然率近似算法的性能进行分析比较,结果显示改进后的算法(TDGS)具有 良好的性能。正文内容正文内容随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主要 工具。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用, 正在渐渐地改变着人们的生活方式。 语音识别在各个领域得到了广泛的应用, 如语音电话拨号、语音指令、语音菜单、语音导航等。本文研究了语音识别中 的关键技术,设计开发了一套基于词网语言模型的连续语音识别系统-MYASR。 通过 MYASR 提供的功能模块可以容易地搭建一套基于词网语言模型的连续语音 识别应用系统。本文以它作为实验平台,对语音识别中的关键问题进行深入系 统的研究。 本文深入研究了静音检测算法。为了提高声音活动检测的鲁棒性, 提出了一种基于 GMM 模型的声音活动检测方法,此方法在频谱特征空间中建立 背景噪音和语音的 GMM 模型,然后采用模型匹配的方法对被测信号进行区分。 而且此方法自适应更新 GMM 模型的参数,使之可以适应环境的变化。实验结果 显示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 语 音识别中通常采用连续概率密度的 HMM 模型,状态用 GMM 模型表示。由于 GMM 模型的似然率计算占用了语音识别的大部分时间,实时性能难以保障。因此, 通常采用似然率的近似算法。实验表明,似然率近似算法可以使识别时间减少 10以上。本文通过对各种 GMM 似然率的近似算法进行深入的研究分析,在动 态高斯选择算法(DGS)的基础上引入误差控制参数,使得算法可以把误差限制在 一定的范围内,解决了传统似然率近似算法中误差不可知的问题,保障了语音 识别的准确率。同时,针对不同高斯分量个数的 GMM 模型,本文还给出了误差 控制参数的参考取值。通过在 TIMIT 语料库上的单音子连续语音识别实验,对 各种似然率近似算法的性能进行分析比较,结果显示改进后的算法(TDGS)具有 良好的性能。 随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主要工具。 经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用,正在渐 渐地改变着人们的生活方式。 语音识别在各个领域得到了广泛的应用,如语 音电话拨号、语音指令、语音菜单、语音导航等。本文研究了语音识别中的关 键技术,设计开发了一套基于词网语言模型的连续语音识别系统-MYASR。通过 MYASR 提供的功能模块可以容易地搭建一套基于词网语言模型的连续语音识别 应用系统。本文以它作为实验平台,对语音识别中的关键问题进行深入系统的 研究。 本文深入研究了静音检测算法。为了提高声音活动检测的鲁棒性,提 出了一种基于 GMM 模型的声音活动检测方法,此方法在频谱特征空间中建立背 景噪音和语音的 GMM 模型,然后采用模型匹配的方法对被测信号进行区分。而 且此方法自适应更新 GMM 模型的参数,使之可以适应环境的变化。实验结果显 示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 语音 识别中通常采用连续概率密度的 HMM 模型,状态用 GMM 模型表示。由于 GMM 模 型的似然率计算占用了语音识别的大部分时间,实时性能难以保障。因此,通 常采用似然率的近似算法。实验表明,似然率近似算法可以使识别时间减少 10以上。本文通过对各种 GMM 似然率的近似算法进行深入的研究分析,在动 态高斯选择算法(DGS)的基础上引入误差控制参数,使得算法可以把误差限制在 一定的范围内,解决了传统似然率近似算法中误差不可知的问题,保障了语音 识别的准确率。同时,针对不同高斯分量个数的 GMM 模型,本文还给出了误差 控制参数的参考取值。通过在 TIMIT 语料库上的单音子连续语音识别实验,对各种似然率近似算法的性能进行分析比较,结果显示改进后的算法(TDGS)具有 良好的性能。 随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主要工具。 经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用,正在渐 渐地改变着人们的生活方式。 语音识别在各个领域得到了广泛的应用,如语 音电话拨号、语音指令、语音菜单、语音导航等。本文研究了语音识别中的关 键技术,设计开发了一套基于词网语言模型的连续语音识别系统-MYASR。通过 MYASR 提供的功能模块可以容易地搭建一套基于词网语言模型的连续语音识别 应用系统。本文以它作为实验平台,对语音识别中的关键问题进行深入系统的 研究。 本文深入研究了静音检测算法。为了提高声音活动检测的鲁棒性,提 出了一种基于 GMM 模型的声音活动检测方法,此方法在频谱特征空间中建立背 景噪音和语音的 GMM 模型,然后采用模型匹配的方法对被测信号进行区分。而 且此方法自适应更新 GMM 模型的参数,使之可以适应环境的变化。实验结果显 示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 语音 识别中通常采用连续概率密度的 HMM 模型,状态用 GMM 模型表示。由于 GMM 模 型的似然率计算占用了语音识别的大部分时间,实时性能难以保障。因此,通 常采用似然率的近似算法。实验表明,似然率近似算法可以使识别时间减少 10以上。本文通过对各种 GMM 似然率的近似算法进行深入的研究分析,在动 态高斯选择算法(DGS)的基础上引入误差控制参数,使得算法可以把误差限制在 一定的范围内,解决了传统似然率近似算法中误差不可知的问题,保障了语音 识别的准确率。同时,针对不同高斯分量个数的 GMM 模型,本文还给出了误差 控制参数的参考取值。通过在 TIMIT 语料库上的单音子连续语音识别实验,对 各种似然率近似算法的性能进行分析比较,结果显示改进后的算法(TDGS)具有 良好的性能。 随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主要工具。 经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用,正在渐 渐地改变着人们的生活方式。 语音识别在各个领域得到了广泛的应用,如语 音电话拨号、语音指令、语音菜单、语音导航等。本文研究了语音识别中的关 键技术,设计开发了一套基于词网语言模型的连续语音识别系统-MYASR。通过 MYASR 提供的功能模块可以容易地搭建一套基于词网语言模型的连续语音识别 应用系统。本文以它作为实验平台,对语音识别中的关键问题进行深入系统的 研究。 本文深入研究了静音检测算法。为了提高声音活动检测的鲁棒性,提 出了一种基于 GMM 模型的声音活动检测方法,此方法在频谱特征空间中建立背 景噪音和语音的 GMM 模型,然后采用模型匹配的方法对被测信号进行区分。而 且此方法自适应更新 GMM 模型的参数,使之可以适应环境的变化。实验结果显 示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 语音 识别中通常采用连续概率密度的 HMM 模型,状态用 GMM 模型表示。由于 GMM 模 型的似然率计算占用了语音识别的大部分时间,实时性能难以保障。因此,通 常采用似然率的近似算法。实验表明,似然率近似算法可以使识别时间减少 10以上。本文通过对各种 GMM 似然率的近似算法进行深入的研究分析,在动 态高斯选择算法(DGS)的基础上引入误差控制参数,使得算法可以把误差限制在 一定的范围内,解决了传统似然率近似算法中误差不可知的问题,保障了语音 识别的准确率。同时,针对不同高斯分量个数的 GMM 模型,本文还给出了误差 控制参数的参考取值。通过在 TIMIT 语料库上的单音子连续语音识别实验,对各种似然率近似算法的性能进行分析比较,结果显示改进后的算法(TDGS)具有 良好的性能。 随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主要工具。 经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用,正在渐 渐地改变着人们的生活方式。 语音识别在各个领域得到了广泛的应用,如语 音电话拨号、语音指令、语音菜单、语音导航等。本文研究了语音识别中的关 键技术,设计开发了一套基于词网语言模型的连续语音识别系统-MYASR。通过 MYASR 提供的功能模块可以容易地搭建一套基于词网语言模型的连续语音识别 应用系统。本文以它作为实验平台,对语音识别中的关键问题进行深入系统的 研究。 本文深入研究了静音检测算法。为了提高声音活动检测的鲁棒性,提 出了一种基于 GMM 模型的声音活动检测方法,此方法在频谱特征空间中建立背 景噪音和语音的 GMM 模型,然后采用模型匹配的方法对被测信号进行区分。而 且此方法自适应更新 GMM 模型的参数,使之可以适应环境的变化。实验结果显 示该方法在噪音环境中比传统的声音活动检测方法具有更高的准确率。 语音 识别中通常采用连续概率密度的 HMM 模型,状态用 GMM 模型表示。由于 GMM 模 型的似然率计算占用了语音识别的大部分时间,实时性能难以保障。因此,通 常采用似然率的近似算法。实验表明,似然率近似算法可以使识别时间减少 10以上。本文通过对各种 GMM 似然率的近似算法进行深入的研究分析,在动 态高斯选择算法(DGS)的基础上引入误差控制参数,使得算法可以把误差限制在 一定的范围内,解决了传统似然率近似算法中误差不可知的问题,保障了语音 识别的准确率。同时,针对不同高斯分量个数的 GMM 模型,本文还给出了误差 控制参数的参考取值。通过在 TIMIT 语料库上的单音子连续语音识别实验,对 各种似然率近似算法的性能进行分析比较,结果显示改进后的算法(TDGS)具有 良好的性能。 随着计算科学和信息技术的发展,语音识别日渐成为人与机器交互的主要工具。 经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用,正在渐 渐地改变着人们的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号