资源预览内容
第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
第9页 / 共23页
第10页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
郑州大学优秀毕业论文 数字化音频领域的未来数字化音频领域的未来 TheThe futurefuture ofof digitaldigital audioaudio fieldfield 学学 号:号: 学生姓名:学生姓名: 专专 业:业: 电子信息工程 指导教师:指导教师: 提交时间:提交时间: 2012.4.1 2 摘摘 要要 随着数字信号处理技术的日益推进,IT 领域的科技成果越来越普遍的应用于视音频 领域并大大的推动了视音频科技的进步,传统的模拟视音频产品如今逐渐退出,采用 数字化技术及其相应产品已呈不可抵挡的趋势。数字化的视音频产品必将涉及将类比 信号转换成数字信号后加以传输的问题。而在这种转换的过程中需要做大量的数学运 算,因此必须选择运算快速的微处理器才能完成实时(real-time)的数位信号处理。 而市面上的微处理有成百上千种,各有其特色及对应的应用场合,DSP 以其特有的 优势更加适合于完成上述任务。 关键词:关键词: 数字化音频 DSP 多媒体 ABSTRACT Along with the daily advancement of digital signal processing technology, scientific and technological achievements in the field of IT is becoming more and more common used in audio field and greatly push the progress of the audio technology, traditional analog audio products now gradually exit, using digital technology and its corresponding products is a trend which can not resist. Digital audio products will involve the transmission problem of when analogy signal is converted into digital signals. And in this kind of conversion of process needed to do a lot of mathematical operation, so we must choose operation quick microprocessor to complete real-time digital signal processing. And the micro in market has hundreds of kinds, each have its characteristics and corresponding applications, DSP, with its special advantages is becoming more suitable to accomplish these tasks. Keywords: digital audio DSP multimedia 3 目 录 第一章 绪论4 1. 1 模拟音频数字化的过程.4 1. 2 数字化音频领域的未来.6 第二章 数字音频协议与芯片功能介绍10 2. 1 TDM 数字音频协议10 2. 2 在基于 AD1941 时分复用多通道数字音频处理模块设计11 2. 3 音频处理模块编写.13 第三章 多媒体中数字化音频技术的应用 14 3. 1 计算机音乐的应用现状14 第四章 数字化音频的未来-DSP.18 4. 1 DSP 的优势18 4. 2 DSP 技术的发展趋势22 第五章 结论23 致谢23 4 第一章 绪论 1. 1 音频数字化的概念 从字面上来说,数字化 (Digital) 就是以数字来表示,例如用数字去记录一张桌 子的长宽尺寸,各木料间的角度,这就是一种数字化。跟数位常常一起被提到的字是 模拟 (Analog/Analogue) ,模拟的意思就是用一种相似的东西去表达,例如将桌 子用传统相机将三视图拍下来,就是一种模拟的记录方式。 两个概念: 1、分贝(dB):声波振幅的度量单位,非绝对、非线性、对数式度量方式。以人耳所 能听到的最静的声音为 1dB,那么会造成人耳听觉损伤的最大声音为 100dB。人们正 常语音交谈大约为 20dB。10dB 意味着音量放大 10 倍,而 20dB 却不是 20 倍, 而是 100 倍(10 的 2 次方) 。 2、频率(Hz):人们能感知的声音音高。男性语音为 180Hz,女性歌声为 600Hz, 钢琴上 C 调至 A 调间为 440Hz,电视机发出人所能听到的声音是 17kHz,人耳能够 感知的最高声音频率为 20kHz。 将音频数字化,其实就是将声音数字化。最常见的方式是透过脉冲编码调制 PCM(Pulse Code Modulation) 。运作原理如下。首先我们考虑声音经过麦克风, 转换成一连串电压变化的信号,如图一所示。这张图的横座标为秒,纵座标为电压大 小。要将这样的信号转为 PCM 格式的方法,是先以等时距分割。我们假设用每 0.01 秒分割,则得到图二。 图一 图二 5 我们把分割线与信号图形交叉处的座标位置记录下来,可以得到如下资料, (0.01,11.65),(0.02,14.00),(0.03,16.00)、 (0.04,17.74) (0.18,15.94) 、 (0.19,17.7) , (0.20,20) 。 由于我们已经知道时间间隔是固定的 0.01 秒,因此我们只要把纵座标记录下 来就可以了,得到的结果就是 11.65 14.00 16.00 17.74 19.00 19.89 20.34 20.07 19.44 18.59 17.47 16.31 15.23 14.43 13.89 13.71 14.49 15.94 17.70 20.00 这一数列。这一串数字就是将以上信号数字化的结果。 在以上的范例中,我们的采样频率是 100Hz(1/0.01 秒 ) 。其实电脑中的 .WAV 档的内容就是类似这个样子,文件头中记录了采样频率和可容许最大记录振幅,后面 就是一连串表示振幅大小的数字,有正有负。 常见 CD 唱盘是以 PCM 格式记录,而它的采样频率 (Sample Rate) 是 44100Hz ,振幅采样精度/数位是 16Bits ,也就是说振幅最小可达 -32768,最 大可达 +32767。CD 唱盘是以螺旋状由内到外储存资料,可以存储 74 分钟的音乐。 CD 唱盘的规格为什么是 44.1kHz、16Bits 呢? 关于 44.1kHz 这个数字的选取分为两个层面。首先人耳的聆听范围是 20Hz 到 20kHz ,根据 Nyquist Functions ,理论上只要用 40kHz 以上的采样频率就 可以完整记录 20kHz 以下的信号。那么为什么要用 44.1kHz 这个数字呢?那是 因为在 CD 发明前硬盘还很贵,所以主要将数字音频信号储存媒体是录像带,用黑 白来记录 0 与 1 。而当时的录像带格式为每秒 30 张,而一张图又可以分为 490 条线,每一条线又可以储存三个取样信号,因此每秒有 30*490*3=44100 个取样 点,而为了研发的方便, CD 唱盘也继承了这个规格,这就是 44.1kHz 的由来。 在这里我们可以发现无论使用多么高的采样精度/数位,记录的数字跟实际的信号大 小总是有误差,因此数字化无法完全记录原始信号。我们称这个数字化造成失真称为 量化失真。 数字化的最大好处是资料传输与保存的不易失真。记录的资料只要数字大小不改 变,记录的资料内容就不会改变。如果我们用传统类比的方式记录以上信号,例如使 用录音带表面的磁场强度来表达振幅大小,我们在复制资料时,无论电路设计多么严 谨,总是无法避免杂讯的介入。这些杂讯会变成复制后资料的一部份,造成失真,且 复制越多次信噪比 ( 信号大小与噪音大小的比值 ) 会越来越低,资料的细节也越来 越少。如果多次复制过录音带,对以上的经验应该不陌生。在数字化的世界里,这串 数字转换为二进制,以电压的高低来判读1与0,还可以加上各种检查码,使得出错 机率很低,因此在一般的情况下无论复制多少次,资料的内容都是相同,达到不失真 的目的。 那么,数字化的资料如何转换成原来的音频信号呢?在计算机的声卡中一块芯片叫做 DAC(Digital to Analog Converter) ,中文称数模转换器。DAC 的功能如其名是 把数字信号转换回模拟信号。我们可以把 DAC 想像成 16 个小电阻,各个电阻值是 以二的倍数增大。当 DAC 接受到来自计算机中的二进制 PCM 信号,遇到 0 时相 对应的电阻就开启,遇到 1 相对应的电阻不作用,如此每一批 16Bits 数字信号都 可以转换回相对应的电压大小。我们可以想像这个电压大小看起来似乎会像阶梯一样 6 一格一格,跟原来平滑的信号有些差异,因此再输出前还要通过一个低通滤波器,将 高次谐波滤除,这样声音就会变得比较平滑了。 从前面的内容可以看出,音频数字化就是将模拟的(连续的)声音波形数字化(离 散化),以便利用数字计算机进行处理的过程,主要包参数括采样频率(Sample Rate)和采样数位/采样精度(Quantizing,也称量化级)两个方面,这二者决定了 数字化音频的质量。采样频率是对声音波形每秒钟进采样的次数。 根据这种采样方法,采样频率是能够再现声音频率的一倍。人耳听觉的频率上 限在2OkHz 左右,为了保证声音不失真,采样频率应在4OkHz 左右。经常使用的采 样频率有11.025kHz、22.05kHz 和44.lkHz 等。采样频率越高,声音失真越小、 音频数据量越大。采样数位是每个采样点的振幅动态响应数据范围,经常采用的有8 位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0-255)不同量 化值,而16位量化级则可表示65536个不同量化值。采样量化位数越高音质越好, 数据量也越大。 反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时,如果每次 生成一个声波数据,称为单声道;每次生成二个声波数据,称为立体声(双声道),立 体声更能反映人的听觉感受。 除了上述因素外,数字化音频的质量还受其它一些因素(如扬声器质量,麦克风 优劣,计算机声卡 A/D 与 D/A(模/数、数/模)转换芯片品质,各个设备连接线屏 蔽效果好坏等)的影响。 综上所述,声音数字化的采样频率和量化级越高,结果越接近原始声音,但记录 数字声音所需存储空间也随之增加。可以用下面的公式估算声音数字化后每秒所需的 存储量(假定不经压缩): 存储量=(采样频率*采样数位)/8(字节数) 若采用双声道录音,存储量再增加一倍。例如,数字激光唱盘(CDDA,红皮 书标准)的标准采样频率为44.lkHz,采样数位为16位,立体声,可以几乎无失真地 播出频率高达22kHz 的声音,这也是人类所能听到的最高频率声音。激光唱盘一分 钟音乐需要的存储量为: 44.1*1000*l6*2*60/8=10,584,000(字节)=10.584MBytes 这个数值就是微软 Windows 系统中 WAVE(.WAV)声音文件在硬盘中所占磁盘 空间的存储量。由 MICROSOFT 公司开发的 WAV 声音文件格式,是如今计算机中 最为常见的声音文件类型之一,它符合 RIFF 文件规范,用于保存 WINDOWS 平台 的音频信息资源,被 WINDOWS 平台机器应用程序所广泛支持。另外,WAVE 格式 支持 MSADPCM、CCIPTALAW、CCIPT-LAW 和其他压缩算法,支持多种音频位 数,采样频率和声道,但其缺点是文件体积较大,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号