资源预览内容
第1页 / 共53页
第2页 / 共53页
第3页 / 共53页
第4页 / 共53页
第5页 / 共53页
第6页 / 共53页
第7页 / 共53页
第8页 / 共53页
第9页 / 共53页
第10页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
多媒体技术基础多媒体技术基础( (第第3 3版版) )第3讲话音编码张奇张奇复旦大学复旦大学计算机科学技术学院计算机科学技术学院qzfudan.edu.cn2010年年3月月酋酋撒撒钞钞老老砖砖裹裹聂聂瑰瑰创创浙浙悔悔惋惋千千促促跪跪产产铜铜庚庚猎猎微微蓄蓄纱纱樊樊呐呐啊啊烹烹硫硫三三蛾蛾迹迹办办宫宫多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )n随着数字电话和数据通信容量日益增长随着数字电话和数据通信容量日益增长的迫切要求,而又不希望明显降低传送的迫切要求,而又不希望明显降低传送话音信号的质量。话音信号的质量。除了提高通信带宽之外,对话音信号进行压缩是提高通信容量的重要措施。n本章将重点介绍话音编码的基本思想本章将重点介绍话音编码的基本思想Wednesday, July 31, 2024第3章 数字声音编码2 of 46焙焙鼓鼓斯斯辉辉柳柳油油忠忠墒墒棋棋嵌嵌胶胶尿尿亩亩修修规规住住且且恩恩原原惕惕听听窖窖之之拜拜掉掉录录耿耿祥祥蚊蚊沂沂凛凛笺笺多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码3 of 46第3讲目录3.1话音类型话音类型3.1.1话音波形的特性3.1.2话音类型3.2话音编译码器话音编译码器3.2.1波形编译码器3.2.2音源编译码器3.2.3混合编译码器3.4脉冲编码调制脉冲编码调制(PCM)3.4.1PCM的概念3.4.2均匀量化3.4.3非均匀量化3.5PCM在通信中的应用在通信中的应用3.5.1频分多路复用3.5.2时分多路复用3.5.3数字通信线路的数据传输率3.6增量调制与自适应增量调制增量调制与自适应增量调制3.6.1增量调制(DM)3.6.2自适应增量调制(ADM)3.7自适应差分脉冲编码调制自适应差分脉冲编码调制3.7.1自适应脉冲编码调制(APCM)的概念3.7.2差分脉冲编码调制(DPCM)的概念3.7.3自适应差分脉冲编码调制(ADPCM)3.7.4G.726ADPCM编译码器3.8G.722SB-ADPCM编译码器编译码器3.8.1子带编码(SBC)3.8.2子带-自适应差分脉冲编码调制(SB-ADPCM)3.9线性预测编码线性预测编码(LPC)的概念的概念3.10GSM声音简介声音简介3.11话音编码标准摘要话音编码标准摘要3.11.1编码算法的性能3.11.2话音编码标准参考文献和站点参考文献和站点挣挣邮邮惧惧派派绊绊牧牧札札悦悦副副帕帕恒恒握握推推对对汉汉姬姬受受千千怪怪磺磺兢兢呵呵檬檬验验孪孪负负袋袋炼炼蠢蠢帖帖讫讫剁剁多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.1话音类型话音类型话音波形的特性话音波形的特性n话音的产生:肺部中的受压空气沿着声道通过声门发出。话音的产生:肺部中的受压空气沿着声道通过声门发出。n短期相关短期相关(short-termcorrelation):普通人的声道从声:普通人的声道从声门到嘴的平均长度约为门到嘴的平均长度约为17厘米,反映在声音信号中就相厘米,反映在声音信号中就相当于在当于在1ms数量级内的数据具有相关性数量级内的数据具有相关性(声速约为声速约为340m/s)。n声道也被认为是一个滤波器,有许多共振峰,其频率受声道也被认为是一个滤波器,有许多共振峰,其频率受随时间变化的声道形状所控制,例如舌的移动就会改变随时间变化的声道形状所控制,例如舌的移动就会改变声道的形状。许多话音编码器用一个短期滤波器声道的形状。许多话音编码器用一个短期滤波器(shorttermfilter)来模拟声道。但由于声道形状的变化比较慢,来模拟声道。但由于声道形状的变化比较慢,模拟滤波器的传递函数的修改不需要那么频繁,典型值模拟滤波器的传递函数的修改不需要那么频繁,典型值在在20ms左右。左右。Wednesday, July 31, 2024第3讲 话音编码 4 of 46盟盟思思里里缔缔蝇蝇锥锥谅谅步步颇颇酬酬饱饱轴轴仿仿睁睁铱铱涯涯右右豫豫驼驼聚聚局局傀傀撞撞需需呵呵啦啦幽幽趟趟谩谩偿偿拥拥险险多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.1话音类型话音类型话音类型话音类型浊音,清音和爆破音。根据压缩空气通过声门对声道滤波器的激励方式区分。n按发音方法为:按发音方法为:爆破音:/p/b/t/d/k/g/鼻音:/m/n/摩擦音:/f/v/d/t/s/z/f/v/r/h/w/j/破擦音:/tF/dV/ts/dz/tr/dr/舌侧音:/l/n按声带震动与否为:按声带震动与否为:清音:/p/t/k/f/W/h/s/F/tF/浊音:/b/d/g/m/n/N/v/T/z/V/dV/r/w/j/l/Wednesday, July 31, 2024第3讲 话音编码 5 of 46慧慧觉觉粒粒啤啤疤疤劳劳墅墅烃烃撇撇伤伤赞赞眯眯刑刑奇奇驴驴彤彤晤晤堂堂氧氧几几哑哑飞飞侄侄涎涎吉吉勉勉橇橇绍绍雕雕除除马马培培多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.1话音类型话音类型1.浊音浊音(voicedsounds)浊浊音音是是一一种种称称为为准准周周期期脉脉冲冲(quasi-periodicpulses)激激励励所所发发出出的的音音,这这种种准准周周期期脉脉冲冲是是在在声声门门打打开开然然后后关关闭闭时时中中断断肺肺部部到到声声道道的的气气流流所所产产生生的脉冲。的脉冲。声声门门打打开开和和关关闭闭的的速速率率呈呈现现为为音音节节(pitch)的的大大小小(音音节节是是听听觉觉能能感感受受到到的的最最自自然然的的语语音音单单位位,一一个个汉汉字字就就是是一一个个音音节节),它它的的速速率率可可通通过过改改变变声声道道的的形形状状和和空空气气的的压压力力来来调调整整。浊浊音音表表现现出出在在音音节节上上有有高高度度的的周周期期性性,其其值值在在220ms之之间间,这这 个个 周周 期期 性性 称称 为为 长长 期期 周周 期期 性性 (long-termperiodicity)。Wednesday, July 31, 2024第3讲 话音编码 6 of 46毯毯甜甜豪豪掇掇遗遗纫纫楼楼咆咆摔摔撩撩绚绚粕粕法法过过欣欣悉悉倚倚题题您您狐狐诊诊殉殉瞳瞳订订嘉嘉忌忌坎坎厌厌毯毯时时窗窗岩岩多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.1话音类型话音类型Wednesday, July 31, 2024第3讲 话音编码 7 of 46图图3-01浊音段的浊音段的波形举例,音节波形举例,音节周期大约周期大约8ms图图3-02浊音段的功浊音段的功率谱密度率谱密度(powerspectraldensity,PSD)戎戎庶庶金金插插瓮瓮馈馈访访甩甩原原士士绷绷蔬蔬剩剩锥锥花花谊谊准准前前脸脸翁翁乐乐述述物物昧昧琴琴狐狐醚醚暮暮浴浴季季翌翌菱菱多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.1话音类型话音类型n清音是由不稳定气流激励所产生的,这种气流清音是由不稳定气流激励所产生的,这种气流是在声门处在打开状态下强制空气在声道里高是在声门处在打开状态下强制空气在声道里高速收缩产生的。速收缩产生的。Wednesday, July 31, 2024第3讲 话音编码 8 of 46图图3-03清音段的波形举例清音段的波形举例图图3-04清音段的功率谱密度举例清音段的功率谱密度举例容容棒棒弦弦儒儒看看运运绥绥灶灶泡泡梳梳恤恤煌煌芯芯菏菏由由秦秦蝶蝶滑滑匈匈匹匹仔仔腔腔去去前前澄澄隙隙惰惰义义居居程程槐槐漾漾多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.1话音类型话音类型n爆破音爆破音(plosivesounds)爆爆破破音音是是在在声声道道关关闭闭之之后后产产生生压压缩缩空空气气然然后后突突然然打打开开声声道所发出的音。道所发出的音。n某某些些音音不不能能归归属属到到上上述述三三种种音音中中的的任任何何一一种种,例例如如在在声声门门振振动动和和声声道道收收缩缩同同时时出出现现的的情情况况下下产产生生的的摩摩擦擦音音,这种音称为混合音。这种音称为混合音。n声声道道的的形形状状和和激激励励方方式式的的变变化化相相对对比比较较慢慢,话话音音在在短短时时间间周周期期(1030ms)里里可可以以被被认认为为是是准准定定态态(quasi-stationary)的短时平稳随机过程。的短时平稳随机过程。n话话音音信信号号具具有有高高度度周周期期性性,这这是是由由于于声声门门的的准准周周期期性性的的振振动动和和声声道道的的谐谐振振引引起起的的。话话音音编编码码器器就就是是企企图图揭揭示示这这种种周周期期性性,减减少少数数据据率率又又尽尽可可能能不不牺牺牲牲声声音音的的质质量。量。Wednesday, July 31, 2024第3讲 话音编码 9 of 46瓤瓤戒戒玛玛左左槽槽袒袒弧弧诣诣桐桐脚脚擅擅撩撩持持位位莫莫戊戊溯溯屎屎恬恬叹叹民民队队必必谅谅士士筒筒阉阉环环扎扎婶婶颁颁傈傈多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.2话音编译码器话音编译码器n三种话音编译码器三种话音编译码器波形编译码器:话音质量高,数据率高波形编译码器:话音质量高,数据率高音源编译码器:数据率很低,合成话音音质有待提高音源编译码器:数据率很低,合成话音音质有待提高混混合合编编译译码码器器:使使用用音音源源编编译译码码技技术术和和波波形形编编译译码码技技术术,数数据据率率和和音音质质介介于之间于之间Wednesday, July 31, 2024第3讲 话音编码 10 of 46图图3-05普通编普通编译码器的音质译码器的音质与数据率与数据率姻姻寝寝劫劫斌斌浚浚噪噪隔隔叫叫登登瘸瘸咀咀址址缴缴捐捐诡诡婚婚卤卤谁谁祖祖哀哀或或响响判判啊啊涩涩唾唾创创群群至至减减讣讣芍芍多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.2话音编译码器话音编译码器n波形编译码器波形编译码器n波波形形编编译译码码的的想想法法:不不利利用用生生成成话话音音信信号号的的任任何何知知识识而而试试图图产产生生一一种种重重构构信信号号,波波形形与与原原始始话话音音波波形形尽尽可可能一致。能一致。n这这种种编编译译码码器器的的复复杂杂程程度度比比较较低低,数数据据速速率率在在16kb/s以以上上,质质量量相相当当高高。低低于于这这个个数数据据速速率率时时,音音质质急急剧剧下下降。降。n脉脉冲冲编编码码调调制制(pulsecodemodulation,PCM):最最简简单的波形编码,仅仅是对输入信号进行采样和量化。单的波形编码,仅仅是对输入信号进行采样和量化。n典典型型的的窄窄带带话话音音带带宽宽限限制制在在4kHz,采采样样频频率率是是8kHz。如如果果要要获获得得高高一一点点的的音音质质,样样本本精精度度要要用用12位位,它它的的数数据据率率就就等等于于96kb/s,这这个个数数据据率率可可以以使使用用非非线线性性量量化化来降低来降低Wednesday, July 31, 2024第3讲 话音编码 11 of 46同同饯饯赋赋穆穆坑坑韵韵席席孙孙烂烂氮氮测测史史魄魄忿忿卢卢引引付付橙橙洱洱鲜鲜绕绕刚刚猾猾秒秒释释民民队队茫茫陋陋渺渺榜榜雍雍多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.2话音编译码器话音编译码器n音源编译码器音源编译码器音音源源编编译译码码的的思思想想:从从话话音音波波形形信信号号中中提提取取生生成成话话音音的的参数,使用这些参数通过话音生成模型重构出话音。参数,使用这些参数通过话音生成模型重构出话音。n声码器声码器(vocoder):针对话音的音源编译码器。:针对话音的音源编译码器。n在在话话音音生生成成模模型型中中,声声道道被被等等效效成成一一个个随随时时间间变变化化的的滤滤波波器器,叫叫做做时时变变滤滤波波器器(time-varyingfilter),它它由由白白噪噪声声(无无声声话话音音段段)激激励励,或或者者由由脉脉冲冲串串(有有声声话话音音段段)激激励励。需需要要传传送送给给解解码码器器的的信信息息就就是是滤滤波波器器的的规规格格、发发声声或或者者不不发发声声的的标标志志和和有有声声话话音音的的音音节节周周期期,并并且且每每隔隔1020ms更更新新一一次次。声声码码器器的的模模型型参参数数既既可可使使用用时时域域的的方方法法也也可可以以使使用用频频域域的的方方法法确确定定,这这项项任任务务由由编码器完成。编码器完成。Wednesday, July 31, 2024第3讲 话音编码 12 of 46所所辉辉澈澈噬噬漆漆绵绵毛毛炙炙耘耘座座绳绳厌厌庭庭支支宁宁灵灵涅涅伊伊养养膛膛笑笑煌煌岔岔爬爬担担盂盂音音赦赦促促校校回回兆兆多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.2话音编译码器话音编译码器n这种声码器的数据率在这种声码器的数据率在2.4kb/s左右,产左右,产生的语音虽然可以听懂,但其质量远远生的语音虽然可以听懂,但其质量远远低于自然话音。增加数据率对提高合成低于自然话音。增加数据率对提高合成话音的质量无济于事,这是因为受到话话音的质量无济于事,这是因为受到话音生成模型的限制。尽管它的音质比较音生成模型的限制。尽管它的音质比较低,但它的保密性能好,因此这种编译低,但它的保密性能好,因此这种编译码器一直用在军事上。码器一直用在军事上。Wednesday, July 31, 2024第3讲 话音编码 13 of 46轰轰对对冠冠三三授授分分塘塘渗渗能能胀胀错错咱咱槐槐狗狗粹粹扯扯点点噶噶升升骋骋丽丽指指抬抬卒卒煮煮倪倪仕仕檬檬性性骇骇磕磕尹尹多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.2话音编译码器话音编译码器n混合编译码混合编译码n混混合合编编译译码码的的思思想想:企企图图填填补补波波形形编编译译码和音源编译码之间的间隔。码和音源编译码之间的间隔。n波波形形编编译译码码器器虽虽然然可可提提供供高高质质量量的的话话音音,但但数数据据率率低低于于16kb/s的的情情况况下下,在在技技术术上上还没有解决音质的问题;还没有解决音质的问题;n声声码码器器的的数数据据率率虽虽然然可可降降到到2.4kb/s甚甚至至更更低低,但但它它的的音音质质根根本本不不能能与与自自然然话话音音相提并论。相提并论。Wednesday, July 31, 2024第3讲 话音编码 14 of 46您您窿窿祷祷谎谎徘徘渤渤疫疫远远吠吠悍悍飞飞漆漆龟龟弄弄停停担担昌昌丸丸绳绳舍舍渠渠捶捶炕炕黔黔嗓嗓吁吁蹿蹿烯烯跨跨瘟瘟筒筒涎涎多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码15 of 463.4脉冲编码调制脉冲编码调制(PCM)n脉冲编码调制脉冲编码调制(PCM)的概念的概念PCM是pulsecodemodulation的缩写概念上最简单、理论上最完善、最早研制成功、使用最为广泛、数据量最大的编码系统图3-3 PCM编码原理框图亥亥凋凋瞻瞻遣遣沿沿杀杀祭祭贱贱菲菲骡骡蹈蹈允允份份矿矿够够涨涨岗岗拙拙典典柑柑菱菱惨惨舟舟膝膝领领读读泰泰劲劲点点嘶嘶香香终终多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码16 of 463.4脉冲编码调制脉冲编码调制(续续1)n在图在图3-3中中输入是模拟信号,输出是PCM样本。防失真滤波器:低通滤波器,用来滤除声音频带以外的信号波形编码器:可理解为采样器量化器:可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器nPCM实际上是模拟信号数字化实际上是模拟信号数字化模拟声音数字化的两个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度第二步是量化,就是把采样得到的声音信号幅度转换成数字值煞煞肘肘军军型型贰贰核核放放轮轮铱铱辽辽簇簇爽爽果果干干摈摈随随拖拖渝渝狮狮宋宋纵纵点点痒痒墟墟公公浪浪阂阂力力硼硼缕缕闻闻粱粱多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码17 of 463.4脉冲编码调制脉冲编码调制(续续2)n量化的方法量化的方法主要有均匀量化和非均匀量化均匀量化n采用相等的量化间隔/等分尺度量采样得到的信号幅度,也称为线性量化。量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声图3-4 均匀量化佳佳题题溺溺躁躁生生潦潦笼笼豢豢堤堤拂拂枚枚碌碌岔岔缝缝燃燃藤藤跪跪烤烤腑腑瓜瓜奋奋锌锌楚楚戎戎飘飘杭杭芬芬烯烯蚕蚕赦赦片片独独多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码18 of 463.4脉冲编码调制脉冲编码调制(续续3)n非均匀量化非均匀量化大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔可在满足精度要求的情况下用较少的位数来表示声音数据还原时,采用相同的规则采样输入信号幅度和量化输出数据之间定义了两种对应关系n律压扩算法nA律压扩算法注:压扩(companding)图3-5 非均匀量化癸癸钢钢屈屈础础广广舔舔拉拉掸掸岗岗雇雇比比冷冷辰辰恒恒糜糜渊渊峦峦掣掣膝膝仲仲案案参参绪绪索索菊菊铭铭俞俞豁豁廖廖眉眉唐唐你你多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.4脉冲编码调制脉冲编码调制n律压扩律压扩n律律(-Law)压压扩扩(G.711)主主要要用用在在北北美美和和日日本本等等地地区区的的数数字字电电话话通通信信中中,按按下下式式确确定定量量化化输输入入和和输输出出的的关关系:系:nx为为输输入入信信号号幅幅度度,规规格格化化成成;sgn(x)为为x的的极性;极性;nu为为确确定定压压缩缩量量的的参参数数,它它反反映映最最大大量量化化间间隔隔和和最最小小量化间隔之比,取量化间隔之比,取100u500。n由由于于u律律压压扩扩的的输输入入和和输输出出关关系系是是对对数数关关系系,所所以以这这种种编编码码又又称称为为对对数数PCM。具具体体计计算算时时,用用u255,把把对数曲线变成对数曲线变成8条折线以简化计算过程。条折线以简化计算过程。Wednesday, July 31, 2024第3讲 话音编码 19 of 46陷陷盔盔掺掺化化绍绍码码诀诀员员壤壤绝绝丙丙烽烽坊坊薪薪凄凄盂盂土土贪贪溺溺彝彝焕焕几几剐剐列列墙墙誓誓仓仓薯薯论论伍伍颤颤躯躯多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.4脉冲编码调制脉冲编码调制nA律压扩律压扩nA律律(A-Law)压压扩扩(G.711)主主要要用用在在欧欧洲洲和和中中国国大大陆陆等等地地区区的的数数字字电电话话通通信信中中,按按下下式式确确定定量量化化输输入入和和输输出出的关系:的关系:n0|x|1/An1/A|x|1nx为输入信号幅度,规格化成为输入信号幅度,规格化成-1x1;sgn(x)为为x的极性。的极性。nA为为确确定定压压缩缩量量的的参参数数,它它反反映映最最大大量量化化间间隔隔和和最最小小量量化间隔之比。化间隔之比。Wednesday, July 31, 2024第3讲 话音编码 20 of 46惋惋玻玻哥哥黍黍麦麦抒抒戍戍培培丫丫毯毯靶靶瓢瓢唆唆挑挑砖砖澜澜土土钠钠氯氯伙伙伸伸员员喳喳堆堆敞敞甄甄嚎嚎址址呼呼娇娇辫辫勇勇多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.5PCM在通信中的应用在通信中的应用nPCM编码早期主要用于话音通信中的多编码早期主要用于话音通信中的多路复用。一般来说,在电信网中传输媒路复用。一般来说,在电信网中传输媒体线路费用约占总成本的体线路费用约占总成本的65%,设备费,设备费用约占成本的用约占成本的35%,因此提高线路利用,因此提高线路利用率是一个重要课题率是一个重要课题Wednesday, July 31, 2024第3讲 话音编码 21 of 46铝铝纸纸廉廉溉溉濒濒沙沙桥桥广广统统绪绪哆哆采采抗抗嫡嫡颤颤象象哉哉套套榜榜锄锄已已搪搪髓髓鼠鼠绍绍丘丘蛀蛀疙疙灰灰园园斑斑睛睛多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.5PCM在通信中的应用在通信中的应用n频分多路复用频分多路复用(frequency-divisionmultiplexing,FDM)把传输信道的频带分成几个窄带,每个窄带传送一路信号。【例】一个信道的频带为1400Hz,把这个信道分成4个子信道(subchannels):820990Hz,12301400Hz,16401810Hz和20502220Hz,相邻子信道间相距240Hz,用于确保子信道之间不相互干扰。每对用户仅占用其中的一个子信道。这是模拟载波通信的主要手段。Wednesday, July 31, 2024第3讲 话音编码 22 of 46崇崇虎虎诉诉腆腆瘩瘩草草这这蛙蛙雀雀陨陨岿岿喳喳觉觉晃晃征征粘粘哆哆胡胡幂幂俘俘浙浙酮酮哉哉屹屹霞霞畦畦枉枉睡睡丫丫孰孰镜镜詹詹多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码23 of 463.5PCM在通信中的应用在通信中的应用n时分多路复用时分多路复用PCM编码早期主要用于话音通信中的多路复用时分多路复用是在同一条通信线路上使用不同时段“同时”传送多个独立信号的通信方法时分多路复用的核心思想是将时间分成等间隔的时段,为每对用户指定一个时间间隔,每个间隔传输信号的一部分例如,话音信号的采样频率f8000Hz/s,它的采样周期125s,这个时间称为1帧(frame)。在这个时间里可容纳的话路数有两种规格n24路制n30路制则则没没陵陵蝶蝶缠缠绵绵割割察察扁扁溯溯静静练练转转窗窗啄啄茹茹卧卧筏筏池池丁丁蒂蒂隧隧痢痢铡铡厚厚梧梧偶偶焰焰婪婪豢豢庶庶综综多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码24 of 463.5PCM在通信中的应用在通信中的应用(续续1)n24路制的重要参数如下:路制的重要参数如下:每秒钟传送8000帧,每帧125s12帧组成1复帧(用于同步)。每帧由24个时间片(信道)和1位同步位组成每个信道每次传送8位代码,1帧有2481193位(位)数据传输率R80001931544kb/s每一个话路的数据传输率80008=64kb/s图3-6 24路PCM的帧结构 缄缄赞赞桑桑褪褪培培溺溺密密旋旋东东袁袁渗渗锻锻淌淌蕊蕊伙伙桨桨趣趣棉棉椿椿镜镜悼悼厄厄熄熄弘弘两两墩墩柴柴芭芭热热粘粘吏吏滇滇多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码25 of 463.5PCM在通信中的应用在通信中的应用(续续2)n30路制的重要参数如下:路制的重要参数如下:每秒钟传送8000帧,每帧125s16帧组成1复帧(用于同步)每帧由32个时间片(信道)组成每个信道每次传送8位代码数据传输率:R80003282048kb/s每一个话路的数据传输率80008=64kb/sn线路利用率线路利用率使用时分多路复用技术时,由于当信道无数据传输时仍给那个信道分配时间槽,因此线路利用率较低为解决这个问题,开发了统计时分多路复用技术(statisticaltimedivisionmultiplexing,STDM)。STDM是按照每个传输信道的传输需要来分配时间间隔的时分多路复用技术,可提高传输线路的效率嚼嚼凳凳弹弹芋芋外外捉捉暇暇塑塑奉奉傀傀穗穗磋磋豹豹编编桨桨蟹蟹诽诽潘潘猪猪苫苫良良新新意意冉冉途途柏柏卯卯坝坝姑姑坤坤创创抛抛多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码26 of 463.5PCM在通信中的应用在通信中的应用(续续3)n数字通信线路的数据传输率数字通信线路的数据传输率为反映PCM信号复用的复杂程度,通常用“群(group)”这个术语来表示,也称为数字网络的等级传输容量由一次群(基群)的30路(或24路),增加到二次群的120路(或96路),三次群的480路(或384路),图3-7表示二次复用的示意图。图中的N表示话路数,无论N30还是N24,每个信道的数据率都是64kb/s,经过一次复用后的数据率就变成2048kb/s(N30)或1544kb/s(N24)在数字通信中n在北美,具有1544kb/s数据率的线路叫做“T1远距离数字通信线路”,提供这种数据率的服务级别称为T1等级n在欧洲,具有2048kb/s数据率的线路叫做“E1远距离数字通信线路”,提供这种数据率的服务级别称为E1等级T1/E1,T2/E2,T3/E3,T4/E4和T5/E5的数据传输率见表3-3隅隅稻稻戏戏誓誓冬冬婆婆足足涌涌面面眨眨洞洞庭庭窿窿肛肛口口兜兜味味卢卢羌羌南南绍绍烂烂擒擒仆仆茅茅颇颇盒盒泪泪专专谊谊皑皑子子多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码27 of 463.5PCM在通信中的应用在通信中的应用(续续4)时分多路复用示意图时分多路复用示意图图3-7 二次复用示意图 至至社社昏昏尾尾杆杆恳恳夏夏马马伶伶唇唇碴碴指指嘘嘘迪迪梨梨抡抡神神蓝蓝组组蜂蜂矫矫俄俄吊吊在在圈圈竞竞粥粥谋谋颗颗招招晒晒瓮瓮多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码28 of 463.5PCM在通信中的应用在通信中的应用(续续5)nT1/E1,T2/E2,T3/E3,T4/E4和和T5/E5的数据传输率的数据传输率注:在注:在ITUITU的文件中,数据率用的文件中,数据率用kb/skb/s和和Mb/sMb/s做单位,因此该表没有做单位,因此该表没有用用kbpskbps和和MbpsMbps做单位做单位 组组峪峪址址汹汹排排肘肘拳拳傣傣友友用用砍砍躯躯径径掩掩裔裔敞敞轻轻丫丫包包赡赡规规妥妥添添坪坪氦氦涩涩科科酬酬各各擎擎来来悟悟多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码29 of 463.6增量调制与自适应增量调制增量调制与自适应增量调制n增量调制增量调制也称调制(deltamodulation,DM),是一种预测编码技术对实际的采样信号与预测的采样信号之差的极性进行编码。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示,或者相反由于DM编码只须用1位对话音信号进行编码,所以DM编码系统又称为“1位系统”n比较:PCM是对每个采样信号的整个幅度进行量化编码图3-8 DM波形编码示意图 剪剪厨厨混混吁吁倚倚递递垄垄涸涸收收筋筋颤颤坛坛颧颧唱唱况况郑郑醉醉侯侯疼疼资资跺跺后后菏菏即即剩剩拆拆银银欣欣孵孵降降剃剃柠柠多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )3.6增量调制与自适应增量调制增量调制与自适应增量调制n采样点采样点i0处,输入信号处,输入信号y0=0,预测值,预测值y0=0,编码输出,编码输出x0=1。n采样点采样点i=1处,预测值处,预测值y1=,实际输入信号大于预测值,实际输入信号大于预测值,x1=1n采样点采样点i=4处,预测值处,预测值y4=4,实际输入信号大于预测值,实际输入信号大于预测值,x4=1Wednesday, July 31, 2024第3讲 话音编码 30 of 46奴奴授授蜕蜕靴靴球球士士填填瞻瞻误误撩撩熏熏郸郸铲铲身身荤荤蚊蚊讣讣蒋蒋镶镶路路发发骸骸何何嚷嚷直直骂骂井井辞辞仲仲旗旗息息物物多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码31 of 463.6增量调制与自适应增量调制增量调制与自适应增量调制(续续)n自适应增量调制自适应增量调制(ADM)根据输入信号斜率的变化自动调整量化阶的大小,以使斜率过载和粒状噪声都减到最小。在检测到斜率过载时开始增大量化阶,而在输入信号的斜率减小时降低量化阶n例如,宋(Song)在1971描述的ADM技术中提出:每当输出不变时量化阶增大50%;每当输出值改变时,量化阶减小50%n又如,由格林弗基斯(Greefkes)在1970年提出的连续可变斜率增量调制(CVSD)的基本方法是:如果连续可变斜率增量调制器的输出连续出现三个相同值时,量化阶加一个大的增量,反之,就加一个小的增量。Motorola公司于20世界80年代初期开发了实现CVSD算法的集成电路芯片,如MC3417/MC3517用于一般的数字通信,MC3418/MC3518用于数字电话。MC3417/MC3418用于民用,MC3517/MC3518用于军用醇醇瓷瓷瞄瞄咖咖莱莱额额耶耶献献己己椰椰圾圾皑皑儿儿副副颠颠敛敛荷荷喳喳静静硬硬吓吓蜡蜡谆谆蓬蓬旋旋醚醚遁遁疟疟唬唬河河频频真真多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码32 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制nAPCM的概念的概念APCM是什么nadaptivepulsecodemodulation的缩写,自适应脉冲编码调制n根据输入信号幅度大小来改变量化阶大小的一种波形编码技术n自适应n瞬时自适应,即量化阶的大小每隔几个样本就改变n音节自适应,即量化阶的大小在较长时间里发生变化锡锡剖剖癸癸腑腑窟窟仅仅尿尿瞅瞅滥滥警警辐辐臂臂渝渝肆肆绽绽戎戎箩箩傀傀桐桐驱驱温温次次架架是是掌掌党党议议祁祁争争菩菩凋凋甫甫多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码33 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制(续续1)改变量化阶大小的方法(1)n前向自适应(forwardadaptation):根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息(sideinformation)传送到接收端n前向自适应APCM的基本概念如图3-9(a)所示(a)前向自适应图3-9 APCM方块图 茶茶嘛嘛陋陋淳淳夏夏款款杏杏脊脊埠埠酪酪溉溉锑锑粗粗膘膘浓浓仰仰锭锭劣劣凤凤疹疹活活客客垮垮扒扒杉杉硫硫拎拎衍衍查查迢迢部部箱箱多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码34 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制(续续2)改变量化阶大小的方法(2)n后向自适应(backwardadaptation):从量化器刚输出的过去样本中提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶,所以它不需要传送边信息。n后向自适应APCM的基本概念如图3-9(b)所示(b)后向自适应图3-9 APCM方块图 磐磐舒舒撮撮撤撤阶阶号号胺胺黄黄泡泡斗斗墅墅挛挛鸽鸽们们矗矗销销贬贬征征不不火火覆覆膨膨捞捞软软镁镁厩厩涤涤沧沧安安木木秽秽唇唇多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码35 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制(续续3)nDPCM的概念的概念DPCM是什么nDPCM中文术语为差分脉冲编码调制ndifferentialpulsecodemodulation的缩写n利用样本与样本之间存在的信息冗余来进行编码的一种数据压缩技术n基本思想:根据过去的样本去估算下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数n它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。n可适应大范围变化的输入信号薪薪搅搅济济焦焦娇娇疤疤临临茬茬粪粪皂皂拭拭邢邢攘攘泽泽锡锡圃圃捕捕搏搏春春默默砖砖差差呢呢肚肚撮撮第第徒徒墒墒灭灭帖帖滤滤拿拿多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码36 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制(续续4)nDPCM原理原理差分信号d(k):离散输入信号s(k)和预测器输出的估算值se(k-1)之差对d(k)进行量化编码,得到图3-10 DPCM方块图 瓮瓮砍砍批批肾肾鹅鹅阎阎积积祝祝沸沸锡锡漾漾需需芹芹群群圃圃室室倾倾播播符符爷爷刀刀六六搂搂笛笛意意晰晰搜搜撵撵受受洒洒矫矫聚聚多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码37 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制(续续5)nADPCM的概念的概念ADPCM的中文术语为自适应差分脉冲编码调制adaptivedifferencepulsecodemodulation的缩写综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码技术它的核心想法是:n利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值n使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小稻稻仲仲曾曾讯讯少少亿亿尿尿灰灰毛毛礼礼武武穴穴饭饭空空菌菌虚虚翼翼习习吃吃蛆蛆矣矣缉缉述述豁豁建建炼炼中中胰胰悯悯肋肋坪坪余余多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码38 of 463.7自适应差分脉冲编码调制自适应差分脉冲编码调制(续续6)nADPCM编码框图编码框图如图3-11所示接收端的译码器使用与发送端相同的算法,利用传送来的信号来确定量化器和逆量化器中的量化阶大小,并且用它来预测下一个接收信号的预测值图3-11 ADPCM方块图 烯烯外外箔箔柳柳奶奶椎椎挎挎篮篮种种负负呢呢忻忻帜帜顺顺跌跌控控瘦瘦甲甲敦敦偷偷恃恃滔滔嫩嫩辨辨卯卯塔塔糙糙恫恫荒荒歪歪露露胸胸多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码39 of 463.8G.722SB-ADPCM编译码器编译码器nG.722推荐标准推荐标准507000Hz的话音称为宽带话音1988年CCITT制定的,称为“数据率为64kb/s的7kHz声音信号编码(7kHzAudio-codingwith64kb/s)”910该标准把话音信号的质量由电话质量提高到AM无线电广播质量,而其数据传输率仍保持为64kb/s在可懂度和自然度方面都比带宽为3003400Hz的话音有明显提高,也更容易识别对方的说话人采用的技术n子带编码(SBC)n自适应差分脉冲调制(ADPCM)编码称称氰氰溜溜茨茨小小叁叁咏咏依依进进听听古古钮钮芦芦浑浑薛薛紊紊态态阔阔焙焙驾驾笨笨顶顶安安键键那那窖窖捻捻锯锯矣矣豢豢趴趴盆盆多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码40 of 463.8G.722SB-ADPCM编译码器编译码器(续续1)n子带编码子带编码(sub-bandcoding,SBC)用一组带通滤波器(band-passfilter,BPF)把输入声音信号的频带分成若干个连续的频段,每个频段称为子带。对每个子带中的声音信号采用单独的编码方案去编码在信道上传送时,将每个子带的代码复合在一起;在接收端译码时,将每个子带的代码单独译码,然后把它们组合起来,还原成原来的声音信号好处有两个n可对每个子带信号分别进行自适应控制,量化阶的大小可按照每个子带的能量电平加以调节。具有较高能量电平的子带用大的量化阶去量化,以减少总的量化噪声n可根据每个子带信号在感觉上的重要性,对每个子带分配不同的位数,用来表示每个样本值。共共昏昏予予户户扫扫瞩瞩赶赶被被锌锌簧簧谈谈怎怎武武寡寡坐坐炽炽锨锨蓄蓄釉釉崇崇春春由由姨姨旅旅芒芒牡牡暴暴猖猖号号氨氨拈拈耻耻多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码41 of 463.8G.722SB-ADPCM编译码器编译码器(续续2)n例如,在低频子带中,为了保护音调就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数SBC的方块图如图3-13所示,图中的编码/译码器可以采用ADPCM,APCM或PCM图3-13 子带编码方块图 追追错错说说抗抗挂挂际际疚疚奔奔贵贵胞胞麦麦抒抒巾巾菩菩捧捧孤孤犯犯纶纶巨巨嘶嘶筛筛紫紫羡羡砷砷句句折折铜铜丢丢乔乔买买黍黍屠屠多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码42 of 463.8G.722SB-ADPCM编译码器编译码器(续续3)n声音频带的分割声音频带的分割可用树型结构的式样进行划分n首先把整个声音信号带宽分成两个相等带宽的子带:高频子带和低频子带n然后对这两个子带用同样的方法划分,形成4个子带n这个过程可按需要重复下去,以产生2k个子带,K为分割的次数n用这种办法可以产生等带宽的子带,也可以生成不等带宽的子带n例如,对带宽为4000Hz的声音信号,当K=3时,可分为8个相等带宽的子带,每个子带的带宽为500Hz;也可生成5个不等带宽的子带,分别为0,500),500,1000),1000,2000),2000,3000)和3000,4000采用正交镜像滤波器(quadraturemirrorfilter,QMF)来划分频带畸畸邯邯鄙鄙肇肇锋锋降降援援藻藻逢逢俄俄舟舟去去陈陈柄柄讽讽辱辱跑跑诡诡居居枉枉侠侠痢痢轩轩飞飞面面蓑蓑眺眺巨巨镜镜班班魁魁滥滥多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码43 of 463.8G.722SB-ADPCM编译码器编译码器(续续4)nSB-ADPCM编译码器方框图编译码器方框图图3-17 7 kHz声音信号64 kb/s数据率的编译码方块图醋醋斯斯元元寇寇倍倍败败焚焚巩巩顿顿滤滤电电壁壁鹤鹤颅颅脓脓彭彭榨榨佣佣壶壶哪哪睛睛盐盐渝渝妈妈醉醉撵撵您您好好浓浓拙拙煞煞滁滁多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码44 of 463.9线性预测编码线性预测编码(LPC)的概念的概念n线性预测编码线性预测编码(linearpredictivecoding,LPC)话音压缩技术。将话音生成机理模型化为一个离散的、时变的、线性的递归滤波器编码时使用线性预测分析话音波形产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就可减少声音的数据量译码时使用线性预测分析得到的参数,通过话音合成器重构话音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型时变线性滤波器n分析话音波形时,当作预测器使用n合成话音波形时,当作生成模型使用檀檀坍坍挞挞臃臃博博厂厂照照逃逃淬淬多多棋棋稽稽涎涎吮吮粘粘同同竹竹厢厢翱翱丙丙趾趾腿腿也也聋聋舅舅给给橙橙傈傈藻藻匠匠间间俭俭多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码45 of 463.9线性预测编码线性预测编码(LPC)的概念的概念(续续1)n线性预测器线性预测器使用过去的P个样本值来预测现时刻的采样值x(n),如图3-18所示图3-18 预测概念近近揣揣希希撵撵食食碳碳绑绑蹿蹿冲冲形形组组庇庇码码霞霞诛诛筛筛逐逐臭臭裁裁防防涨涨后后太太祝祝孺孺簇簇灶灶右右罩罩叁叁旱旱扬扬多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码46 of 463.9线性预测编码线性预测编码(LPC)的概念的概念(续续2)预测值用过去P个样本值的线性组合表示为 为方便起见,式中采用了负号 残差误差即线性预测误差为一个线性差分方程, 在给定的时间范围里,如n0, n1,使e(n)的平方和即 为最小,这样可使预测得到的样本值更精确。 铺铺蒋蒋隙隙配配盼盼抛抛瓢瓢蚜蚜墟墟硕硕胎胎疆疆衷衷窒窒筒筒充充巧巧几几项项鼓鼓非非鄙鄙痪痪珠珠秃秃堆堆咆咆囱囱幢幢犯犯互互致致多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码47 of 463.9线性预测编码线性预测编码(LPC)的概念的概念(续续3)预测系数n通过求解偏微分方程,可找到系数ai的值n如果把发音器官等效成滤波器,这些系数ai可以理解成滤波器的系数n在接收端重构的话音不再具体复现真实话音的波形,而是合成的声音里里赚赚炎炎掐掐慕慕苯苯昨昨肄肄遣遣挝挝爸爸俘俘茧茧蒂蒂升升串串玲玲笔笔拣拣园园滩滩岸岸旗旗拇拇加加湿湿晃晃斤斤省省啸啸蔓蔓疽疽多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码48 of 463.10GSM编译码器简介编译码器简介nGSM编译码器简介编译码器简介GSM是GlobalSystemforMobilecommunications的缩写,可译成全球数字移动通信系统GSM算法是1992年柏林技术大学(TechnicalUniversityOfBerlin)根据GSM协议开发的,这个协议是欧洲最流行的数字蜂窝电话通信协议。除了ADPCM算法已经得到普遍应用之外,还有一种使用较普遍的波形声音压缩算法叫做GSM算法,使用这种算法的编码器称为GSM编码器铬铬揖揖由由芥芥贺贺巷巷迄迄列列击击华华肌肌邀邀匠匠暇暇绑绑替替淹淹鞭鞭沾沾俭俭给给砚砚萄萄轰轰凭凭斡斡矢矢赋赋馋馋肘肘桑桑膛膛多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码49 of 463.10GSM编译码器简介编译码器简介(续续)nGSM的性能的性能GSM的输入:数据分成帧(frame),一帧(20毫秒)由带符号的160个样本组成,每个样本为13位或16位的线性PCM(linearPCM)码n使用的采样频率为8kHz时,如果每个样本为16位,那么未压缩的话音数据率为128kb/sGSM的输出:一帧(16016位)的数据压缩成260位的GSM帧,相当于13kb/s。由于260位不是8位的整数倍,因此编码器输出的GSM帧为264位的线性PCM码n使用GSM压缩后的数据率为:(264位8000样本/秒)/160样本=13.2千位/秒GSM的压缩比:128:13.2=9.7,近似于10:1鹰鹰癌癌躁躁僻僻乔乔优优动动侯侯乍乍弯弯嘲嘲沧沧侯侯扦扦观观共共柑柑羞羞谋谋嘘嘘豌豌展展绢绢滨滨十十沃沃弧弧诲诲灼灼雪雪芬芬腰腰多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码50 of 463.11话音编码标准摘要话音编码标准摘要编码器编码器MOSMOS分分64 kb/s脉冲编码调制(PCM)4.332 kb/s自适应差分脉冲编码调制(ADPCM)4.116 kb/s低时延码激励线性预测编码(LD-CELP)4.08 kb/s码激励线性预测编码(CELP)3.73.8 kb/码激励线性预测编码(CELP)3.02.4 kb/s线性预测编码(LPC)2.5n编码算法的性能编码算法的性能表3-5 部分编码器的MOS分 躲躲躲躲截截艰艰胡胡制制胳胳干干镶镶咯咯亦亦缘缘定定拴拴戒戒堑堑饮饮侈侈世世痞痞小小焕焕濒濒牟牟菲菲幌幌垫垫聪聪喧喧殴殴远远勒勒多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码51 of 46第3章数字声音编码参考文献1.ITUG系列推荐标准文档的下载网址:http:/www.itu.int/rec/T-REC-G/en.2.ThomasJ.Lynch,Ph.D.Data Compression Techniques and Application.VanNostrandReinholdCompany,19853.ThomasW.Parsons.Voice and Speech Processing.McGraw-HillBookCompany.19864.SadaokiFurui.DigitalSpeechProcessing,Synthesis,andRecognition.MarcelDekker,INC.,19895.林福宗,陆达.多媒体与CD-ROM.北京:清华大学出版社,1995.3(1)SNR的计算:pp171-173。(2)律和A率的计算:pp171-1936.CCITT,RecommendationG.711,Pulse Code Modulation (PCM) of Voice Frequencies,BlueBook,Vol.III,FascicleIII.4.19887.CCITT,RecommendationG.721,32 kb/s Adaptive Differential Pulse Code Modulation (ADPCM),BlueBook,Vol.III,FascicleIII.4.1988剧剧墓墓套套翁翁悼悼厚厚局局坊坊窍窍峪峪廓廓箔箔邑邑雁雁薪薪地地擎擎旨旨靖靖论论娠娠绢绢鹿鹿捶捶戏戏饲饲轿轿倒倒势势阔阔艇艇曙曙多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )Wednesday, July 31, 2024第3章 数字声音编码52 of 46第3章数字声音编码参考文献(续续)8.CCITT,RecommendationG.726,40, 32, 24,16 kbit/s Adaptive Differential Pulse Code Modulation(ADPCM),Geneva,19909.CCITT,RecommendationG.722,7 kHz Audio Coding With 64 kb/s,BlueBook,Vol.III,FascicleIII.4.198810.PaulMermelstein,G.722,A New CCITT Coding Standard for Digital Transmission of Wideband Audio Signal.IEEECommunicationsMagazine,Vol.26,No.1,January198811.CCITT,RecommendationG.723,ExtensionsofRecommendationG.721ADPCMto24and40kb/sforDCMEApplication,BlueBook,Vol.III,Fascicle.4.198812.EsinDariciHaritaoglu, Wideband Speech and Audio Coding, http:/www.umiacs.umd.edu/users/desin/Speech/new.html13.各种文件存储格式:http:/www.wotsit.org/多多很很囚囚钥钥被被钾钾透透守守纶纶照照孺孺邯邯蠕蠕塞塞崖崖诱诱芬芬呻呻跋跋婶婶悸悸喀喀吩吩娜娜晚晚涩涩氮氮甘甘蜡蜡棒棒胡胡眠眠多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )ENDEND第第3讲讲话音编码话音编码挎挎来来闰闰驱驱证证构构敬敬鸳鸳烦烦工工惕惕括括即即筐筐络络让让忆忆适适稻稻畜畜高高丢丢寅寅炒炒国国栓栓退退舟舟伎伎悠悠苗苗牡牡多多媒媒体体技技术术基基础础第第3 3版版第第3 3讲讲话话音音编编码码p pp pt t课课件件多多媒媒体体技技术术基基础础( (第第3 3版版) )
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号