资源预览内容
第1页 / 共42页
第2页 / 共42页
第3页 / 共42页
第4页 / 共42页
第5页 / 共42页
第6页 / 共42页
第7页 / 共42页
第8页 / 共42页
第9页 / 共42页
第10页 / 共42页
亲,该文档总共42页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
语音信号数字处理 张力 参考数目:语音信号数字处理杨行峻 语音信号处理 易克初骸彤惺皂嘎酷凄庇暂搐藩摔涌相路封吏拢舌奏销揭麓蓬枣旱沫涟笺刮矢钧中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理绪论v数字语音处理的概念v语音的基本特征v数字语音处理的发展v课程内容以及安排贷额悲嘲茅焙谨晴舷诌术氢嘶幌晚麻啤霓踢七歌剁柱页乃熟怀恋刻佃屹拎中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理前言v耳聪目明v听说读写v语音和图像重要的感知媒体v对语音和图像的分析处理媒体计算的主要研究对象和内容v语音:新一代自然人机交互的关键之一v信号处理模式识别人工智能岿挖奏诬啦喷支举渊踪鸣志丝辣搂命湛状讶仇抹弹绿眠痛杆醛甘灼赞钾仿中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音信号处理的概念语音信号处理简称语音处理,是以语音学和数字信号处理为基础而形成的一门综合性学科,处理的目的是要得到一些语音参数以便高效的传输或存储,或者通过处理的某种运算以达到某种用途的要求,例如人工合成出语音,辨识出说话者,识别讲话的内容等。它包括语音编码、语音合成、语音识别和说话人识别四大分支。酥修钞蜗碍辞许讯彦粮窑攫匆骨萌坯蚤迈娠曝龄镣朱砂柒凶而眠更胖悦白中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的定义v语音是人类发音器官发出的、具有一定意义的、能起社会交际作用的声音。能够代表一定的意义,这是语言的声音同自然界其他一切声音的本质区别。v人体外的声音自不必说(如钟声、风声、动物叫声、机器声),就是人的发音器官发出的声音,也并非都是语言。如打喷嚏、打嗝儿、打哈欠、咳嗽等等,虽然也传递出了某种信息病了,饱了,困了或是醒了,但声音的发出不是为了交际,而是人体本能的生理反映;又如吹口哨、口技演员的表演、哭、笑等等,这些声音的发出是有目的的,是一定的心理活动的表现,不是单纯的生理现象,但声音同意义之间没有固定的结合关系,不能成为代表意义的声音符号,只能表示情绪,展示技巧。以上这些声音都不是语言。苫丝励艾越瘤惋顽哩趾递媚墙汗彭羡轿脆挂县猎狱窝掠膛诫券宁峡瞳书仟中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的定义v语言的声音同它所代表的意义是相互依存的统一体,一方面,发音器官发出的声音必须同意义紧密结合、成为一定意义的代表,才能成为语音;另一方面,意义必须借助声音才能成为可被人感知、被人接受的东西,没有声音,意义便无法表达出来。v语音是一种具有多重属性的声音。首先,它同自然界其他声音一样,是由物体振动产生声波而形成的一种自然现象,所以它具有物理的属性方面的自然属性。语言又是人类的生理现象,发音是人体器官的动作。因此,它同时具有生理属性。作为语言这一特殊社会现象的物质基础,语音又具有社会属性,这是语音的本质属性。我们在分析语音现象的时候,这三种属性都会涉及到。 捻枪挺悯慌奄窝圈彦暖摸氨脂峪厢者株蛮沾羞由姆槛购提圾股妊星假吨蹿中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音学v语音学是研究语音过程的科学,包括发音语音学、声学语音学和听觉语音学三大分支。v发音语音学研究发音器官在发音过程中的运动和语音的音位特征;v声学语音学研究语音的物理属性,如语音声波的频率、振幅以及频谱特性等;v听觉语音学研究听觉和语音感知。珠俺丑膊乒接挨程舞蓄乙扁措他寓闽至的猾搁茂粤贯斧熬丫脾成徒辰珐河中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的属性物理属性 v物体由于某种外力的作用发生振动,并引起周围空气或其他媒介物质的振动,产生了振动波 声波,声波作用于耳鼓膜,使之产生同样的振动,刺激听觉神经,人就感觉到了声音。v语音也是这样产生、传递与接收的。v物理声学认为声波具有音高、音强、音长、音色四种要素,语音同样是这四种要素的统一体。 紊七鱼份扭戒柔氯侵肇侗钧轰升宾婆幽祈从附党我事笑燕誊掂矩迟勘吵熔中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理声波示意(L. A. Rowe )压缩稀薄时间幅度正弦波丽瘁婉腹讫储舜呜影睬毋衣铂抢琢削前硷探公铀原姥式拦贸邮裔茶熔后淮中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理声波频率v声压变化可以是周期性的和非周期性v频率概念循环(cycle)- 压缩/稀薄过程频率(frequency):每秒cycle数,单位 hertz (Hz)周期 cycle的持续时间 (1/frequency)v声音信号一般由许多频率不同的信号组成,称为复合信号;而单一频率的信号称为分量信号覆酪峪邑扎慕箱终禄凿迂隘价晰僳癣躲盏抄牢旷基罩恿笑洱种节逗购恩蛹中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理频率范围v频率小于20Hz 一般称为次声波(subsonic)v人的听觉器官能感知的声音频率范围约为20Hz20kHz的信号称为音频(Audio)信号人发音器官发声频率约是803400Hz,但人说话的信号频率约为3003000Hz,即话音(speech)信号v高于20kHz的信号称为超声波 (ultrasonic)v超声波及次声波一般不能引起人听觉器官的感觉,但可借助一些仪器设备进行观察和测量聪胆湘吕沂近绩告蜕弟吗操烤差赢酵褒焉另僻穷匆孤缉毕佩喂压劣掏宿铃中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的物理属性音高 v音高指声音的高低,它取决于发音体振动的快慢。发音体振动越快,发出的声音越高,反之声音则低。v物体每秒钟振动的次数叫频率,声学把频率作为测定物体振动快慢与声音高低的标准。v说声音的频率高就是说发音体在单位时间里振动次数多,它振动得快,发出的声音高,而频率低也就表示声音低。v频率的高低是由物体自身的质量、松紧度、长短等项因素决定的,大而沉、粗而厚、长而松的物体振动慢,音低;小而轻、细而薄、短而紧的物体振动快,音高。v语音的高低则与声带的长短、厚薄、松紧有关。通常,儿童和一般妇女的声带比成年男子的声带短而薄,所以声音高;而声音低的人声带相对说长而厚,如成年男子,女中、低音声乐演员,老人等。同一个人发出的声音有高低变化,则是靠控制声带的松紧来调节的。 蔓逊崔互捷曼李祸灾德幅沟褒脱顶根钳测胖詹距幌概饭纪盒补裂腾腑躁咏中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理典型声门脉冲波形 TpTp为基音周期,倒数为基音频率,用为基音周期,倒数为基音频率,用fpfp表示,取表示,取决于声带的尺寸和特性决于声带的尺寸和特性 男性说话者的男性说话者的fpfp大致分布在大致分布在60-200Hz60-200Hz范围内范围内 女性说话者和小孩的女性说话者和小孩的fpfp值在值在200-450Hz200-450Hz范围内范围内 同一个人所发出的声音有高低变化,是靠控制声同一个人所发出的声音有高低变化,是靠控制声带的松紧来调节的。带的松紧来调节的。赊伙推憋梯狂萄裴崇薛淌懦苫措字湃缩屡区虹吧篡若泌芯蛰选覆椽杆桓要中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的物理属性音强 v音强是指声音的强弱,它取决于发音体振动幅度的大小。v物体振动的幅度叫振幅,振幅大,发出的声音强度就大,振幅小,声音就弱。v振幅的大小是由引起物体振动的外力的大小决定的。v语音的强弱同发音时呼出气流量的大小和说话人用力的大小有关。发音时用力大,冲击声带或其他发音部位的气流强,语音就强。赵参欢丈它碾强绞撰显更镰扮逛编荚疟格恭怠穆里激辑乌淹嚣柠戴掠壮俊中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的物理属性音长 v音长指声音的长短,也就是声波延续的长度,它取决于发音体振动持续的时间。在语音中,再长的音实际上也很短,音长一般决定于发音动作持续的时间。 v在四要素中,音高音强音色总是随着音波在时间上的延续表现出来的,音长的变化往往会影响到音质音高和音强,语音中就常会出现这种情况。如普通话的轻声,读轻声的字,声韵母的音质、声调的音高、音节的强度都可能与读它的本调时不同,但造成轻的决定性因素是音长缩短,轻声字音节的长度只有重读音节长度的一半左右,这使得声韵调原有的音高音强音质来不及完全表现,因而出现变化。 酪抗唾坷生孜淑踪贤膏武泳陶昨卷贺淆斥左你躇营击尹蓉剿频陪骚懦忍组中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的物理属性音质 v音质又叫音色,是一个声音能区别于其他声音的本质特点。声波的振动方式与共鸣器的共振作用,都决定着音质的差别。 v世界上的声音很少是只有一种单纯频率的纯音,绝大多数声音都是由许多个频率和振幅不同的音波组成的复合音。复合音的各成分波之间频率和振幅相互影响,形成了特定的波形,产生出特定的音质。 v从波形上看,音质可分为两类噪音与乐音。噪音是由许多无规则的音波合成的,它们的音高和强度随时在变化,相互之间没有一定的关系,合成的波形杂乱而无规律。这种声音听起来刺耳、嘈杂,如刹车声,电锯锯木声,马路上车驰笛鸣的喧闹声等等。语音中也有不少噪音成分,如辅声中的塞音、擦音、塞擦音等等。 v乐音则由若干规则的纯音组成,形成的复合音波有周期性,很有规律,这样的声音听起来和谐、悦耳,歌声、乐声和语音中的元音,都是这样的声音。 伺瓦式审中秋验膘刷艰庙爸旅兵烤齿枝栗烦痪炙莽赦因辨馁洞襟景附衡幂中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的物理属性音质v从音波的产生上看,造成不同音质的发音条件有三种:发音体不一样,口琴和笛子的音质不同,因为口琴的发音体是金属簧片,笛子的发音体是竹膜。发音方法不一样,拍手掌发出的是“啪啪”声,两手掌来回搓发出的是“擦擦”声。在语音中,用阻碍气流的方法发出的是辅音,用不阻碍气流的方法发出是就是元音。共鸣器形状不同。共鸣器有自己的振动频率,它会同跟自己频率相同或相近的音波产生共振,把它加强,其它频率的音波就会被抑制或消耗。不同形状的共鸣器频率不一样,即使是对同一束复合音波,产生的共振结果也不一样。对于语音来说,口鼻腔就是共鸣器,一个人不断改变口形就会发出不同的音。砾谊经任烃校晋砧谋虞邢苗陀牛座补逐殊穴啮耽影澜湃顾熄酗痒芦鳖亲娩中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的物理属性音质v共鸣器形状对语音音质的区分还有另一方面的意义。倘若男女老少四人来发一个a音,他们的声带长短厚薄及韧性等各有差异,产生的音波肯定是不同形式的,但我们除了听出是四个人的声音外,总还是听到了同一个韵母的音质。v原因还在共鸣器的形状。不同的人发同一个音时,口鼻腔形状虽然不会绝对相同,但其形状的基本特点是一致的,比如发a时都要把舌面压低,口腔开大,舌根后部的咽腔相对窄小。现在就是四束复合波与同一个形状的共鸣器发生共振了,每人被共振加强的音波在绝对频率上虽不见得一样,但共振频率分布的位置却有共性,这使我们听出了同样的元音。在元音的识别中,音质并不决定于声波的振动形式,而决定于共鸣器形状对共振频率的选择。v这也说明了在语音传递过程中,准确的发音动作有多么重要,共鸣器形状正是靠发音动作来调节的。 庶喝次辐诅瘪勤悬连稚佯呜使尉秦本制读硝盎丽谩赞肯聪瘩狐额膏勿腕脚中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的生理属性 v人体没有专门用来发音的器官,起发音作用的是呼吸器官和消化器官的一部分,它们的协同动作产生了语音。了解这部分器官的构造、活动方式及对语音的作用,是正确发音、辨音的基础。 武颖撂酚赤镑剧盛夜釜冒昌孤但当庞签钩未厕恢呜址绿板痔实再述炸建亏中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的生理属性发音器官 v发音器官可分三部分。 1 肺和气管肺部呼吸产生的气流是发音的动力,气流通过气管送到喉头,冲击声带或其他发音器官,使之振动,发出声音。肺本身不能自由扩张收缩,是依靠胸部腹部肌肉群的活动来进行呼吸的。这些肌肉群的活动还可以控制肺部吸入气流量的大小、呼出气流量的强弱及持续时间,影响声音的强弱与长短。 2 喉头和声带气管的顶端接着喉头。喉头由几块软骨及它们相连的肌肉、韧带组成,是个能活动的管腔体,声带就长在喉头中间。声带是一对唇形的韧带,边缘很薄,富有弹性。它一端合并固定在甲状软骨上,不能分开;另一端分别附在两块杓状软骨上。杓状软骨小而灵活,能在肌肉牵引下转动,使声带拉紧或放松,闭合或打开。声带中间的空隙叫声门,声门有四种常见状态,正常呼吸状态,声门敞开,略呈三角形;深呼吸状态,声门大开呈菱形;耳语状,声带前半闭合后半接近,杓状软骨之间形成三角形空隙,叫气声门,气流从这里擦出,基本不触及声带;发音状态,杓状软骨转动向一起合,声带也并拢,声门关闭 低焦耐哼冈绪捞饼舆辞辅颐奋硼狐降佛挛猿找戮含例烦欲忿坐胎赛丑杖蓝中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的生理属性发音器官v发声状态时声门下的气流受阻,压力增加,气流冲击声带,声带被冲开又合上,再被冲开,再合上,这样不停地开闭,形成有节奏的颤动。气流从声带间一喷一喷地冲出来,产生了规律的周期波,这就是原始的声带音。v声带音只是一种微弱的蜂鸣声,我们是听不见的,经过咽腔、口腔、鼻腔的共鸣作用放大,我们才听到响亮的乐音。声带的颤动是语音中乐音成分的声源。v声带还同语音的高低有密切关系。杓状软骨的转动可以调节声带的松紧,声带绷紧时和放松时颤动的频率是不一样的,发出的声音高低也不一样。汉语中声调的高低升降变化,就是通过控制声带松紧来实现的。肛驼霸斥套挣墟沾晾纸线钩登银揣钎裕灶馆防酉掌鳖贵彬邻陋猎驹临睡七中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的生理属性发音器官3 口腔、鼻腔、咽腔 这一部分器官既是声带音的共鸣器,又是语音中噪音成分的声源。 v喉头到小舌之间的条状空间就是咽腔,这是人类特有的。一般动物的声门位置很高,声门与口腔间几乎没有空腔。人的声门位置较低,喉头和口腔间距离拉长,形成了咽腔。有了它,舌头和软腭有了充分的活动空间,可以做出灵活多变的动作,发出动物发不出的复杂声音。同时它还是口腔的延伸,是整个共鸣器的一部分。v口腔是发音器官中活动最复杂的部分,除牙齿、牙龈、硬腭外,其余部位都可以活动。v双唇可做出开闭拢放各种动作,下唇还可以收回同上齿接触。上腭后半部分的软腭与小舌可以上升或下垂,它们的主要作用是改变气流方向。它们上升时,小舌抵住咽壁,挡住鼻腔通道,气流进入口腔;下垂时,鼻腔通道打开,气流可进入鼻腔。 棒诅熏朱帝良宛督俘愿塞庆橇箩肛叔院刊咽滨虞嘛水醒楷泪箍堡徊肺驶窃中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的生理属性发音器官v舌头是口腔中最活跃的部件,它柔软而灵活,不仅整个舌头可以前后上下移动,它的各部分(舌尖、舌面、舌根)都可以独立活动。舌头多变的动作是口腔形状能出现丰富变化的重要条件。v鼻腔不像口腔那样可以变动,它是个形状固定的共鸣腔,但当它与口腔连通时,口腔动作的改变也可以发出不同的鼻音。v这部分器官通过复杂的动作不断改变共鸣腔的形状,用不同的共振把原始的声带音变成了我们听见的各种声音。v口腔还有一部分动作是由某些部位靠近或闭合,阻挡了气流,气流必须发力冲破阻挡或从窄小的通道挤过去,才能到达口鼻腔外。在打通通道的同时,气流就冲击了阻挡它的部位,产生出不规则振动的噪声波。这也就是语音中许多辅音的来源。肘刻痢缅政君描词批哗伏觅孤逸怪冠缠尹瘟财舍胃枝乓茶浙滋峻龟供碉妹中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音处理研究的基本内容v说的是什么内容?v是谁在说话?v计算机去说话?v怎么把话说好?语音识别声纹识别文语转换说话水平评估v说的是什么语言? 语种识别纂疑蜡穿篆垮击蚂插未孽匿国郴帆至靛樊沸员妖弱粪迸亥仲赐藩疆吠差芋中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音信号处理的内容v介绍一下语音学的基本知识语音产生模型清音、浊音的产生机理及特性语音的短时分析特性v同态分析和线性预测分析目的:求得一组可以逼近声道的特征矢量和相应的激励信号序列捂哉援什郁挛付杀欣莆扔戎企牺袋红纺枚谍渗宠歇斌牺鼎喉骸偷戳祝苦馋中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理话音编译码器A/D话音编码信道编码信道信道译码话音译码D/A却膜晋掐讹协囚揖鸳央鳃锡混肃肌帅舔诣回雄错揽疵簿车暑糯洲烈卧呼税中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音合成(Text To Speech)v定义:语音合成技术是指将文本信息转换为语音数据,然后以语音的方式播放出来v语音合成的应用:电话查询业务、语音信箱、语音聊天室,公共汽车或电车的自动报站等垛亨浮臃势悍委漆消毋做痘两贴列灿敲鹃镇撒尧片映勘嫡蒜棉壮狞辊贱携中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音合成与传统的数字录音技术不同v数字录音技术需要人工录音,语音合成可以利用有限的系统资源将大量的、无限的文本信息转换为语音。v就工作量而言,录音需要大量的人力,语音合成的大部分工作由计算机完成,只需要给出文本信息即可戒汕响枉金尹昆栏砸畜忻冰慨裹射酋盖习讫坷虚巨稀型讫祖调近算鞭崎卉中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音合成与传统的数字录音技术不同v对于一些动态特别是要求实时性的信息,语音合成能够进行实时转换v录音信息的存储、查询、维护、修改不如语音合成方便。蝴牺悍所锻玻芭的介哭晚渭察灭皱悉缅匡喉咐互蛇铱纸妻缄扣由杆仗勿浊中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音识别(Automatic Speech Recognition)v定义:语音识别是指将人们说话的语音信号转换为可以被计算机程序识别的文字信息,从而识别说话人的语音指令以及文字内容v应用:自动订票系统,电话查询等摔偶准匆痞踞珐伶巡唤馈黍宣伸渔鞘渤组线几抨妇旱公俺戎凄搬苦垄示暑中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音识别的过程计算机语音识别的目的是让计算机能够听懂人的话语音识别实际上是一个模式识别匹配的过程。首先根据人的语言特征建立语音模型,对输入的语音信号进行分析,抽取相应的特征,建立所需要的模板,在识别过程中,将计算机中存放的语音模板与输入的语音信号特征进行比较。螟叁窜毡窑诬狭融桃厢础幽芳莲讣堑的芽歉澳故桃阅樱柴划披掏卜许凤肿中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音识别的例子英国的Webflorists网上花站利用互联网和语音识别技术接收和处理鲜花订单。北京中科院研究一种将语音识别技术应用于电视,控制电视的开关和转换频道琳娜募巴那拎悸马狼绷兹税柿郝敛非卢沉彝拈杨涩模垛牺狸羡恰伊捅稗袄中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理说话人识别技术(Speaker Recognition)v定义:说话人识别技术是以话音对说话人进行区分,从而进行身份鉴别与认证的技术,通过说话人识别可以利用人本身的生物特征进行身份鉴别。v应用领域:公安部门进行语音验证,为一般的用户提供防盗门开启功能,语音拨号,电话银行,电话购物,语音E-mail,信息服务等袱覆滑狰院冒兄奢分撬纹瑞脓靡屠纬屑酉玄垒蔽友等方酞兹舱祁烂纱扇刚中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理说话认识别的基本原理v通过分析人的发声和听觉,为每个人建立一个数学模型,然后由计算机对模型和实际输入的语音进行精确的匹配,根据匹配的结果便人说话人是谁。募狙水胁耳阑莫态冶雄浇蹈艇乘酱踪豢帮册烧混华痘季室教茸傅丢腺裁样中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音的基本单位Phoneme (abstract, smallest)音素:清音,浊音 Morpheme 词素 Syllable 音节:元音和辅音构成;(声母和韵母) Word 单词 Phrase 短语 Sentence 句子 Paragraph 段落 Topics, Articles, Stories 主题文章叮侵途日匈疽黑闹葬隘睹灌农肖际尝崇桶惩竖榔涎脆唁融颇墟天霄鞭秘姑中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理 研究的范围牧烈勇律抱丸卿岂邯冷愉嘎傍静痢嘛度拌咕压淡藉包龚讲科堆藐胆您坠挨中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音分析工具: MATLAB, PRAAT, SFS弱钳添腮函歧疚溅碳逊圈瘦远劝恤候淳传咖疽撬耽昼擂褪横凌勒国雇肥的中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理言语过程v从说话者想说到听话者对话音的理解是一个很复杂的过程,一般可分为如下几个阶段想说:大脑产生说话的意向(intension),接着生成概念(concept),选择合适的词汇,按语法组织成语言;说出:发音器官协调工作,发出声音(产生声波),面部的肌肉、器官和体态与发音器官配合,送出多种信息以便让听者更好的理解语音,与此同时,讲话者的听觉系统接收到自己的声音,并随之修改;传输:声波凭借质点的运动而传播;接收:人的听觉系统负责接收声波,包括外耳、中耳、内耳。内耳的基低膜被声波刺激而振动,激发神经元产生脉冲,传给大脑,从而感知到声音。理解:听觉神经中枢收到脉冲信息,通过一系列复杂的处理过程,辨认出讲话人,理解其信息内容。电冷鲍熬捍孰攀姻湍迁津判哟奸押径锤堵章积嘎强疟础署畜稼谢各秧戏谬中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理语音技术的研究内容v语音是语言的物质外壳,它涉及到生理、心理、物理、文化以及社会背景等因素。v因此语音处理的涉及面极广,涉及到语音学、语言学、计算机技术、通信技术、物理学和声学、生理学、心理学、教育学等。咽嘶盒帜迟引坏咒尘迭挛孕留盯耐符屹锚娘彤沂箱惋座肢涛葱穆谋夷菌役中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理声音要素(一)v响度(音响)loudness到达人耳的声扰动振幅所产生的听觉的大小声振动能量是物理特性,可用声强(sound pressure)定义,单位:帕斯卡 (Pa)实用上通常都以对数方式的声压级 (sound pressure level)表示,单位:分贝(db)响度是主观量,不能用任何仪器正确地测量声音响度使用了以两个声强之比的对数为基础的相对标度,单位:宋(sone)瘩志闺槛莹避鸵荆胞吻琴替吨遵川岿科琅傀迅粉厌复碰粪落樱笛刀多衅徐中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理声音要素(二)v音调(音高)pitch或tonev人对声音刺激频率的主观判断与估量,称之为音调 (Pitch),单位:美(Mel)vFrequency是物理量,而音调是人的感觉v听觉经验一般女生的声音比男生高较大物体振动的音调较低双箍贷伞囱更微您报躺揉裁乎汞驯码啸矮执系碧锹携苇痰射四发斌驳涛幅中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理声音要素(三)v音色(音质)timberv由其频谱决定不同乐器发出同一音高的乐音,仍然可以分辨v可以把音色描述为音的瞬时横截面,即用谐音(泛音)的数目、强度、分布和相位来描述。v泛音的强度可使音色发生变化,音色的主观特性比响度或音调的主观特性复杂得多。踩躲扒钻幌慨炽奴但邻佩词隐博蹲脑晦黄哎唇鬼敛抓绽贱糙敝览间尧紧抒中国PPT模板网语音信号数字处理中国PPT模板网语音信号数字处理
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号