多媒体技术音频处理技术.ppt

上传人:本田雅阁 文档编号:2565094 上传时间:2019-04-09 格式:PPT 页数:61 大小:5.90MB
返回 下载 相关 举报
多媒体技术音频处理技术.ppt_第1页
第1页 / 共61页
多媒体技术音频处理技术.ppt_第2页
第2页 / 共61页
多媒体技术音频处理技术.ppt_第3页
第3页 / 共61页
亲,该文档总共61页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《多媒体技术音频处理技术.ppt》由会员分享,可在线阅读,更多相关《多媒体技术音频处理技术.ppt(61页珍藏版)》请在三一文库上搜索。

1、第二章 音频信息处理,第2章 音频信息处理,学习目标: 了解声音信号的特点、存储格式及质量的度量方法 理解音频信号压缩方法及音频编码标准 掌握常用的音频处理软件对声音信号进行处理 了解语音识别技术及其应用,2.1数字音频的基本概念,2.1.1声音与音频的概念 1、声音的定义: 震动物体产生的声波,传入耳朵形成声音。,2、声音的分类 按频率分 亚音频: 020Hz 音频(Audio):20Hz20KHz 超音频: 20KHz1GHz 过音频: 1GHz1THz,按原始声源划分 语音:人类为表达思想和感情发出的声音 乐音:演奏乐器时乐器发出的声音 声响:除语音和乐音以外的所有声音。如自然界的声音,

2、按存储形式划分 模拟声音:模拟方式存储,如磁带 数字声音:用0、1表示的声音数据,3、音频,20HZ20KHz范围内的声波,也是人的耳朵可以听到的声音。,4、声音质量的评价标准(信噪比、频带宽度) 按照声音频率的变化幅度可以分为: 电话话音质量:2003400Hz 调幅广播音质:507000Hz ,简称AM音质 调频广播音质:2015000HZ,简称FM音质 激光唱盘音质:1020000HZ,简称CD音质,2.1.2 模拟音频的数字化过程,对模拟音频数字化过程涉及到音频的采样、量化和编码。 采样和量化的过程可由A/D转换器实现。A/D转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采

3、样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中。,信息论的奠基者香农(Shannon)指出:在一定条件下,用离散的序列可以完全代表一个连续函数,这是采样定理的基本内容。 为实现A/D转换,需要把模拟音频信号波形进行分割,这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。,1. 采样,对声波波形幅度的数字化表示称之为“量化”。量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区

4、段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。 以位(bit)或16位(bit)的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中,其纵轴将会被划分为?个量化等级,用以记录其幅度大小。,2. 量化,采样和量化,D/A转换器从上图得到的数值中重构原来信号时,得到下图蓝色线段所示的波形。可以看出,蓝色线与原波形(红色线)相比,其波形的细节部分丢失了很多。这意味着重构后的信号波形有较大的失真。,失真是不可避免的,如何减少失真呢?在下图中,采样率和量化等级再提高了一倍。从图中可以看出,当用D/A转换器重构原来信号时(图中的轮廓线),信号的失真明显减少,信号质量得到了提高。,3.

5、编码 模拟信号量经过采样和量化以后,形成一系列的离散信号脉冲数字信号。这种脉冲数字信号可以一定的方式进行编码,形成计算机内部运行的数据。 所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。,2.1.3 数字音频的文件格式 在多媒体技术中,存储音频信息的文件格式主要有:WAV文件、VOC文件和MP3文件等。 1. WAV文件 WAV文件又称波形文件,来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值轮换成二进制数,然后存入磁盘,这就产生了波形文件。WAV文件用于保存Windows平台的音频信息资源,被Windows

6、平台及其应用程序所广泛支持。,请计算对于5分钟双声道、16位采样位数、44.1kHz采样频率声音的不压缩数据量是多少?,思考题,解: 根据公式: 数据量=(采样频率采样位数声道数时间)/8 得,数据量=44.11000162(560) /(810241024) =50.47MB 因此,声音的不压缩数据量约为50.47MB。 计算时要注意几个单位的换算细节: 时间单位换算:1分=60秒 采样频率单位换算:1kHz=1000Hz 数据量单位换算:1MB=10241024=1048576B,未压缩的声音文件的存储量可用下式计算: 存储量(KB) =(采样频率KHZ采样位数bit声道数时间秒)/8,2

7、.VOC文件 VOC文件是Creative公司所使用的标准音频文件格式,多用于保存 Creative Sound Blaster(创新声霸)系列声卡所采集的声音数据,被Windows平台和DOS平台所支持。,3.MPEG音频文件.MP1/.MP2/.MP3 MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3这三种声音文件; MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为41和6181,而MP3的压缩率则高达101121,也就是说一分钟CD音质的音乐,未经压缩需要10MB

8、存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。,4. RealAudio文件.RA/.RM/.RAM RealAudio文件是RealNetworks公司开发的一种新型流式音频(Streaming Audio)文件格式;它包含在RealNetworks所制定的音频、视频压缩规范RealMedia中,主要用于在低速率的广域网上实时传输音频信息;网络连接速率不同,客户端所获得的声音质量也不尽相同:对于28.8kb/s的连接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获得CD音质的声音。,5.AIFF文件.AIF/.AIFF AIFF是音频交换文件格

9、式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发的一种声音文件格式;被Macintosh平台及其应用程序所支持,其他专业音频软件包也同样支持这种格式。,MP3的全名是MPEG Audio Layer-3,简单地说就是一种声音文件的压缩格式。 ISO/MPEG音频压缩标准里包括了三个编码方案 ,按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分别是Layer1、Layer2、Layer3。所有这三层的编码采用的基本结构是相同的。通过研究人耳和大脑听觉神经对音频失真的敏感度,在编码时先分析声音文件的波形,然后滤去人耳不敏感的信号,最后编码形成M

10、PEG的文件。而音质听起来与CD相差不大。,MP3压缩技术,MPEG的层次与压缩比率,MP4并不是MPEG-4或者MPEG-1Layer4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。,MP4压缩技术,2.2 波形音频文件的采集与制作,Windows录音机的主要功能是录音和放音,使用“录音机”可以录制、混合、播放和编辑声音。其主要功能操作如下所述: (1)波形文件的录制:录音机常用的输入设备是麦克风和CD-ROM播放机。 (2)波形文件的存储:存储的文件格式为波形(.wav)文件。 (3)声音的编辑:复

11、制、粘贴、插入、删除等操作。 (4)音频变换与特殊效果:更改声音的大小、速度、回音等。,录制一段音频,2.3 常用音频处理软件简介,Gold Wave:,左声道,右声道,GoldWave是一款相当不错的数码录音及编辑软件,除了附有许多的效果处理功能外,它还能将编辑好的文件存为WAV、AU、SND、RAW和AFC等格式。 作为Wave文件编辑处理工具,支持从MP3、MPG、AVI、ASF、MOV等文件中提取音频进行编辑,所以除了它强大的编辑功能外,用作把以上格式的音频转换成WAV文件也是很方便的。,1、声音类型转换,2、声音合并,3、回声效果,4、多普勒效果,5、制作铃声,1、打开原音乐文件,2

12、、试听找到音乐高潮部分,3、将选中的音乐部分剪裁下来,4、选中开始的几秒钟,加淡入效果,5、选中结束的几秒钟,加淡出效果,制作好的铃声图,第2章讨论题,1.声音按其特性分为哪几类?举例说明。,分为规则和不规则两类。不规则指不含任何信息的噪音;规则声音分为语音、音乐和音效。语音是指具有语言内涵和人类约定俗成的特殊媒体,音乐是规范的、符号化的声音,音效是指人类熟悉的其他声音,如雨声、雷声、机器轰鸣声。,2.声音具有哪3个要素?,音强、音调、音色。,3.声音数字化分为哪两个步骤?,采样:就是每隔一段时间就读一次声音信号的幅度,记录下来的原始模拟声波在某一时刻的状态,称之为样本; 量化:把采样得到的声波幅度转化为数字值,也就是把某一幅度范围内的电压用用一个数字表示。,实验题,1、清制作一段自己的录音文件,并配背景音乐,写出制作步骤。 2、请叙述用Cool Edit Pro取出某段录音文件中的环境噪音的步骤。 3、请把某段正常速度录制的语音文件,在保持语调不变的情况下把语速降低到正常语速的70%。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1