第6章多媒体技术.ppt

上传人:本田雅阁 文档编号:2257367 上传时间:2019-03-12 格式:PPT 页数:29 大小:237.51KB
返回 下载 相关 举报
第6章多媒体技术.ppt_第1页
第1页 / 共29页
第6章多媒体技术.ppt_第2页
第2页 / 共29页
第6章多媒体技术.ppt_第3页
第3页 / 共29页
亲,该文档总共29页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第6章多媒体技术.ppt》由会员分享,可在线阅读,更多相关《第6章多媒体技术.ppt(29页珍藏版)》请在三一文库上搜索。

1、第6章 多媒体技术应用,6.1 多媒体的基本概念 6.2多媒体技术 6.3多媒体技术的应用领域,6.1 多媒体的基本概念,6.1.1多媒体 6.1.2多媒体信息的分类 6.1.3 多媒体的关键特性,6.1.1多媒体,1媒体。来源于拉丁文“medius”,为中介、中间的意思。根据信息的载体不同,国际电话电报咨询委员会(CCITT)将媒体分为五类: (1)感知媒体(Perception Medium):指人的感觉器官所能感觉到的信息的自然种类。感知媒体包括文本、声音、图形、静止和运动的图像等。 (2)表示媒体(Representation Medium):指交换的数据类型,它定义了信息的特性,如语

2、音PCM编码、图像JPEG编码、文本ASCII编码等。,6.1.1多媒体,(3)呈现媒体(Presentation medium):指为人们再现信息的物理工具和设备(输出设备),或者指获取信息的工具和设备(输入设备)。如显示器、扬声器、打印机等输出类显现媒体,以及键盘、鼠标器、扫描器等输入类呈现媒体。 (4)存储媒体(storage medium):指存储数据的物理介质,如磁盘、光盘、磁带等。 (5)传输媒体(transmission medium):指传输数据的物理媒介,如双绞线、同轴电缆、光缆、无线电链路等传输媒体。,6.1.2多媒体信息的分类,1. 文本。文本(Text)是计算机中基本的

3、信息表示方式,包含字母、数字以及各种专用符号。多媒体系统除了可利用字处理软件对文本输入、存储、编辑等功能外,还可应用人工智能技术对文本进行识别、理解、翻译等。 文本的不同格式可以根据文件名后缀来区别,文本的常见格式有:纯文本文件(*.txt)、Word文件(*.doc)、WPS文件(*.wps)以及RichTextFormat格式文件(*.rtf)等。 2. 图形。图形(Graphics)一般是指通过绘图软件绘制的由直线、圆、圆弧、任意曲线等组成的画面,图形文件中存放的是描述生成图形的指令,以矢量图形文件形式存储,可以随意拉伸变形。矢量图形主要用于线条图画、工程制图、美术字等,不适合表现包含很

4、多细节的复杂图像或照片。 矢量图比图像文件小,如PowerPoint的剪贴画就是这类文件。其主要格式有AutoCAD中使用的绘图互换格式(*.dxf)、CorelDRAW默认文件格式(*.cdr)和FreeHand图形文件(*.frh)等。,6.1.2多媒体信息的分类(续),3图像。图像(Image)是通过扫描仪、数字照相机、摄像机等输入设备捕捉的真实场景的静止画面,数字化后以位图格式存储。图像可以用图像处理软件进行编辑和加工。它的基本元素是像素。 图像可以理解为照片或图片,可以是黑白的,也可以是彩色的。图像比文字更具有直观性和形象性,容易引起人们的兴趣,帮助理解。图像的数据量较大,所需的存储

5、空间比文本大得多,在计算机中调用的速度比文本慢。 图像文件的格式非常多,在多媒体软件中常见的有*.bmp文件、*.jpg文件、*.gif文件、还有*.dib、*.tif、*.tga、*.pic等格式。同一内容的图像,采用不同的格式,其形成文件的大小和质量有很大差别。,6.1.2多媒体信息的分类(续),4动画。动画(Animation)是利用计算机生成的一系列可供动态实时演播的连续图像。动画是由一系列微小变化的静止画面组成的,按一定 的时间间隔显示,利用人的“视觉暂留”生理现象,产生连续运动的效果。动画从制作原理上可分为计算机辅助动画和基于造型的动画。按动画的记录方式可分为逐帧方式动画系统和实时

6、方式动画系统。 动画文件的常见格式有*.flc文件、*.gif文件(常用于网页制作)、*.swf文件(Flash文件)等。,6.1.2多媒体信息的分类(续),5音频。音频(Audio)是数字化的声音,它可以是解说、音乐及各种自然界的声音。音频可分为音乐音频和话音音频。 声音文件常用的有*.wav文件和*.mid文件,*.wav文件(WAVE声音波形文件)是直接由音频输入转换成的文件,它可以是各种声音的素材。所以采用*.wav文件的数据比较庞大,若不经过压缩处理,则一分钟的录音所形成的文件就有8Mb多。近年来,采用压缩技术,可以将声音文件的大小压缩10倍以上,采用这种技术的声音文件是*.mp3文

7、件。*.mid文件又称为MIDI(乐器数字化接口)文件,它是一种电子乐器(如电子琴、电子合成器)通用的音乐数据文件,MIDI只能模拟乐器的发声,只能用来播放音乐,不能用来播放语音或带人声的歌曲。但MIDI文件非常小,一首乐曲只有十几KB的大小,如用WAV文件则要20-30MB。因此,MIDI文件常用作多媒体的背景音乐。,6.1.2多媒体信息的分类(续),6视频。视频(Video)是活动画面,但与动画不同,是由摄像机等输入设备获取的动态画面,大多是对自然景物的捕捉,数字化后以视频文件格式存储。视频具有信息量大、感染力强的特点,适宜表现事物细节、呈现一些比较陌生的事物。 常见的视频文件有Windo

8、ws视频文件(.avi)、MPEG视频文件(.mpg)、QuickTime视频文件(.mov)、VCD中的视频文件(.dat)以及网上常用的RealVideo文件(.rm)等。视频文件的存储量非常庞大,对它的压缩存储是多媒体技术中研究的热点之一。,6.1.3 多媒体的关键特性,1.多样性。所谓“多样性”是指信息媒体多样化,这是多媒体一个最基本的特征。这些信息媒体包括文字、声音、图形、图像、动画、活动影像等。 2.集成性。它体现在信息集成性和技术集成性两个方面 3.交互性。它是指对计算机的多种信息媒体可以进行交互式操作,从而为人们提供更加有效的控制和使用信息的手段。,6.2多媒体技术概述,6.2

9、.1多媒体计算机系统的构成 6.2.2多媒体数据压缩技术 6.2.3多媒体数据的处理技术,6.2.1多媒体计算机系统的构成,由两部分组成:多媒体计算机硬件系统和多媒体计算机软件系统。 1硬件系统。多媒体计算机硬件系统由主机、显示器、CD-ROM驱动器、音频信号与视频信号处理子系统、扫描仪、数码相机、光盘刻录机和触摸屏等组成。多媒体计算机硬件系统最基本的是声频卡(AudioCard)、CD-ROM光盘机(CD-ROM)、视频卡(VedioCard)。在个人计算机上加上声频卡和CD-ROM就成为多媒体计算机。 在实际应用中,还应配置必要的其他硬件设备,如摄像机、扫描仪、触摸屏、打印机、影碟机、音响

10、设备等。典型的多媒体计算机硬件系统结构如图6-1所示。,多媒体计算机硬件系统结构,2软件系统。多媒体计算机软件系统是以多媒体操作系统为基础的,总的来说可分为四个层次,如图6-2所示。,图6-2多媒体计算机软件系统构成,6.2.2多媒体数据压缩技术,1数据压缩必要性。在多媒体数据的存储量大。解决视频、图像、音频信号数据的大容存储和实时传输问题,除了提高计算机本身的性能及通信信道的带宽外,更重要的是对多媒体数据进行有效的压缩。 数据压缩的逆处理称为解压缩,又称数据还原。它是将压缩数据通过一定的解码算法还原成原始信息的过程。通常,人们把压缩与解压缩的技术统称为数据压缩技术。,2数据压缩条件。 主要表

11、现在以下两个方面: (1)数据冗余度。 (2)人类不敏感因素。,数据压缩方法分类。 根据质量有无损失,压缩编码可分为有损压缩编码和无损压缩编码两类。 无损压缩编码解压后还原得到的数据与原始数据相同,没有误差。它基于信息熵原理,属于可逆编码,其压缩比不高,一般在2:1至5:1之间。在多媒体技术中一般用于文本、数据的压缩,它能保证百分之百地恢复原始数据。典型的无损压缩编码有:霍夫曼编码、算术编码、行程编码、LZW编码等。 有损压缩编码解压后的数据与原始数据不完全一致。这种编码在压缩时舍弃部分数据,还原后的数据与原始数据存在差异。有损压缩具有不可恢复性和不可逆性,但是压缩比一般可达几十倍或上百倍。在

12、图像、音频、视频压缩时常采用有损压缩方法。典型的有损压缩编码有:预测编码、变换编码等。,6.2.3多媒体数据的处理技术,1图像数据的处理 ()有关图像的基本常识。 彩色可用亮度、色调与饱和度来描述,人眼中看到的任一彩色光都是这三个特征的综合效果。 亮度是光作用于人眼时所引起的明亮程度的感觉,它与被观察物体的发光强度有关。 色调是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、棕色就是指色调。 饱和度是指颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度,对于同一色调的彩色光,饱和度越深颜色越鲜明或者说越纯。通常人们把色调与饱和度通称为色度。

13、自然界常见的各种颜色光,都可由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成;同样绝大多数颜色光可以分解成红、绿、蓝三种色光,这就是色度学中最基本的三原色原理(RGB)。,(2)图像数据的获取。图像获取的途径, 一 通过数码照像机等设备进行拍摄; 二 扫描获取,从画报、画册中扫描可得到大量图片; 三 网上查找,网络是一个巨大的资源库,充分利用网络能查找到大量的图片素材。 四 从屏幕上抓取,若是软件的操作界面等图像,可以用HySnapDX或SnagIt或Wincam等软件在软件操作过程中从屏幕上抓取相应的图片; 五 素材原创,可以使用图像处理软件进行创作,初学者可以使用windows自

14、带的“画图”软件,复杂图像创作可使用较专业的Photoshop等软件。,2音频数据的处理 (1)音频基础知识。空气的振动就产生了声波。在多媒体系统中,声音是指人耳能识别的音频信息,如人发出的话音,乐器声,动物发出的声音,机器产生的声音,自然界的雷声、风声、雨声等,包括各种人工合成的声音。 人耳能识别的声音频率范围大约在2020kHz,通常称为音频(audio)信号。 人说话的信号频率通常为3003000Hz,称为语音(speech)信号。低于20Hz的信号称为次声波(subsonic),高于20kHz称为超声波(ultrasonic)。次声波和超声波人耳都无法听到。,声音的频率范围如图6-3所

15、示。,图6-3声音的频率范围,从听觉的角度,音调、音强和音色称为声音的三要素。 音调由声波的频率决定。声波的频率高,声音的音调就高;声波的频率低,声音的音调就低。人的听觉范围是20HZ20KHZ。使用音频处理软件对声音的频率进行调整时,音调会随之产生变化。不同的声源有自己特定的音调,若改变了声源的音调,则声音会发生质的转变,使人们无法辨别声源本来的面目。 音强又称为响度,由声波的振幅决定。声波的振幅高,声音就强;声波的振幅低,声音就弱。 音色由声波的形状决定。影响声音特色的主要因素是复音。所谓复音是指具有不同频率和不同振幅的混合声音,自然声中大部分是复音。在复音中,最低频率的声音是基音,它是声

16、音的基调;其它频率的声音称为谐音或泛音。基音和泛音是构成声音音色的重要因素。混入音波基音中的泛音不同,得到不同的音色。,数字音频是指一个用来表示声音强弱的数据序列,它由模拟声音信号经采样、量化和编码(即把声音数据写成计算机的数据格式)后得到的。音频模拟信号转换成数字信号的过程如图6-4所示。,图6-4音频模拟与数字信号转换过程,决定数字音频质量有3个指标:采样频率、量化位数、声道数。每秒钟声音所占存储容量为:采样频率量化位数声道数/8(字节) 例如,录制CD时,采用44.10KHz的采样频率,每个采样点用16位存储,录制1分钟的立体声(双声道)节目,其波形文件 (WAV)的存储量为:44100

17、16260/8=10 584 000(字节)=10.09 MB。由此可见,未经压缩的音频文件的存储量比较大,这就是对波形音频文件要压缩的原因。,音频数据获取。音频的获取途径, 一 从素材光盘上获得 二 网上查找; 三 从现有的录音带中获取 四 原创 五 从CD、VCD中获取,可以使用超级解霸将VCD上的影片直接录为MPG视听文件或MPV视频文件,也可以直接录音为WAV波形文件和MPA音频文件,还可以将CD碟上的歌曲或WAV波形文件直接录为MP3 音频文件。,图6-5音频超级解霸,3视频和动画数据的获取与存储 (1)动态图像的组成。动态图像,包括动画和视频信息,是连续渐变的静态图像或图形序列,沿

18、时间轴顺次更换显示,构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时,人们称为动画;当序列中每帧图像是通过实时摄取自然景象或活动对象时,人们称为影像视频,或简称为视频。动态图像演示常常与声音媒体配合进行,二者的共同基础是时间连续性。 (2)动画的定义。所谓动画是指通过以每秒15到20帧的速度顺序地播放静止图像帧以产生运动的错觉。因为眼睛能足够长时间地保留图像以允许大脑以连续的序列把帧连接起来,所以能够产生运动的错觉。人们可以通过在显示时改变图像来生成简单的动画。,(3)常见的视频文件格式。视频信息在计算机中存放的格式很多,目前最流行的两种格式是:苹果公司的Quicktime和微

19、软的AVI。 Quicktime是苹果公司采用的面向最终用户桌面系统的低成本、全运动视频方式。 音频视频交叉存取格式(Audio Video Interleave,AVI),1992年初Microsoft公司推出了AVI技术及其应用软件VFW(Video for Windows)。在AVI文件中,运动图像和伴音数据是以交织的方式存储,独立于硬件设备。,6.3多媒体技术的应用领域,1多媒体数据库及信息查询。多媒体数据库的内容是多媒体与数据库相结合,用计算机管理文本、图形、图像、音频和视频资料。 2教育和训练。使传统计算机辅助教学软件的表现手段扩展成声音、动态图像,具有较强的交互能力 3演示系统。给观众更清晰、深刻地印象。 4多媒体电子出版物。 5多媒体通信。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1