<span>软考多媒体技术</span>
多媒体技术及其应用
考点归纳
1、多媒体基本概念
音量、音调、音色和声音带宽的概念、常见音频范围图形和图像的概念及区别,三原色原来、印刷三原色、常见的彩色空间、图像亮度、色度、饱和度
2、多媒体相关计算
图像文件的大小的计算重点
、声音文件大小的计算、视频文件大小的计算
3、常见多媒体标准
常见的音频格式、视频格式、图像存放格式、常见的文件存放格式、MPEG标准族
多媒体基础
一、媒体的分类
媒体可分为感觉媒体、表示媒体、表现媒体、存储媒体和传输媒体。
- (1)感觉媒体:直接作用于人的感官,产生感觉(视、听、嗅、味、 触觉)的媒体,语言、音乐、音响、图形、动画、数据、文字等 都是感觉媒体。
- (2)表示媒体:是指用来表示感觉媒体的数据编码。如图像编码 (JPEG、MPEG)、文本编码(ASCII)和声音编码等。感觉媒体转换成 表示媒体后,能够在计算机上进行加工处理和传输。
- (3)表现媒体:是进行信息输入或输出的媒体。如键盘、鼠标、扫 描仪、话筒、数码相机、摄像机为输入表现媒体,显示器、打印 机、扬声器、投影仪为输出表现媒体。
- (4)存储媒体:是指用于存储表示媒体的物理实体。如硬盘、光盘 等。
- (5)传输媒体:是指传输表示媒体(即数据编码)的物理实体。如 电缆、光缆等。
例:以下媒体中,( B)是表示媒体,( D )是表现媒体。
A.图像 B.图像编码 C.电磁波 D.鼠标
A.图像 B.图像编码 C.电磁波 D.鼠标
颜色空间
一、颜色属性
视觉上的彩色可用下面参数来描述
- 色调:人眼看到一种或多种波长的光时所产生的彩色感觉。
- 明度:表示色所具有的亮度和暗度被称为明度
- 饱和度:指颜色的纯度,或者说是指颜色的深浅程度。
二、颜色空间
三原色原理是指自然界的各种颜色光,都可由红®、绿(G)、蓝(B) 三种颜色按不同比例相配制而成。所以称这3种颜色为三基色。
- (1) RGB颜色空间
- (2) YUV颜色空间
数字化位通常采用Y:U:V-8:4:4或者Y:U:V-8:2:2 - (3) CMY颜色空间
三、图形与图像
1.图像
图像也称为位图或点阵图,是由排成行列的像素组成的。
常把一幅位图图像作为一个点矩阵处理,矩阵中的一个元素(像素)对应图像的一个点。
2.图形
图形也称矢量图形,是用一个指令集合来描述的,这些指令用来描述图中线条的形状、位置、颜色等各种属性和参数。
特点是放大后图像不会失真,和分辨率无关。
3.分辨率
图形(图像)的主要指标有分辨率、点距、色彩数(灰度)。
(1)分辨率:可以分为屏幕分辨率和输出分辨率,单位:dpi(像 素每英寸)。
- 水*分辨率是指水*方向(横向)总的像素点数。
- 垂直分辨率是指垂直方向(坚向)总的像素点数。
分辨率越高,所包含像素越多,图像越清晰,印刷质量就越好。
(2)点距:指两个像素之间的距离,一般来说,分辨率越高, 则像素点距的规格越小,显示效果越好。
(3)深度:是指显示或存储每个像素所用的位数。
例如:某图像的分辨率为640×480,假设每个像素深度为16位 ,则该图像的容量(大小)为( )字节
640×480×(16÷8)=614400B=600KB
数据压缩技术
一、数据压缩技术分为两大类:
- 无损压缩编码法,也称为冗余压缩法、熵编码法
- 有损压缩编码法,也称为熵压缩法
注:把信息中排除了冗余后的*均信息量称为“信息熵”
(1)无损压缩法
去掉或减少了数据的冗余,这些冗余值可以重新插入到数据中, 因此是可逆的,也是无失真压缩。
它通常使用的是统计编码技术,包括哈夫曼编码、算术编码、行程编码等。它的压缩率比较低,通常是2:1 --5:1。
(2)有损压缩法
压缩了熵,会减少信息量,因此是不可逆的。它通常可以分为特征抽取和量化两大类。
- 特征抽取包括基于模式的编码、分形编码等;
- 量化包括零记忆量化、预测编码、直接映射、变换编码等方 法。其中,预测编码和变换编码是最常见的方法。
有损压缩能够达到较高的压缩比。对于声音可达4:1~8:1,对于动态的视频数据可达100:1~400:1。
二、数据压缩标准
(1) JPEG (联合图像专家组)
(2) MPEG(动态图像专家组)
(3) DVI(数字视频接口)
(4) H.261
(5) H.263
音频数据
一、音频技术概述
声音的三个要素是:
- 音强:即音量,是声音的强度,取决于声间的振幅。
- 音调:由声音的频率决定。
- 音色:又叫音品,指声音的感觉特性。不同的发声体由于材料、结构不同,发出声音的音色就不同。物体振动,除了一 个基音外,还有许多不同频率(振动的速度)的泛音伴随, 正是这些泛音决定了其不同的音色。
二、音频数据存储和传输
模拟信号转化数字信号过程
采样 量化 编码
(1)采样
每隔一个时间间隔就在模拟声音的波形上取一个幅度值,这个间隔时间称为采样频率。 常用的采样频率为8kHz、11.025kHz、16kHz、22.05kHz(FM广播音 质)、44.1kHz (CD音质)、48kHz (DVD音频或专业领域),频率越高音质越好。采样频率不应低于声音信号最高频率的两倍。
(2)量化
就是把经过采样得到的瞬时值将其幅度离散,即用一组规定的电*,把瞬时抽样值用最接*的电*值来表示。 量化的级别通常用位(bit)来表示,位数越高则音质越好。
(3)编码
将声音数据写成计算机的数据格式。
每秒钟所需的存储量可由下式估算出:
文件的字节数=采样频率(Hz)×采样位数×声道数÷8
三、音频数据格式
(1) WAVE
(2) MOD
(3) Layer-3
(4) Real Audio
(5) CD Audio
(6) MIDI
(7) CMF