返回首页

多媒体技术 知识点考试重点

时间:2012-06-27 17:39来源:2018年最新注册送彩金www.zhixing123.cn 编辑:麦田守望者

第 1 章

多媒体:是融合两种或两种以上媒体的人——机互动的信息交流和传播媒体。

超文本:是包含指向其它文档或文档元素的指针的电子文档。

超媒体:不仅可以包含文字,还可以包含图形、图像、动画、声音和视频片段,这些媒体之间也使用超级链接组织的,而且他们之间的链接也是错综复杂的。

多媒体系统的组成:包含4个层次:基础、系统、服务、使用

为什么要压缩:多媒体数据具有数据量大和数据速率高的特点,压缩数据的目的就是要降低多媒体数据对存储器容量和传输宽带的要求,减少宝贵资源的消耗。

从压缩后数据损失特点分,压缩技术分哪两种:有损压缩和无损压缩

三种类型的编码:熵编码(无损)、源编码(有损)、混合编码(有损)

压缩与编码的关系:
 

光盘的种类:CD、DVD、HD DVD、BD

常用光盘(VCD、DVD)的容量大小:VCD单层存储量650MB

DVD单层存储量4.7GB双层存储量8.5GB

因特网:是通过网络设备把世界各国使用TCP/IP协议的计算机相互连接在一起的计算机网络,是世界上规模最大、用户最多的计算机网络,是20世纪全球发展最迅速、影响最深远和冲击最大的信息存储和处理工具。

万维网的概念:是在因特网上运行的全球性分布式多么体信息系统,实际上就是分布在全世界所有HTTP服务机上相互链接的超文本文档的集合。

多媒体国际标准 :

四大标准化组织(ITU、ISO/IEC、因特网标准化组织、W3C)

数据:是指以数字、字符或图像等可读语言或其他记录方法表示的事实、概念或计算机指令。

内容:内容是对数据的描述

信息:是数据的含义

知识:是在某个感兴趣领域中的事实、概念和关系

智慧:知识累计后产生的洞察力、判断力和发明创造能力
 

第 2章

冗余:(1)人为冗余:在信息处理系统中,使用两台计算机做同样的工作是提高系统可靠性的一种措施—此种冗余乃有意为之。在数据存储和传输中,为了检测和恢复在数据存储或数据传输过程中出现的错误,根据使用的算法的要求,在数据存储或数据传输之前把额外的数据添加到用户数据中,这个额外的数据就是冗余数据—比如数字签名、水印等等;

(2)视听冗余:由于人的视觉系统和听觉系统的局限性,在图像数据和声音数据中,有些数据确实是多余的,使用算法将其去掉后并不会丢失实质性的信息或含义,对理解数据表达的信息几乎没有影响;

(3)数据冗余:不考虑数据来源时,单纯数据集中也可能存在多余的数据,去掉这些多余数据并不会丢失任何信息,这种冗余称为数据冗余,而且还可定量表达。

决策量:在有限数目的互斥事件中,决策量是事件数的对数值,在数学上表示为:

H0=log(n),其中n是事件数

信息量:具有确定概率事件的信息的定量数量,在数学上定义为:

I(x) =log2 [1/p(x)]=-log2[1/p(x)]

熵:事件的信息量的平均值,也称事件的平均信息量,用数学表示为:

 

数据冗余量的计算方法:在信息论中,数据的冗余量(R)定义为决策量(H0)超过熵(H)的量,数学上表示为:R= H0-H

统计编码:是给已知统计信息的符号分配代码的数据无损压缩方式。

特点:香农-范诺编码和霍夫曼编码的原理相同,都是根据符号集中各个符号出现的频繁程度来编码,出现次数越多的符号,给它分配的代码位数越少;算术编码使用0和1之间的实数的间隔长度代表概率大小,概率越大间隔越长,编码效率可接近于熵

三种统计编码方式:香农-范诺编码、霍夫曼编码、算数编码。

霍夫曼编码的实现过程:例1:计算

(1) 该字符串的霍夫曼码;(2) 该字符串的熵;(3) 该字符串的平均码长;(4) 编码前后的压缩比。详见P28

例2:编码前

n N = 8 symbols: {a,b,c,d,e,f,g,h},

n 3 bits per symbol (N =23=8)

P(a) = 0.01, P(b)=0.02, P(c)=0.05, P(d)=0.09, P(e)=0.18, P(f)=0.2, P(g)=0.2, P(h)=0.25

计算:(1) 该字符串的霍夫曼码;(2) 该字符串的熵;(3) 该字符串的平均码长;(4) 编码效率。

Average length per symbol (before coding):

 

 


 

(2) Entropy:

 

(3) Average length per symbol (with Huffman coding):

 

 


 

(4) Efficiency of the code:

 

 


 

行程长度编码:是数据无损压缩技术。它利用数据单有相同数值这一特点对数据进行压缩。在编时,对相同的数值只编码一次,同时计算相同数值连续重复的次数,称为“行程长度”。

词典编码的思想:第一类算法的思想是,企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串代替重复的部分,它的输出仅仅是指向早期出现过的字符串的“指针”。

第二类算法的思想是,企图从输入的数据中创建一个“短语词典”,这种短语不一定是像“严谨勤奋求实创新”和“国泰民安是坐稳总统宝座的根本”这类具有具体含义的短语,它可以是任意字符的组合。编码数据过程中当遇到已经在词典中出现的“短语“时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。

第3 章

声音是什么:声音是听觉器官对声波的感知,而声波是通过空气或其他媒体传播的连续振动。声音是一种连续的波。

频率范围:声音:20-----20000Hz

音频:20----20000Hz

话音:300-----3400Hz

声音信号数字化过程包含的步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值。

声音信号采样数据量的计算方法:出计算题 (P47)

声音质量的 MOS评分标准:

5 分制 MOS评分标准:对声音主观质量度量比较通用的标准是5分制

分数

质量级别

失真级别

5

优(Excellent)

无察觉

4

良(Good)

(刚)察觉但不讨厌

3

中(Fair)

(察觉)有点讨厌

2

差(Poor)

讨厌但不反感

1

劣(Bad)

极讨厌(令人反感)

脉冲编码调制(PCM):脉冲编码调制(PCM)是概念上最简单、理论上最完善的编码系统,是最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。

PCM编码原理框图

第 4 章

颜色的概念:颜色是视觉系统对可见光的感知结果。

图像的颜色模型:显示彩色图像用 RGB 相加混色模型;打印彩色图像用CMY 相减混色模型

图像的三个基本属性:图像分辨率;像素深度与阿尔法(α)通道;真彩色、伪彩色与直接色

矢量图的概念:矢量图是用一系列计算机指令描绘的图,如点、线、面、曲线、圆、矩形以及它们的组合。

矢量图的特点:

1. 目标图像的移动、缩小或放大、旋转、拷贝、属性(如线条变宽变细、颜色)变更都很容易做到

2. 相同或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可加速矢量图的生成,而且可减小矢量图的文件大小

位图的概念:位图是用像素值阵列表示的图。

位图的特点:

1. 位图的获取通常用扫描仪、数码相机、摄像机、录像机、视像光盘和相关的数字化设备

2. 位图文件占据的存储空间比较大

3. 影响位图文件大小的因素

图像分辨率:分辨率越高,表示组成一幅图的像素就越多,图像文件就越大

像素深度:像素深度越深,表达单个像素的颜色和亮度的位数越多,图像文件就越大

灰度图的概念:灰度图是只有明暗不同的像素而没有色彩像素组成的图像。

灰度图的特点:

1. 只有黑白两种颜色的图像称为单色图像(每个像素的像素值用一位存储,其值是“0”或“1”)

2. 用一个字节表示一个像素的灰度图(256级灰度)( 一幅640×480的灰度图像需要占据300 KB的存储空间)

彩色图的概念:每个像素包含颜色信息的图像。

彩色图的特点:可按照颜色的数目划分,如256色图像和真彩色图像等。

4.5 伽马(γ )校正

知识点:γ校正的概念、作用

γ校正的概念:伽马(γ )的概念-现实世界中几乎所有的CRT显示设备、摄影胶片和许多电子照相机的光电转换特性都是非线性的。这些非线性部件的输出与输入之间的关系(例如,电子摄像机的输出电压与场景中光强度的关系,CRT发射的光的强度与输入电压的关系)可以用一个幂函数来表示,它的一般形式是:

输出=(输入)γ

式中的γ (gamma)是幂函数的指数,它用来衡量非线性部件的转换特性。

所有CRT显示设备都有幂-律转换特性,如果生产厂家不加说明,那么它的γ 值大约等于2.5。用户对发光的磷光材料的特性可能无能为力去改变,因而也很难改变它的γ值。为使整个系统的γ 值接近于使用所要求的γ值,起码就要有一个能够提供γ校正的非线性部件,用来补偿CRT的非线性特性。

在所有广播电视系统中,γ 校正是在摄像机中完成的。

γ校正的作用:

为补偿显示设备非线性的显示特性而采用的校正技术。(所有CRT显示设备都有幂-律转换特性,就要有一个能够提供γ校正的非线性部件,用来补偿CRT的非线性特性。)

图像文件格式

知识点:了解常见的图像文件格式,如 BMP、GIF、、JPEG、PNG 格式

BMP位图格式是windows自带的“画图”软件使用的格式,GIF和JPG是因特网上几乎所有web浏览器都支持的图像文件格式,使用GIF文件格式的动画软件也得到了广泛使用。PNG是20世纪90年代中期开发的图像文件存储格式,其目的是企图替代GIF和TIFF格式。

BMP:bitmap的简写。位图文件(Bitmap-File,BMP)格式是windows采用的图像文件存储格式。

BMP位图文件可看成由4个部分组成:

u 位图文件头(bitmap-file header)

u 位图信息头(bitmap-information header)

u 彩色表(color table)

u 位图的字节(byte)阵列

GIF:GIF(Graphics Interchange Format)图像文件以数据块为单位来存储图像的相关信息。采用LZW压缩算法来压缩图像数据

JPEG:

PNG:(Portable Network Graphic Format)称为“便携网络图形格式”。20世纪90年代中期开始开发的图像文件存储格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG使用从LZ77派生的数据无损压缩算法。用来存储灰度图像时,灰度图像的深度可多达16位,存储彩色图像时,彩色图像的深度可多达48位,并且还可存储多达16位的α通道数据。

 

第五章

牛顿色圆的基本内容:牛顿色圆是度量颜色的一种方法,圆周表示色调,圆的半径表示饱和度,它可以方便概括相加混色原理,R、G、B是相加基色,C、M、Y是它的互补色.

颜色:是人的视觉系统对可见光的感知结果。

色调:又称色相,指颜色的外观,用于区别颜色的名称或颜色的种类,是视觉系统对一个区域呈现的颜色的感觉。

饱和度:是相对于明度的一个区域色彩,是指颜色的纯洁性,用来区别颜色的明暗程度。

亮度:是反映视觉特性的光谱敏感程度函数加权后得到的辐射功率,在555nm处达到峰值,它的幅度与物理功率成正比。

颜色空间:表示颜色的一种数学方法。

颜色度量体系:也叫颜色体制或颜色制,实际上就是人们组织和表示颜色的方法。

主要方法:颜色模型和编目系统。

5.6 CIE 颜色系统的基本思想、优点、缺点。

CIE 颜色系统的基本思想:

优点:

缺点:(1)该范围使用明度与色度不容易解释物理刺激与颜色感知响应之间的关系;

(2)XYZ系统和在它的色度图上表示的两种颜色之间的距离与颜色观察者感知的变化不一致,即感知均匀性的问题,也就是颜色之间数字上的差别与视觉感知不一致。

第 6 章

颜色空间的分类(P111):

1、从感知角度分:混合mixture型颜色、非线性亮度/色度(luma/chroma)性颜色空间、强度/饱和度/色调(intensity/saturation/hue)型颜色空间。

2、从技术角度分: RGB型颜色空间/计算机图形颜色空间、XYZ型颜色空间/CIE颜色空间、YUV型颜色空间/电视系统颜色空间。

计算机图形颜色空间有哪些类型 :

RGB、CMY、CMYK、HSV、HSL、HSB、HSI

设备无关的颜色空间有哪些类型 :CIE L*a*b*颜色空间

电视系统的颜色空间主要有哪些,分别在哪些场合有应用:

1、YUV:用在PAL和SECAM模拟彩色电视制式中, Y表示亮度,U和V表示两个色差分量

2、 YIQ:用在NTSC模拟彩色电视制式中, Y表示亮度,I和Q表示两个彩色分量

3、Y‘CbCr/Y’Cb‘ Cr’ :用于数字电视, 在ITU-R BT.601和BT.709等推荐标准中有明确的定义

4、Y‘PbPr/Y’Pb‘Pr’:用于高清晰度电视

这些颜色空间是亮度和色度(luminance-chrominance)分离的电视播送颜色空间(television transmission color spaces)

第 9 章

电视:捕获、广播和重现活动图像和声音的远程通信系统。

电视制:是传输图像和声音的方法

重现彩色图像的过程:见P192图

三种主要的彩色电视制及其主要特性:1.NTSC制:图像的宽高比为4:3,525条扫描线,隔行扫描,30帧每秒,视像带宽为4.2MHz,使用YIQ信号,色度信号用正交幅度调制,声音用调频制(FM)

2.PAL制:图像的宽高比为4:3,625条扫描线,隔行扫描,25帧每秒,视像带宽至少为4MHz,使用YUV信号,色度信号用正交幅度调制,声音用调频制(FM)。总的电视通道带宽为8MHz

3.SECAM制:SECAM制与PAL制具有相同的扫描线数(625线每帧)帧频(25帧每秒,50场每秒),和图像宽高比(4:3),视像带宽至高为6MHz,总带宽为8MHz

场频/场速率:每秒钟扫描的场数

帧频/帧速率:每秒钟扫描的帧数

行频/水平行速率:每秒钟扫描的行数

9.4 电视图像数字化

知识点:电视图像数字化方法;。

电视图像数字化方法:

(1)先从复合彩色电视图像中分离出颜色分量,然后数字化。

(2)首先用一个高速A/D转换器对彩色全电视信号进行数字化,然后在数字域中进行分离,以获得YCbCr、YUV、YIQ或RGB分量数据。

CIF电视图像格式:

 

? CIF电视图像格式: Common Intermediate Format的缩写,可称“公用中间分辨率格式”;CCITT规定的格式

? 用于625行和525行的电视图像

? 具体规格见表8-5,其中

n QCIF (Quarter-CIF)——1/4公用中间分辨率格式

n SQCIF(Sub-QCIF)——小1/4公用中间分辨率格式
 

图像子采样:对彩色电视图像进行采样时,如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样

数字电视:是用数字压缩技术和数字传输技术的远程通信系统

主要的数字电视的标准有哪三种:(1)美国的ATSC DTV(ATSC数字电视)标准(2)欧洲的DVB(数字电视广播)标准(3)日本的ISDB(综合业务数字广播)标准

HDTV:是具有正常视力的观众可得到与观看原始景物时的感受几乎相同的数字电视

HDTV 格式的电视图像的主要特点(1)HDTV屏幕的宽高比均为16:9(2)电视画面可用1920*1080像素和1280*720像素两种尺寸(3)扫描方式为隔行扫描或逐行扫描

SDTV 格式电视图像的主要特点:(1)垂直分辨率可为576、288、480或240(2)图像的扫描方式可隔行扫描也可以逐行扫描,刷新频率可为25Hz也可以为30Hz(3)宽高比为16:9

第十章

10.1什么是 MPEG;MPEG 标准开发的主要进程。

MPEG是在1988年5月由国际标准化组织和国际电工委员会联合成立的专家组,专家组开发的标准称为MPEG标准。

MPEG标准开发的主要进程:

MPEG-1:1992年发布的数字电视标准;

MPEG-2:1994年发布的数字电视标准;

MPEG-3:最初设想是开发HDTV标准,最后发现MPEG-2可以满足,于1992年停止开发;

MPEG-4:1999年发布的多媒体应用标准;

MPEG-5:直到2007年9月还没有定义;

MPEG-6:直到2007年9月还没有定义;

MPEG-7: 2001年发布的多媒体内容描述接口的标准;

MPEG-21: 2000年启动开发的多媒体框架标准;

MPEG-A:多媒体应用格式标准;

MPEG-B:为专用系统提供系统技术标准;

MPEG-C:为专用电视提供电视技术标准;

MPEG-D:为专用声音提供声音技术标准;

MPEG-E:为应用程序提供下载和执行功能的多媒体中间件标准;

10.2 MPEG-1 标准的主要内容、主要应用。

MPEG-1 标准的主要内容:

Part 1 (MPEG-1 System):视像数据、声音数据及其他相关数据的同步

Part 2 (MPEG-1 Video):电视数据的编码和解码

Part 3 (MPEG-1 Audio):声音数据的编码和解码

Part 4 (MPEG-1 Conformance Testing):说明如何测试位流(bit stream)和解码器是否满足Part 1,Part 2和Part 3所规定的要求

Part 5 (MPEG-1 Software Simulation):1994年认可的包含C语言代码的参考软件(Reference Software),并给出了用参考软件执行前3个部分的结果

MPEG-1 标准的主要应用:用于在CD光盘上存储数字影视、在网络上传输数字影视及存放mp3格式的数字音乐节目。

10.3 MPEG-2 数字电视标准

MPEG-2 标准的主要内容:

(1) 视像编码和声音编码;(2)数据打包和多路数据复合

MPEG-2 标准的主要应用: 典型应用是DVD影视和广播级质量的数字电视,包括美国的ATSC DTV、欧洲的DVB以及日本的ISDB。MPEG-2也是在因特网上传输数字电视的标准

10.4 MPEG-4 视听对象编码

MPEG-4 标准的主要内容:由编码和解码两大部分组成

MPEG-4 标准的主要应用:计算机、影视、通信等方面。

什么是H.264 标准: H.264是一种视频高压缩技术,全称是MPEG-4 AVC,用中文说是“活动图像专家组-4的高等视频编码”,或称为MPEG-4 Part10。

10.5 MPEG-7 标准的主要内容:

Part 1 (MPEG-7 Systems) — 系统标准: 阐述MPEG-7标准的框架结构

Part 2 (MPEG-7 Description Definition Language)—描述定义语言:定义MPEG-7描述工具的语法和定义新的描述方案(Description Schemes)

Part 3 (MPEG-7 Visual) — 可视内容描述:规范描述可视内容的描述工具

Part 4 (MPEG-7 Audio) — 声音内容描述:规范描述声音内容的描述工具

Part 5 (MPEG-7 Multimedia Description Schemes) — 多媒体描述方案:规范描述一般特性和描述多媒体的描述工具。

MPEG-7 标准的主要应用: 数字图书馆(如影视目录)、多媒体目录服务(如黄页)、广播媒体(如无线电频道,TV频道等)、多媒体编辑(如新闻服务、多媒体创作)

MPEG-21 标准: 2000年启动开发的多媒体框架(Multimedia Framework)标准(ISO/IEC 21000)。

开发MPEG-21 的背景是怎样的:尽管有MPEG-1, MPEG-2, MPEG-4和MPEG-7标准,但在多媒体内容的发行和使用方面,要达到完全协调工作,还需要有能够把已有和正在开发的标准和技术融合在一起的标准,这就是MPEG专家组开发MPEG-21标准的出发点,俗称为“胶水标准(glue-standardization)”。

第 12章

视像数据的冗余:视频之所以能够被压缩,主要是视像数据中存在大量冗余的数据。

包括的方面:(1)时间冗余;(2)空间冗余;(3)结构冗余;(4)视觉冗余;(5)知识冗余;(6)数据冗余;

第14章

CD盘的基本结构 P331

1、盘片结构:CD主要由保护层、反射激光的铝反射层、刻槽和聚碳酸酯衬垫组成

两种反射层

铝反射层:银白色,称为“银盘”,只读的光盘

金反射层:金色,称为“金盘”,可刻录的光盘,称为CD-R (CD-Recordable)盘

激光唱盘分为3个区:导入区、导出区和声音数据记录区

2、光道结构:磁盘的磁道是同心环,而CD光道是螺旋形的;磁盘的数目很多,而CD唱盘的物理光道只有一条,长度大约为5千米。

CD盘写入、读出数据的基本原理 P332

激光唱盘是利用在盘上压制凹坑的机械办法,利用凹坑的边缘来记录“1”,而凹坑和非凹坑的平坦部分记录“0”,使用激光来读出。

1、写入:CD上的数据是用压模冲压而成的,而压模是用原版盘制成的。在制作原版盘时,用编码后的二进制数据去调制聚焦激光束,如果写入的数据为“0”,就不让激光束通过,写入“1”时,就让激光束通过,或者相反。在制作原版盘的玻璃盘上涂有感光胶,曝光的地方经化学处理后就形成凹坑,没有曝光的地方保持原样,二进制信息就以这样的形式刻录在原版盘上。

2、读出:光盘上压制了许多凹坑,激光束在凹坑部分反射的光强度,要比从非凹坑部分反射的光强度弱,光盘就是利用这个极其简单的原理来区分“1”和“0”。凹坑的边缘代表“1”,凹坑和非凹坑的平坦部分代表“0”,凹坑的长度和非凹坑的长度都代表有多少个“0”。

CD如何批量生产?

激光唱盘(CD-DA)、数字激光视盘(VCD)和CD-ROM的制作过程都相同,大致分成三个阶段:1、原版盘预制作或称母盘预制作;2、原版盘制作或称母盘制作;3、大批量复制。

什么是DVD? DVD原名是Digital Video Disc的缩写,意思是“数字电视光盘(系统)”,这是为了与Video CD相区别。

DVD的存储容量是怎样提高的?

顶一下
(5)
100%
踩一下
(0)
0%
标签(Tag):多媒体技术
------分隔线----------------------------
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片
猜你感兴趣
博聚网