首页 优秀范文 图像分析论文

图像分析论文赏析八篇

时间:2022-06-15 10:48:41

图像分析论文

图像分析论文第1篇

关键词:图像监控应用

乌溪江电厂位于浙西乌溪江流域内,分上下2个电站,是浙江省电网主力调峰梯级电厂。

电厂生产基地、办公大楼设在衢州市区内,距离黄坛口电站16km,距离湖南镇电站34km。全厂共11台机组的梯调中心设在黄坛口电站内。乌溪江电厂设备多、分布面广、相距距离远,运行检查和保安均极为不便。为适应无人值班(少人值守)改革的需求,在实现了计算机监控基础上,又投入运行了远程图像监视系统,大大提高了监视控制系统的灵活性,增强电厂的监测水平,改善电厂的运行环境,减轻运行及有关工作人员的劳动强度,提高了设备安全和经济运行水平。

1系统特点

(1)采用IP组播和RTP/RTCP技术,多个监控终端可同时监控一个终端。图像监控主机可自动检测网络流量,根据网络上的负荷,自动控制上网图像数据流。在有太多的图像需要发送到MIS网上时,可根据用户优先级调整图像数据带宽,并控制图像数据进入同组网络的路数,从而避免了网络拥塞。

(2)单向图像编码方式采用MPEG-1国际图像压缩标准,即VCD的图像压缩标准。其帧率为25帧/s,纯图像数据码流为1.15Mbps,分辨率达到352×288。该编码方式图像清晰,色彩丰富,无延时,无动画感。

(3)双向图像编码方式为H.261国际图像压缩标准,是一种用于会议电视的图像压缩方法,其帧率为25帧/s,纯图像数据码流为384k/s~768k/s,分辨率达到352×288,该压缩方式图像清晰,色彩丰富,无动画感。

(4)音频编码方式采用G.711PCM编码方式,码流达64k/s,该压缩方式声音清晰,无失真。

(5)监控终端将编码后的视频数据,通过IP网络转发到监控中心或监控终端,采用Multicast组波技术和先进的网络管理技术,将MIS网上的图像监控用户按地址分组,若组内没有用户调用某一路图像,则该路图像数据不会发到这一组用户的网络上,只发有人调用的组,从而大大减少网络阻塞的可能性。

(6)由图像监控管理服务器负责整个监控系统的配置,状态管理等,它是整个图像监控系统的交互中心。

(7)采用多级、多路分控方式。利用两站三地之间均已建立的100MMIS网和光纤2M口高速通道作为视频信号、音频信号和控制信号的通讯通道。正常情况下同时在MIS网络上通讯有7路图像。

(8)该系统有三个分控站,六个监控站。各个分控站所管辖的监控点,近距离的监控点视频信号通过同轴电缆送至其分控站矩阵,而一些距离较远(距离>1000m)的监控点视频信号由差分传输器通过双绞线差分方式送至其分控站矩阵。湖站新厂房分控站的视频信号先通过光缆送至湖站控制室,然后通过HUB上100MMIS网。湖站和黄站两分控站的视频信号则直接通过HUB上100MMIS网。所有分控站和监控站都可以通过本地主机或MIS主机控制前方任何一台摄像机。所有摄像机云台、镜头和灯光控制都采用RS485控制方式控制。

2系统结构及硬件配置

(1)视频监控服务器安装在梯调中心,包括有一台系统管理服务器和一台显示器及相关设备。该服务器除转发视音频数据外,还完成对整个监控系统的管理,如优先权、用户权限、日志、控制协商、报警记录等等。

(2)在黄坛口梯调中心和湖南镇电站共安装了3个分控中心。主要设备有:监控主机、显示器、视频切换矩阵、一台九画面分割器、双向音视频监控套件、网络型视频解码器、视频传输编码器、交换式HUB、UPS、图像监视墙等相关设备。

(3)各监控站设备利用原MIS主机,装上相应的软(硬)件,经过授权就可以监控各分控站的所有的摄像机。

这次湖黄两站总共安装了111台摄像机(包括前二期工程安装的),其中湖南镇电站58台,黄坛口电站53台。摄像机安装地点遍及全厂所有设备安装地点。在梯调中心的电视墙上最多能同时显示24路不同的实时图像,在湖站站调监视器上最多能同时显示10路不同的实时图像。这一切为运行人员巡回检查带来很大的方便,也为运行工作节省了大量的人力和物力。

3系统功能概述

这套系统包含以下功能:

(1)遥控操作功能。通过梯调中心或中控室计算机的鼠标器即可对所有现场安装点设备(包括湖、黄两站的所有摄像机)进行遥控操作。比如:转动云台、调整焦距、变倍长短、打开照明(包括开关站本身的照明系统和摄像机本身所带的射灯)等功能。

(2)本地和远程摄像机切换与控制,远程灯光控制(黄站对黄站摄像机、湖站对湖站摄像机、黄站对湖站摄像机、湖站老厂对新厂摄像机、湖站对黄站摄像机)。

(3)多级分控功能。系统采用多级、多路分控,系统调用控制有优先级之分。

(4)与MIS系统接口,有关人员能通过MIS系统的计算机操作控制前端设备,可进行可视对讲,保卫部能对部分前端设备进行监视控制。具有多点对一点和一点对多点的监视功能,系统具有双向会议电视功能。能在湖黄两站之间、湖黄两站与衢州基地会议室之间进行可视对讲;可视对讲视音频同步,且声音清晰,图像清楚。

(5)图像丢失检测。当前端设备因故障或被盗等原因造成图像丢失时能在多媒体操作站给出“××部位视频故障”语音报警,并弹出电子地图(实际立体图形),并显示所在地的位置,以颜色或闪烁指示。

(6)视、音频切换。每一台监视器(CRT)可观看任何一路图像信号。同时,每一台监视器能自动切换图像、定时、定点扫描功能等。在梯调中心设立的八个监视器组成电视墙,电视墙画面具有切换功能,电视墙上任一监视器能切换到湖黄两站任一摄像机图像。

(7)控制权协商功能。当不同操作者控制同一摄像机,系统只允许其中一个操作者行使控制权,控制权在不同操作者之间转移按优先级协商。优先级较高者可以接管优先级较低者控制权,而仅在低优先级终端上给出提示;优先级较低者要取得控制权时,需要取得优先级较高者同意;只有后者同意的条件,才能取得摄像机的切换和控制权.

(8)报警自动处理功能:

1)对于重要监视点,系统有报警信号(视、音频)、自动录像、CRT图像自动切换并且备份等功能。

2)对报警器发出的报警信号,在就近岗亭发出警铃声,并通过指示灯确定具体报警位置。能自动将其前端摄像机快速跟踪到报警点,同时在保卫部显示器上快速推出界面,保卫部录像机自动启动录像。

3)对于电厂的开关、闸刀变位信号,能自动将与其相关的前端摄像机快速跟踪到相关的变位点,梯调和相关的站调主机显示器推出电子地图,实现报警点闪烁,并能快速便捷进入故障点画面,同时在梯调中心电视墙上自动推出相关变位点画面。

4)能实现对开关站部分电气设备的发热报警自动巡检,发现某点过热能自动报警并弹出电子地图,实现发热点闪烁。

5)水位自动报警功能。对电厂的集水井水位过高,能自动给出报警信号,并在监视器上推出实际图像.

(9)在梯调中心和湖站中控室的计算机和电视墙上能对图像实现九画面分割,九画面能实现任意组合,可以由湖黄两站任意摄像机组合成实时画面。

(10)多层次电子地图功能:显示各监视点周围的环境、设备、模拟地形图等信息。比如鼠标器触发电子地图中的摄象机图标即可在显示器上显示该路图像。

(11)具有手动本地、远程录像及录像回放和本地、远程摄像机循环切换显示功能。

(12)系统操作、登录、报警及系统错误事件在服务器上有详细记录,通过事件记录系统管理员对整个工业电视系统运行情况有全面认识。对任一用户,系统可以据生产需要给予或删除各种权限,便于系统管理。并且操作人员可对事件进行分类检索、保存及删除

(13)系统服务器具有统一授时功能。

4运行情况

图像分析论文第2篇

摘 要:对人脸和指静脉在决策层的融合识别,给出一种新的组合图像质量评价方法,并采用一种改进的基于图像质量加权的D-S证据理论融合这两种生物特征。首先,组合图像质量评价法采用清晰度和对比度、相关系数的组合方法来评价生物特征图像质量;其次,应用改进的基于图像质量的匹配值增强方法和D-S证据理论,减少了极大值图像质量指标的影响,使图像质量加权与实际情况更趋一致。实验结果表明,与没有考虑图像质量因素相比,考虑了图像质量信息的D-S证据理论融合方法提高了识别效果。

关键词:人脸;指静脉;独立成分分析;主元分析;图像质量;D-S证据理论

中图分类号: TP391.413 文献标志码:A

Abstract: For the fusing recognition with face and finger-vein at decision level, a new quality score of image by combining three indexes was presented, and an improved fusion strategy based on D-S evident theory was adopted to fuse two biometric characteristics. At first, the quality score of image was computed by combining index of distinct, contrast and coefficient. Then an improved method based on image quality and D-S evident theory was adopted. This improved method reduced the impact of maximum of image quality score and made the weighted parameter with the actual situation more consistent. Compared with the result of D-S evident theory with no regard to image quality, the results reveal that the fusion method in this paper based on D-S evident theory taking account of image quality information improves the performance.

Key words: human face; finger-vein; Independent Component Analysis (ICA); Principal Component Analysis (PCA); image quality; D-S evident theory

0 引言

生物特征识别技术为身份识别和信息安全等领域提供了一条便捷、高效、安全的新途径。目前常见的生物特征识别技术有人脸、指纹、虹膜、指形、静脉、掌纹、步态以及签名等识别技术,其中指纹和人脸识别技术则是最成熟、应用最广泛的技术。

然而这些生物识别方式都有各自的缺点,尚无能取代所有其他生物特征识别的特征,尤其是一些生物特征可能被复制和伪造,影响其安全性。但若能采用融合理论,综合多个生物特征,从理论和实践上都表明能得到比单一生物特征更优的识别性能和通用性[1-3]。

图像质量对生物特征识别系统的识别性能影响很大,对信息完整、图像质量高的样本库所获得的识别率,可能因为图像质量下降而迅速降低。文献[4-10]都对基于图像质量的生物特征做了深入的研究,取得较大进展。其中,Nandakumar等以虹膜和指纹为融合对象,对每次需要匹配的单个待测样本和模板样本的图像质量做出评价,给出一种基于图像质量的似然率指标,对此进行融合得到了满意的识别结论[4]。文献[5]则给出一种新的基于贝叶斯网络的基于图像质量的多生物特征融合系统,将生物特征图像质量和匹配值看作同等地位的量,用贝叶斯网络融合识别。Richiardi等对基于图像质量的语音、人脸、指纹和签名的图像质量评价指标作了综述并分析了将图像质量信息应用到多生物特征融合识别的方法[8]。Fierrez-Aguilara等在文献中分别就指纹与签名、指纹与语音的基于图像质量的融合方法做了分析,主要思路是在每次计算匹配值时考虑图像质量指标,再用基于支持向量机的方法进行融合[10]。

本文结合人脸和手指静脉两种生物特征进行融合识别,以提高识别的精确性和系统的通用性。针对图像采集中易产生噪声干扰,受光照等因素影响而生成质量差的图像,尤其是手指静脉图像采集困难,实现了一种基于图像质量信息加权的D-S证据理论融合手指静脉和人脸特征量的多特征融合识别系统。

1 融合识别系统结构

选择指静脉和人脸进行融合识别出于如下的考虑:静脉识别技术因可实现活体检测,具有更好的精确度和稳定性;速度快、特征唯一,安全性好;且静脉识别以非接触的方式进行认证,也易于被人们接受,并减少因皮肤表面的皱纹及污垢的干扰。而人脸识别作为一种被动识别方式,易于被人接受,也是目前实用化程度较高的一种生物特征识别方法。选择人脸和指静脉进行多生物特征融合识别,可利用人脸识别中成熟的识别算法,并发挥的指静脉识别精度高、不易被伪造的优势,形成互补。

考虑图像质量因素的影响,一种新的基于图像质量的加权D-S证据理论融合系统的结构如图1所示。

由于尚无公开的多生物特征测试数据库,这里选择ORL人脸库[11]和指静脉库[12]组成多生物特征库,包含40个对象,每人10幅人脸和指静脉图像,人为组合组成测试数据库,如图2(a)~(d)所示是其中的4组样本,这种人为的指定并不影响对融合结果的实验效果。

2 生物特征抽取

2.1 基于独立成分分析的指静脉特征抽取

静脉图像匹配方法包括结构匹配、模板匹配等,然后根据实验数据得到的阈值进行判断。

目前的静脉识别方法多集中在模板匹配或细节特征点匹配[13-15]、Gabor滤波和编码[16]等,例如Wan等提出基于细节点特征提取的指纹静脉提取方法,通过匹配汇合点和分叉点的方法实现手指静脉识别[14]。但较少利用静脉图像的全局信息或整体纹理信息进行分析的。这里借鉴独立成分分析在人脸、掌纹等生物特征识别中的应用[17-18],采用基于独立成分分析的方法来抽取特征量,具体步骤如下。

1)归一化图像。

为了方便处理和简化计算,将大小为376×328的原始图像剪切成为150×150大小图像。将该矩阵的每个列向量提出来串接成为一个列向量。新的列向量表示一幅原始图像,所以待处理的n幅图像就组成n×2250的一个矩阵N。

2)对N做独立成分分析。

采用FastICA算法[19],对N做去均值后,FastICA首先对数据做主元分析(Principal Component Analysis, PCA),保留主要信息的基础上,压缩数据;然后进行独立成分提取,经过独立成分分析法抽取特征后所得指静脉基图像的部分示例如图3所示。

补充图3中每个子图的图名。

2.2 基于主元分析的人脸特征抽取主元分析法抽取人脸特征

人脸识别作为生物特征识别中研究最早也较成熟的方法之一,特征提取方法有基于代数的特征提取方法,如最基本的独立成分分析法、主元分析法和线性判别分析法等。Turk等首先提出基于主元分析的特征脸概念,并取得很好的识别效果[20]。其基本思路是将人脸图像数据用基于二阶统计矩的提取方法,映射到主元分量子空间。这里为了分析手指静脉图像和人脸进行融合对识别性能的影响,选用主元分析的方法提取人脸特征。

对ORL人脸库做基于主元分析法的特征提取,首先计算人脸库的人脸图像平均值,然后求取基于主元分析的特征脸,如图4所示为基于主元分析法特征抽取后的部分特征脸示例。

3 基于图像质量信息的人脸和手指静脉特征融合

生物特征的图像质量对识别性能有重要的影响,随着图像质量的下降,识别率将迅速降低,甚至会导致错误的识别结果。而人脸图像的采集容易受光照、采集角度的影响;手指静脉作为一种新兴的生物特征方法,其图像采集更易受可见光、被采集个体等因素的影响,较易产生清晰度差、对比度弱的图像。针对这个存在较差图像质量的情况,若能够在识别过程进行前,对样本的质量信息进行量化,并弱化质量差的信号的影响,将有可能提高系统的识别性能。下面先给出一种组合的图像质量评价方法。

3.1 图像质量评估

图像质量是图像的一个重要信息,对图像质量的评价量主要有主观评价和客观评价,主观评价由人们根据自己的视觉感受,根据视觉效果做出评判,受主观因素影响较大;客观评价以图像内容的数学表示,通过定义定量的数学质量指标,进而判断图像信息[21-23]。客观评价标准分无参考和有参考两大类。有参考的图像质量评价量根据待测图像和标准图像之间的差异性来判断,差异性越大,说明图像质量与标准图像相差越大,质量越差,常用的指标有峰值信噪比和均方误差等。但应用过程中,标准图像的较难选择或找不到合适的量。图像质量评价的主要问题是评价指标的通用性差,对某些图像,有些指标甚至背离了人类视觉感受。

常用的图像质量评价可根据结构信息相似量、图像中包含信息量多少、图像对比度、清晰度和图像边缘信息等角度进行分析。以下是几种主要客观图像质量评价度量指标。

1)无参考图像质量指标。

无参考图像质量指标有图像的均值、图像的方差、图像的熵、拉普拉斯和值等。图像的熵的定义为:

H=-∑L-1i=0p(i) ln p(i)(1)

其中p(i)是灰度i的分布概率。该指标表示图像包含平均信息量多少的度量。熵值越大说明图像包含信息量越多。

2)有参考图像质量指标。

有参考图像质量指标有均方根误差、峰值信噪比、相关系数、结构相似度等。皮尔松相关系数定义为:

Qp=corrcoeff(IA,I)(2)

其中:I为待测图像,IA训练样本平均值,Qp为图像质量的量度值。

3)亮度对比值。

人们观察图像时,对局部区域的绝对亮度不敏感,对局部区域与相邻区域的相对亮度变化敏感,根据这一特点将图像划分成N×N的不重叠的子图像,第(m,n)个块的亮度对比度值定义为其亮度的标准差[21]:

Ic(m,n)=1N×N ∑n×N+Nj=n×N+1 ∑m×N+Ni=m×N+1(I(i, j)-I(m,n))2(3)

4)图像清晰度指标[22-23]。

清晰度方法是利用相邻像素点的差异来度量图像清晰度。利用高斯拉普拉斯算子:

LOG(x,y)是L0G,还是数学上的对数书写形式Log?即中间的是零,还是字符“o”?请明确。=-1πδ41-x2+y22δ2exp-x2+y22δ2(4)

其中:σ为高斯函数的标准方差,其值较小时,锐化图像;反之则平滑图像。常用大小为5×5的高斯拉普拉斯算子。

利用待测图像与高斯拉普拉斯算子卷积后的水平像素灰度均值来定义图像清晰度[22]:

Q0(y)=∑yI(x,y)*LOG这个“LoG”中,中间的字母是“o”,还是零?请明确。(x,y)(5)

Qq=1N∑yQ0(y)(6)

其中N为图像高度。若图像清晰,对应的Qq值大;反之若图像模糊,则每个像素附近的灰度值变化很小,对应的图像高频量小,Qq值也小。

5)组合的图像质量评价法方法。

本文根据图像质量评价指标的特点,综合图像清晰度Qq、亮度对比度Ic和相关系数Qp的质量评价指标,定义整体质量评价量为:

Qs=W1Qq+W2Ic+W2Qp(7)

图5是一组图像质量由好到差的样本,除了个体因素的差异外,主要是图像采集装置性能、光照条件等都不可能完全一致,导致了存在一定量的较差图像质量样本。其中图(a)、(b)图纹理清晰,对比度好,图(c)对比度强,图(d)、(e)质量较弱。

根据计算结果和主观评价赋予权值量W1,W2,W3分布为1,0.5,0.5。最后所得Qs如表1所示,所得结果和主观评价基本符合,能够反映图像清晰度和对比度,体现了人眼对图像质量的主观感受。

下面分析一种基于图像质量的加权D-S证据理论融合方法,来探讨考虑图像质量信息后对识别性能的影响。

3.2 基于图像质量加权的证据理论融合方法

由于待识别的对象个性差异及硬件因素,存在着图像噪声、图像质量差、所需生物特征信息缺损等不利因素,此外还有识别算法的内在缺陷,两个来自同一对象的生物特征可能得出不同的结果,这时常规的如加和、乘积、最大值法等融合策略的结果有可能比单生物特征识别还差。通过D-S证据理论对不确定信息的融合有望提高融合识别性能。

Vatsa等提出基于图像质量和Dezert-Smarandache理论的多个指纹特征融合识别方法[6]。首先对指纹图像的质量信息用基于冗余离散小波变换(Redundant Discrete Wavelet Transform, RDWT)方法求得度量值,然后对图像匹配值做基于图像质量评估度量值的增强,最后采用Dezert-Smarandache理论进行融合识别。

本文对Vatsa的对基于图像质量的图像匹配值增强方法作了改进,并对人脸和手指静脉图像进行基于图像质量D-S证据理论进行融合识别,具体方法如下。

先对图像采用式(7)方法计算图像质量的量化值:求出一组训练样本的平均值IA,然后计算每个待测样本的图像质量数Qs。

然后在D-S证据理论组合规则上,考虑图像质量因素的影响,将图像质量信息正则化,Vatsa采用Tanh方法,使得其范围在[0,1]。

在3.1节的图像质量评估分析中,本文采用组合的图像质量评估方法使其与主观评估相一致,但考虑到图像质量评估对不同光照、对比度和纹理等差别的反映情况不同,且通用性有限,其图像质量评估指标的最高值并不意味着该图像一定具有最强的可分性,本文对以上的图像质量信息正则化方法进行如下改进:

Qnorm=Qs-min(Qs)med(Qs)-min(Qs)(8)

该方法用中间值med(Qs)代替质量评估量化的最大值,减少图像质量最大值的影响,使正则化的结果更为恰当。

Vatsa采用的方法中对所有质量信息以阈值为0.5分作两种情况对特征匹配值进行基于图像质量的增强。根据本文采用的待融合生物特征,尤其是手指静脉图像,个别图像质量因光照和生物个体原因,难以根据该图像进行识别,根据这一情况,本文作如下改进,通过实验求得评估图像质量为差的阈值,该阈值以下的图像信息不参与融合识别。在图像质量分数值大于阈值时,可对特征匹配值进行基于图像质量的变换如式(9)所示:

Sqj=Qnormsj0.5, θ≤Qnorm≤0.5(1-Qnorm)sj0.5,0.5

下面采用D-S证据理论进行融合识别。Dempster于1967年提出D-S证据理论,之后Shafer用信任度函数和似然度函数扩展了该理论,成为处理不精确性的信息的数学方法,称做D-S证据理论[24-25]。该理论可看作对贝叶斯决策的推广,通过定义信任函数和似然函数把命题的不确定性问题转化成集合的不确定问题,解决因信息不完备或模糊性导致的不确定,只要求证据间相互独立。D-S证据理论已经成为不确定性决策的常用理论,可以用于决策分析或故障诊断等领域。

D-S证据理论作为表达和处理不确定性知识的数学工具,可有效处理单生物特征在识别系统中存在的冲突性和不确定性。利用人脸和手指静脉的基于D-S证据理论融合识别时,是由人脸和手指静脉两个识别子系统提供两个证据实现融合识别,其中首先需要确定每条证据的基本概率赋值函数。在此基础上,利用D-S证据理论的合成规则将相关证据生成一个新的证据,得到最后的可信度和判决结果。这里的证据信息来自两个识别子系统,保证了证据间相互独立。

定义U是完备的有限集合,用2U表示U所有子集和空集。

定义m(•)=2U[0,1],称做基本概率赋值,0表示完全不信任,1表示完全信任。对每个分类器有确认a和拒绝-a(-a=U-a)两个结果,计算相应的分类识别率作为基本概率赋值[6]。假设对一个输入模式类别为j(j∈c)被分配到包括拒绝类的k(k∈c+1)类,则分类器输出[24]为k的预测率Pk是输入模式正确分类的个数和被分类到k所有模式总数的比率。该方法表明对匹配值Sqj对第j个对象分类到k,所有对象被正确分类的可能性是Pkj,没有正确分类的可能性是1-Pkj,对第j个对象的基本概率赋值计算如式(10):

mj(k)=Pkj•sqj(10)

利用D-S证据组合规则,对多个证据的组合为:假定A,B用来计算焦元C新的信任函数,D-S证据组合规则:

m(C)=∑A∩B=Cm(A)m(B)1-∑A∩B=m(A)m(B)(11)

这里有两种生物特征对应两个分类器, j=1,2,在获得基本概率赋值后,利用基于证据理论的组合规则求:

mfinal=m1m2(12)

最后用阈值法进行判决。

判决结果=接受, mfinal≥t拒绝,其他 (13)

4 融合实验结果分析

本文选择ORL库和指纹静脉图像组合形成融合特征库。多生物特征库中每个对象每种特征的前5个样本进行训练,其余的样本进行测试。在进行同类测试和异类测试时候,计算欧几里得距离作为匹配值。采用基于图像质量因素的加权D-S证据理论融合,首先求取一组待融合的人脸和手指静脉图像的图像质量度量,根据第3章的方法将图像质量的信息增加到融合过程中。再采用D-S证据理论融合,对基本概率赋值进行组合,得到最后的融合结果。为评价和分析考虑图像质量信息的效果,与不考虑图像质量信息时的D-S证据理论融合作对比分析。将错误接受率(False Acceptance Rate, FAR)和错误拒绝率(False Rejection Rate, FRR)在同一坐标中表示的结果如图6所示,是对基于图像质量加权D-S证据理论融合和常规D-S证据理论融合的结果比较。

结果表明基于图像质量加权的D-S证据理论能降低识别结果的不确定性,提高识别性能,得到更好的识别效果。

已有较多研究工作[6-10]充分利用图像质量信息来提高识别系统的性能,这些文献中基于图像质量的融合识别不仅比单生物特征优越,也明显优于基本的Sum、加权和、最大或最小、乘积等融合策略,现将这些已有的考虑图像质量信息的融合方法加以比较,其中EER(Equal Error Rate)即等错误率,如表2所示。

5 结语

D-S证据理论定义信任函数和似然函数分析处理随机性或模糊性产生的不确定性,可避免先验概率和条件概率的求取。鉴于生物特征识别系统中图像质量对识别性能的重要影响,以及多生物特征(尤其是诸如手指静脉和人脸不相关的特征)融合识别可提升系统识别性能,本文结合融合理论利用多源信息的冗余性和互补性来克服信息的不精确性和不完整性,并考虑图像质量信息进行基于D-S证据理论的多特征融合识别分析。结果表明该方法可有效地处理不确定性和不精确性的信息,基于图像质量加权的D-S证据理论的多特征融合识别有效提高了系统的识别性能。

参考文献:

[1]

ROSS A, JAIN A K, QIAN J Z. Information fusion in biometries [J]. Pattern Recognition Letters, 2003, 24(13): 2115-2125.

[2]

HONG L, JAIN A, PANKANTI S. Can multibiometrics improve performance? [C]// Proceedings of 1999 IEEE Workshop on Automatic Identification Advanced Technologies. Piscataway: IEEE, 1999: 59-64.

[3]

JAIN A K, PANKANTI S, PRABHAKAR S, et al. Biometrics: A grand challenge [C]// Proceedings of the 17th International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2004: 935-942.

[4]

NANDAKUMAR K, CHEN Y, Jain A K, et al. Quality-based score level fusion in multibiometric systems [C]// Proceedings of the 18th International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2006, (4): 473-476.

[5]

MAURER D E, BAKER J P. Fusing multimodal biometrics with quality estimates via a Bayesian belief network [J]. Pattern Recognition, 2008, 41(3): 821-832.

[6]

VATSA M, SINGH R, NOORE A, et al. Quality-augmented fusion of level-2 and level-3 fingerprint information using DSM theory [J]. International Journal of Approximate Reasoning, 2009, 50(1): 51-61.

[7]

FIERREZ-AGUILAR J, CHEN Y, ORTEGA-GARCIA J, et al. Incorporating image quality in multi-algorithm fingerprint verification [C]// Proceedings of the International Conference on Biometrics. Berlin: Springer-Verlag, 2006: 213-220.

[8]

RICHIARDI J, KRYSZCZUK K, DRYGAJLO A. Quality measures in unimodal and multimodal biometric verification [C]// Proceedings of the 15th European Conference on Signal Processing. Poznan, Poland: EURASIP, 2007: 301-310.

[9]

SINGH R, VATSA M, NOORE A, et al. DS theory classifier fusion with update rule to minimize training time [J]. IEICE Electronics Express, 2006, 3(20): 429-435.

[10]

FIERREZ-AGUILAR J, ORTEGA-GARCIA J, GONZALEZ-RO-DRIGUEZ J, et al. Discriminative multimodal biometric authentication based on quality measures [J]. Pattern Recognition, 2005, 38 (5): 777-779.

[11]

AT&T Laboratories Cambridge. The ORL database of faces [EB/OL]. [2011-03-25]. .

[12]

余成波,秦华锋.手指静脉识别技术[M].北京:清华大学出版社,2009.

[13]

MIURA N, NAGASAKA A, MIYATAKE T. Feature extraction of finger-vein patterns based on repeated line tracking and its application to personal identification [J]. Machine Vision and Applications, 2004, 15(4): 194-203.

[14]

WAN LINGYU, LEEDHAM G, CHO D S-Y, et al. Minutiae feature analysis for infrared hand vein pattern biometrics [J]. Pattern Recognition, 2008, 41(3): 920-929.

[15]

WAN LINGYU, LEEDHAM G. A thermal hand vein pattern verification system [C]// Proceedings of the Third International Conference on Advances in Pattern Recognition and Image Analysis. Berlin: Springer-Verlag, 2005: 58-65.

[16]

YANG JINFENG, SHI YIHUA, YANG JINLI. Personal identification based on finger-vein features [J]. Computers in Human Behavior, 2011, 27(5): 1565-1570.

[17]

BARTLETT M S, MOVELLAN J R, SEJNOWSKI T J. Face recognition by independent component analysis [J]. IEEE Transactions on Neural Network, 2002, 13(6): 1450-1464.

[18]

DENIZ O, CASTRILLON M, HERNANDEZ M, et al. Face recognition using independent component analysis and support vector machines [J]. Pattern Recognition Letters, 2003, 24(13): 2153-2157.

[19]

HURRI J. FastICA [EB/OL]. [2011-04-19]. cis.hut.fi/projects/ica/fastica.

[20]

TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of Cognitive Neuroscience, 1991, 3(1): 71-86.

[21]

李奇,冯华君,徐之海,等.数字图象清晰度评价函数研究[J].光子学报,2002,31(6):736-738.

[22]

王鸿南,钟文,汪静,等.图像清晰度评价方法研究[J].中国图象图形学报,2004,9(7):828-892.

[23]

WANG Z, BOVIK A C, SHEIKH H R, et al. Image quality assessment: From error visibility to structural similarity [J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612.

[24]

PARIKH C R, PONT M J, JONES N B. Application of Dempster-Shafer theory in condition monitoring systems: A case study [J]. Pattern Recognition Letters, 2001, 22 (6/7): 777-785.

[25]

DEZERT J. Foundations for a new theory of a plausible and paradoxical reasoning [J]. Information and Security Journal, 2002, 12(1): 13-57.

收稿日期:2011-06-15;修回日期:2011-08-08。

图像分析论文第3篇

Abstract: The teaching content and teaching mode for course of digital image analysis are researched in the paper, education reform measures is implemented from three aspects, the theory teaching, the practice teaching and the related scientific research. Project driven teaching is proposed to cultivate innovative and practice talents, the practice teaching is strengthened and the scientific research is introduced into the teaching process.

Key words: image analysis; teaching mode; teaching reform; project driven

0 引言

随着现代信息技术的快速发展,图像分析日益广泛地应用于军事目标识别控制、智能交通、医学图像重建、社会事务管理、生物特征识别,以及互联网相关产业等诸多领域,越来越多的研究者更加关注图像分析领域的研究工作[1-2]。而高等教育要与实际应用紧密联系,“图像分析”这门课程在高校电子信息类专业也有了越来越重要的地位。

图像分析是用模式识别和人工智能方法对景物进行分析、描述、分类和解释的技术,又称景物分析或图像理解。一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构,从而提取具有一定智能性的信息。图像分析侧重于研究图像的内容,包括但不局限于使用图像处理的各种技术,它更倾向于对图像内容的分析、解释和识别。

“图像分析”的教学目的是使学生了解和掌握数字图像分析的基本概念与主要内容,为今后的深入研究和开发工作打下良好的基础。其基本教学内容包括图像增强、图像分割、图像复原、图像描述、图像识别等理论和方法。该课程主要阐述数字图像分析中的基本概念、基础理论和常用算法,介绍数字图像分析研究中的基本问题以及解决这些问题的原理和实现方法,使学生能够编程实现简单的图像处理算法,能够逐渐解决数字图像分析领域的实际问题。

“图像分析”课程属交叉学科,其起点高、难度大,既有较强的理论性,又与实践紧密结合,目前的教学现状表明,学生对本课程往往入门时就心存畏惧,深入学习困难,不管是考试成绩还是实践动手能力都不理想,教学上存在许多问题。如何引导学生明确学习目的、转变思想观念,如何在教学过程中合理利用多重教学手段、灵活采用教学相长的方法激发学生的学习兴趣,成为教学中必须解决的难题。

1 课程教学现状分析

经过对国内多所高校的调研发现,现行的教学模式存在严重的弊端。在目前的图像分析课程教学中,教师只是按部就班地按照教学大纲进行讲授,而对于程序运行实现及实际应用部分大纲中并没有严格的要求,所以多数教师也就只讲解理论,对程序实现则省略掉或是一带而过。而学生也只是按部就班地对理论知识进行学习,没有结合相关的应用,所以随着课程内容的深人,学生会感觉到枯燥乏味,对该课程逐渐失去了兴趣。即便是认真学习的学生,也是一直处于被动学习的状态。至于考试,只需要按照教师的授课内容认真复习就可以拿到优异的成绩。很多学生直到他们学完了该门课程,也没弄清楚这些图像处理的方法该如何具体实现,而且对于如何应用到实际生活和研究当中,也是一无所知,更谈不上创新能力、实践能力和综合能力了。该课程目前的教学方法大大影响了学生的创新实践能力的培养。长此以往,高分低能的现象将会日趋严重。因此,图像分析课程教学改革迫在眉睫。

2 课程教学改革措施

2.1 教学内容和方法的改革

图像分析本身为交叉学科,与图像处理、模式识别、信号分析多领域存在密切联系,而课程内在耦合性并不强,目前还没有一个完备的课程体系,许多教学实践难以组织。一般除了图像分析课程的基本内容,根据教材丰富程度的不同,可能还包括图像的数据结构、图像重建、图像识别、图像的小波分析,以及图像的数学形态学分析。其内容庞杂,难度也偏大,在有限的教学时间内往往难以将全部内容讲透,传统的教学模式只能以理论介绍为主,忽视实现步骤,造成学生在学习时普遍感到过于抽象。故有必要优化教学课程设置,精简课程教学内容。课堂讲授中,要抓住重点难点进行讲解,鼓励学生课下自主学习,有疑问主动讨论求教,以此来提高教学质量。

教学内容中不能只有理论知识,还要与图像分析相关应用软件结合起来,如Matlab、Opencv、Image Analyzer等,必要的时候也可以用目前较流行的Photoshop软件举例。这样和软件结合起来讲解,学生可以看到实实在在的图像变化过程,学习兴趣自然就提高了。而且学生也比较容易理解图像分析的基本原理,听起来也不会觉得枯燥,无形中提高了学生的学习效率。同时学生学会了一门语言,用以实现各种图像处理过程,为以后的学习和工作打下坚实的基础。

传统教学中理论学时与实验学时的分配比例一般为3:1,高校普遍偏重理论教学,而忽视了实验教学。理论教学是一种被动的单向的学习模式;而主动性的、互动式的实验教学更能调动学生的积极性,有利于学生自主的去发现问题分析解决问题。因此,要优化理论教学与实验教学的课时比例,加大实验教学的课时,通过实验加深对理论基础的理解。

2.2 强化实验教学

选择图像分析中最重要的算法作为实验课教学的主要内容,覆盖图像分析中图像增强、图像压缩、图像分割、形态学处理、图像特征描述等各个重要部分。图像的读取和显示、图像的直方图均衡化、图像的平滑滤波和锐化滤波、快速傅里叶变换、频域上的高通和低通滤波、Hough 变换、图像的阈值化、图像的膨胀、腐蚀和开闭操作、细化算法等实验完全能包含图像分析领域理论。

实验教学[3]要求学生提前阅读课程实验指导书,了解实验内容,进行初步的设计分析,自己编写核心代码,自行设计实验测试用例,预测实验结果。实验课上认真演示图像处理的效果,将实验结果与预测结果相比较,对出现的问题耐心分析和总结,按要求撰写实验报告,从而加深对数字图像分析概念和方法的理解。引导学生利用所学到的知识,来解决图像分析领域简单的实际应用问题,要把课堂上讲授的理论知识和现实生活中应用的具体例子相结合,将最新的科研前沿动态和信息反馈给学生。

2.3 将科研引入教学

科研中的图像分析相关部分要进人到教学中,让学生在学习理论知识的基础上,了解该方向的前沿技术和应用领域,这对以后的工作有重要的引导作用,也能够激发学生的探索能力和创新灵感,达到真正的学以致用。同时形成科研带动教学,教学促进科研的良性循环[4]。

将科研引入教学,开展项目驱动教学,让学生接触一些具体的项目,在做这些项目时要用到哪些知识点,如何综合运用它们,都是项目中必须解决的问题。通过项目驱动教学的方式,学生的综合实践能力将得到进一步提高。

项目驱动教学的关键是项目的选择和设计,它的好坏直接影响到教学的开展。图像分析项目驱动教学的示意图如图1所示。由图1可知,这一互动式的教学模式重点在于师生的交流反馈,学生是学习的主体,是项目的承担者 、实施者,老师在项目中主要起组织引导的作用。在项目驱动教学实施中,教师不是直接把知识技能传递给学生,而是学生在教师的指导下去选择“项目”,分析“项目”,并最终完成“项目”。学生不再盲目的把学习当任务,而是以项目需求驱动,有目的、有针对性的学习,变被动地接受知识为主动地寻求知识。学生学习的主动性和创新意识在项目实施的过程中不断强化。

根据课程的知识层次和内容体系把理论学习与科研项目相结合。譬如设计“车牌识别系统研究[5]”来展开课堂教学,如图2所示。由图2可知,“图像分析”的大部分教学内容都可通过“车牌识别系统研究”这一项目组织起来。以“实施项目”的方式引入有关概念和主题,展开教学内容深入学习,将学生的“被动学习”转换为“兴趣驱动”,从而提高教学效率。

另外,根据学校的实验条件,还可设计“脑部CT图像处理”、“运动目标检测研究”、“人脸识别系统”等项目,从而融合图像分析各方面的知识点。

整个项目的实施分为两个阶段:理论学习和项目实施。在理论学习阶段,可以引入大量应用实例,授课时重点阐述诸如医学图像处理、运动目标特征提取、智能视频监控、基于图像的工业检测、图像压缩在3G通信技术中的应用等实例。通过对具体项目的讲解,让学生对项目的理论基础有初步的了解,而这种将深奥的理论实例化,使学生易于接受,激发了学生的学习兴趣和对项目的探索激情。在第二阶段的项目实施中,将项目分成若干个小组,在教师的指导下,各小组召开会议,分析项目需求,明确项目任务,进行成员分工,确定各分工的职责及项目实施计划,在此阶段,教师扮演项目顾问的角色,解答小组成员项目实施中遇到的各种问题。学生在教师的指导下完成对项目的需求分析、系统设计、编码实现、测试部署的整个过程,达到学生在完成项目的过程中理解学科知识、掌握综合技能的目的。

项目完成之后,需要对项目进行总结和反馈。各小组提交项目结题材料,以论文答辩的形式在班上演示各小组项目成果,介绍项目实施过程、成果、优势及不足,总结项目实施阶段的经验教训,回答现场提问。在听取其他小组报告的基础上自我总结,找出自己的不足,查缺补漏,提高专业理论基础及定向分析解决问题的能力。最后,以学生自评、组内成员互评、教师点评的方式来确定每位学生的最终成绩。

图像分析论文第4篇

关键词:遥感影像几何校正精度分析

Abstract: from error propagation theory, Anglicizing the error sources of Geometric Correction and the impact on the outcome of Correction, Combined with specific experiment to test the accuracy of the theoretical analysis and reliability, this paper provide the guidance of correction control of using topographic maps to correct remote sensing image.

Key words: remote sensing image;Geometric Correction;Accuracy Analysis

中图分类号:P217文献标识码:A 文章编号:2095-2104(2013)

随着GPSRTK技术的迅速普及,利用GPSRTK技术进行遥感图像几何校正控制点获取已经广泛应用于生产实践中,但在有些地区存在着缺少基本控制点以及大量布测存在成本昂贵等因素,在对遥感图像几何校正时仍然选择地形图数字化进行校正。但是往往不能正确判断校正不同分辨率的遥感影像选择多大比例尺地形图及选择一定比例尺地形图后进行校正后,产生较大误差,不清楚产生误差的原因。因此,本文从误差传播理论出发,分析了影响几何校正精度的因素,从理论上推导了1:10000地形图校正P5影像后的点位中误差,希望对今后的生产实践起到参考作用。

1、几何校正基本过程

利用地形图进行遥感影像的几何校正,过程可以描述为:地形图原图扫描数字化;地形图控制点及遥感影像配准点采集;建立几何纠正模型,进行几何校正。

2 几何校正误差来源及精度分析

2.1地形图数字化误差分析

地形图数字化时,地形图一般以300DPI的分辨率进行扫描,然后选择公里网格点作为控制点,根据所选控制点的大地坐标与扫描地形图图像的像元坐标拟合多项式,用拟合多项式对地形图进行地理编码。进行地理编码时,每幅地形图选择25个左右控制点,用最小二乘法计算出最佳待定系数。根据比例尺和扫描精度的关系将每个控制点的均方根差控制在1个像元之内。扫描仪扫描精度可按下式进行估算:

式中 p——每个象素的实际尺度;DPI——地形图的扫描分辨率;m——地形图比例尺分母;0.0254为米和英寸的转换系数。这里以地形图数据为真值,未考虑地形图的误差和扫描仪的扫描误差,通常这两个误差相对于它们各自的精度而言,都是很小的。

2.2控制点采集精度分析

控制点采集过程中,包括地形图控制点的采集和遥感影像配准点的采集。采集过程的误差属于偶然误差,包括操作员采点时的对中误差及取点的代表性误差,此项误差与操作人员的经验、熟练程度、技能及作业习惯有很大关系。根据经验,一般采点中误差在0.5个像元以内。

2.3几何纠正过程误差分析

几何纠正就是选择合适的坐标变换函数式(即数学纠正模型),建立图像坐标(x,y)与其参考坐标(X, Y)值进的关系式,也就是确定校正方法。一般遥感处理软件提供了八种进行几何精校正的空间转换模型:仿射(Affine)、投影(Projective)、二次多项式(2nd Order)、三次多项式(3rd Order)、四次多项式(4th Order)、五次多项式(5th Order)、正形(Helmert)、有限元(Finite Element)等。在此我们采用仿射

(Affine)模型进行误差分析,仿射模型公式为:

其中,a1~b3为仿射变换转换参数,共有6个,只需三个控制点就可唯一确定转换关系。当控制点数目大于3个时,可用最小二乘法确定,这有利于提高转换参数的精度。转换参数一经确定,就对所有采样点适用。因此,转换参数的求取精度将直接影响所有采样点的精度。

如图1所示,a,b,c,d为图像定向点,仿射变换公式可用矩阵表示为:

从而,可以求得:(2)

由图1,为不失一般性,又便于精度分析,我们假设:

由此,得到:(3)

把(3)式代入(2)得: (4)

对仿射变换式(1)进行微分,有:

(5)

在求转换参数时,,为大地控制点,一般假定为无误差,因此,.把a点图像坐标及式(4)代入式(5),得:

同理,把b,c两点图像坐标及式(4)代入式(5),经整理后有:

另外有,把a,b,c点坐标及式(4)代入,经整理后得到:

求得的da1~db3就是定向点误差引起的转换参数的误差,当采样时,由定向点引起的大地点位误差为:

(6)

假设地图比例尺为1∶M,扫描分辨率为DPI(每英寸多少点,其中l inch=0.0254m),则有:

(7)

把转换参数误差da1~db3及式(7)代入式(6),经整理后得:

(8)

由图像坐标点位中误差,代入式(8)经整理得:

(9)

3 几何校正点位精度分析

几何校正后x,y方向的点位中误差公式为:

式中,为几何校正后x,y方向点位中误差;

为地形图扫描数字化后x,y方向点位中误差;

,为地形图和遥感影像x,y方向采点中误差;

因此,点位中误差公式为:

4、实验分析

4.1实验数据

为了验证分析结果,我们选用新疆海拉尔地区一幅1:10000地形图以及相应一景P5遥感影像进行几何精校正。IRS-P5遥感卫星印度于2005年5月5日发射,IRS-P5的轨道高度为618km,搭载有两个相同的相机,焦距为1945mm,它们沿轨道方向分别前视26°、后视5°构成立体像对,基线高度比为0.62,前后视星下点分辨率分别是2.452m和2.187m。地形图数据采用新疆测绘局航测1:10000地形图。

4.2试验方法

按照遥感影像几何精校正方法,我们选用ERDAS遥感软件几何校正模块的彷射变换模型,在影像窗口和地形图窗口中分别寻找对应的地物特征点,从理论上讲彷射变换需要3个控制点即可求出转换参数,但为了提高精度我们选择12个GCP控制点进行计算。

4.3结果分析

表1控制点中误差计算情况

表1为在ERDAS中计算的各控制点点位中误差计算表。从表中,我们可以得到,X,Y方向的点位中误差都在一个像元以内,总体点位中误差为0.6768像素,根据前面推导的点位中误差理论计算公式,计算理论点位中误差为0.96像素,实际点位中误差完全符合我们在前面精度分析中的分析结果。

5 结论

a.从理论分析和实践计算中,我们可以得出使用1:10000地形图完全可以满足2.5m分辨率遥感影像的几何校正精度需求,为今后几何校正精度分析提供了参考计算公式。

b.在实验中地形图扫描分辨率我们采用300DPI,通过实验分析如果分辨率过大数据量将程几何数量增长并对精度无显著提高,如果分辨率太低将影响精度,因此在实际操作中选用200~300DPI最为合适。

c.本次实验采用的为彷射变换模型,此模型为几何校正模型中较为简单且精度较低的一种,因此在几何精校正过程中采用其他几何校正模型精度精度还将提高,在今后实验中我们还将推导分析其他模型的精度计算公式。

参考文献

[1]姜崇州,李鹰,黄伟.扫描技术在城市规划信息系统中的应用[J]。城市规划,1998(1):55-58

[2]黄幼才.GIS空间误差分析和处理[M]. 武汉:中国地质大学出版社,1995:22-35

[3]花向红,潘正风.基于大比例尺地形图的扫描数字化算法研究[J].城市勘察,1997(1):22-25

[4]郝向阳,钱曾波. 地图扫描数字化的点位精度分析[J].测绘学报,1996,25(1):46-52

图像分析论文第5篇

由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。

贰、WAVELET的历史起源

WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。

1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。

三、WAVELET影像压缩简介及基础理论介绍

一、WAVELET的压缩概念

WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。

WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。

以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。

二、影像压缩过程

原始图形资料色彩模式转换DCT转换量化器编码器编码结束

三、编码的基本要素有三点

(一)一种压缩/还原的转换可表现在影像上的。

(二)其转换的系数是可以量化的。

(三)其量化的系数是可以用函数编码的。

四、现有WAVELET影像压缩工具主要的部份

(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。

(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。

(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。

(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种本论文由整理提供

为内插。

(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffatslineartimecodinghistogram的基础上。

(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。

肆、WAVELET影像压缩未来的发展趋势

一、在其结构上加强完备性。

二、修改程式,使其可以处理不同模式比率的影像。

三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。

四、加强运算的能力,使其可支援更多的影像格式。

五、使用WAVELET转换藉由消除高频率资料增加速率。

六、增加多种的WAVELET。如:离散、零元树等。

七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。

八、增加8X8格的DCT模式,使其能做JPEG的压缩。

九、增加8X8格的DCT模式,使其能重叠。

十、增加trelliscoding。

十一、增加零元树。

现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。

伍、影像压缩研究的方向

1.输入装置如何捕捉真实的影像而将其数位化。

2.如何将数位化的影像资料转换成利於编码的资料型态。

3.如何控制解码影像的品质。

4.如何选择适当的编码法。

5.人的视觉系统对影像的反应机制。

小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。

陆、在印刷输出的应用

WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。

有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。

在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。

柒、结论

WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。

参考文献:

1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。

2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。

3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。

4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。

5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。

6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。

7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。

附录:

嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送

目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。

阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。

基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术本论文由整理提供

使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。

LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。

LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。

所以将LEZW技术延伸至渐进式传送,在编码之前可以先设定每一级(Stage)的解析度与传送每一级所累加的码率(AccumulatedRate),然後再编码与传送之。该系统在低码率时用低解析度来显示影像,在较高码率时则以高解析度来显示影像,将改善渐进式传送的视觉品质。此系统在编码传送的过程中,允许传送的位元流在任一点位置被中断停止,而接收端可以由所接收到的资料,将影像重建在资料中断时的解析度下。

渐进式影像传送与阶层式影像传送的设计方法是相似的,只不过在传送方法上两者有相当大的不同。在阶层式影像传送系统中,所有图层的资料是平行的一起传送出去的。而渐进式影像传送则是以级对级(Stage-by-Stage)的方式传送的。因此,利用LEZW技术所设计的渐进式传送可看做是单一图层(Single-Layer)系统,其解析度与传送都是可以控制的。如此网路资源的浪费,便可得到某种程度上的解决。

图像分析论文第6篇

关键词:电子信息;小波分析;Fourier分析;图像处理

前言

小波分析理论是科学家、工程师和数学家共同创造的,反映了大科学时代学科之间的综合、渗透的趋势。小波理论来自Fourier分析[1],思想也来源于Fourier分析,但它不能代替Fourier分析,它是Fourier分析的新发展,小波理论与Fourier分析的互补优势和相辅相成的良好效果已被科研实践所证实。小波分析的应用是与小波分析的理论研究紧密地结合在一起地。现在,它已经在科技信息产业领域取得了令人瞩目的成就。 电子信息技术是六大高新技术中重要的一个领域,它的重要方面是图像和信号处理。现今,信号处理已经成为当代科学技术工作的重要部分,信号处理的目的就是:准确的分析、诊断、编码压缩和量化、快速传递或存储、精确地重构(或恢复)。从数学地角度来看,信号与图像处理可以统一看作是信号处理(图像可以看作是二维信号),在小波分析地许多分析的许多应用中,都可以归结为信号处理问题。现在,对于其性质随实践是稳定不变的信号,处理的理想工具仍然是傅立叶分析。但是在实际应用中的绝大多数信号是非稳定的,而特别适用于非稳定信号的工具就是小波分析。

一、小波与时频分析、信号处理

信号处理的主要目的是提取信号的有用信息,而去除无用的信息。信号分析的主要目的也就是寻找一种简单有效的信号变换方法,以便突出信号中的重要特性,简化运算的复杂度。例如,离散时间序列的付立叶变换DFT用简化的算法FFT的例子。Fourier变换就是一种刻画函数空间[2],解微分方程,进行数值计算的主要方法和有效的数学工具。它可把许多常见的微分、积分和卷积运算化简为代数运算,应用计算机、DSP的工具进行处理。从物理意义上理解,一个周期振动信号可以看成是具有简单频率的间谐振动的叠加,也正因为Fourier变换具有明显的物理意义,即幅频、相频特性被限制了,使Fourier变换不能进一步深入分析信号,在这一方面,小波要比Fourier变换胜出一筹。

Gabor变换是一种加窗的Fourier变换,它在非平稳信号分析中能起到很好的作用,是一种有效的信号处理方法,但Gabor变换的时—频窗口是固定不变的,窗口没有自适应性,不适用于分析多尺度信号和突变过程,而且其离散形式没用正交展开,难于实现高效的算法,这也是Gabor变换的主要缺陷,因此在工程上也限制了Gabor变换的应用。

在信号分析与处理中,为了提高算法的效率,对信号进行变换处理的积分应该属于正交基,Fourier变换的空间基具有正交性,但由于明确的物理意义而受到限制,小波则可以取而间得之。

二、小波分析与图像分析

模拟图像信号在传输过程中极易受到各种噪声的干扰,而且模拟图像信号一旦受到干扰则很难完全得到恢复。另外,在模拟领域中,要进行人与机器、机器与机器之间的信息交换以及图像进行诸如压缩、增强、恢复、特征提取和识别等一系列的处理和比较是困难的。所以,无论从完成图形通讯和数据通信网的结合方面来看,还是从对图像信号进行各种处理的角度来看,图像信号的数字化都是首要解决的问题。图像信号的数字化的关键是图像的编码。编码是把模拟信号转化为数字信号的一种的技术,图像编码技术不仅是应用线性脉冲编码调制技术,而重要的是利用图像信号的统计特性及视觉对图像的生理学和心理学特性对图像进行信源编码。

小波图像编码是新的图象编码方法,它的理论基础是小波变换。近年来的研究表明,小波变换作为一种广泛适用的工具,也可以应用于分形几何的研究。必须指出的是,一幅图像经过小波变换分解后,有两种相似性可供利用。一种是子图像本身的自相似性,也即编码时子图像作为一幅空间域的图像可以利用通常的分形图像编码方法单独进行图像压缩编码;另一种是同方向不同分辨率的子图像之间的互相似性。由于小波分解后低分辨率子图像的范围比高分辨率子图像的范围小一倍,故该编码方法较一般的分形编码方法大大缩短了编码的时间就编码的效果而言,该方法也比较令人满意。

三、小波分析在电子信息领域的应用

小波分析的应用领域十分广泛,它包括:数学领域的许多学科;信号分析、图像处理;量子力学、理论物理;军事电子对抗与武器的智能化;计算机分类与识别;音乐与语言的人工合成;医学成像与诊断;地震勘探数据处理;大型机械的故障诊断等方面;例如,在数学方面,它已用于数值分析、构造快速数值方法、曲线曲面构造、微分方程求解、控制论等。在信号分析方面的滤波、去噪声、压缩、传递等。在图像处理方面的图像压缩、分类、识别与诊断,去污等。在医学成像方面的减少B超、CT、核磁共振成像的时间,提高分辨率等。/。

1.小波分析用于信号与图像压缩是小波分析应用的一个重要方面。它的特点是压缩比高,压缩速度快,压缩后能保持信号与图像的特征不变,且在传递中可以抗干扰。基于小波分析的压缩方法很多,比较成功的有小波包最好基方法,小波域纹理模型方法,小波变换零树压缩,小波变换向量压缩等。

2.小波在信号分析中的应用也十分广泛。它可以用于边界的处理与滤波、时频分析、信噪分离与提取弱信号、求分形指数、信号的识别与诊断以及多尺度边缘检测等。

3.在工程技术等方面的应用。包括计算机视觉、计算机图形学、曲线设计、湍流、远程宇宙的研究与生物医学方面。

参考文献

图像分析论文第7篇

壹、前言

由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480TrueColor图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。

贰、WAVELET的历史起源

WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J.Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。

1986年,Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(CompactlySupported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。

三、WAVELET影像压缩简介及基础理论介绍

一、WAVELET的压缩概念

WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding),可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。

WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。

WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。

以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥。如此才是WAVELET编码法主要的观念。

二、影像压缩过程

原始图形资料色彩模式转换DCT转换量化器编码器编码结束

三、编码的基本要素有三点

(一)一种压缩/还原的转换可表现在影像上的。

(二)其转换的系数是可以量化的。

(三)其量化的系数是可以用函数编码的。

四、现有WAVELET影像压缩工具主要的部份

(一)WaveletTransform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。

(二)Filters(滤镜):这部份包含WaveletTransform,和一些着名的压缩方法。

(三)Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。

(四)EntropyCoding(熵编码器):有两种格式,一种是使其减少,一种为内插。

(五)ArithmeticCoder(数学公式):这是建立在AlistairMoffat''''slineartimecodinghistogram的基础上。

(六)BitAllocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。

肆、WAVELET影像压缩未来的发展趋势

一、在其结构上加强完备性。

二、修改程式,使其可以处理不同模式比率的影像。

三、支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。

四、加强运算的能力,使其可支援更多的影像格式。

五、使用WAVELET转换藉由消除高频率资料增加速率。

六、增加多种的WAVELET。如:离散、零元树等。

七、修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。

八、增加8X8格的DCT模式,使其能做JPEG的压缩。

九、增加8X8格的DCT模式,使其能重叠。

十、增加trelliscoding。

十一、增加零元树。

现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。

伍、影像压缩研究的方向

1.输入装置如何捕捉真实的影像而将其数位化。

2.如何将数位化的影像资料转换成利於编码的资料型态。

3.如何控制解码影像的品质。

4.如何选择适当的编码法。

5.人的视觉系统对影像的反应机制。

小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。

陆、在印刷输出的应用

WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。

有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。

在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。

图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。

柒、结论

WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。

参考文献:

1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。

2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上),峰资讯股份有限公司。

3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下),峰资讯股份有限公司。

4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。

5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。

6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。

7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。

附录:

嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送

目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。

阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(LowpassSubband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。

基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet,简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。

LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。“有”版权所

LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。

图像分析论文第8篇

【关键词】多模态 视觉语法 意义构建 苏大建校110周年校庆徽标

【中图分类号】G640 【文献标识码】A 【文章编号】1006-9682(2012)06-0048-02

一、引 言

随着科技、数字和多媒体的发展,人们的交流方式逐渐由文字向图像化转变。人类的语篇世界也呈现出数字化和多模态化的特点。“图像时代的到来,特别是图像在媒体、教育和儿童文学中的大量生产,使我们无法忽略多模态话语”。近年来,国内外的学者对多模态话语分析开始了广泛的探索研究。马丁?奥图尔及克瑞斯和凡利文开创了多模态话语研究领域,前者把系统功能语法理论运用到图像分析中去。后者则分析了图像等非语言符号在语篇分析中的作用,系统地解释了视觉语法。目前这个研究领域一直在不断发展,其中以凡利文和杰维特、克瑞斯和凡利文、诺瑞斯等最为突出。

国内也有很多学者开始着手多模态话语的研究并取得了丰硕的研究成果。胡壮麟从理论和实践的角度研究了多模态话语的意义构建,朱永生分析阐述了多模态话语的理论基础和研究方法,李战子从社会符号学角度分析了多模态话语,以张德禄为代表的学者则撰文研究了多模态话语在外语教学中的具体运用,但纵观多模态语篇的研究文章发现类似徽标这样由文字、图像和颜色组成的具体的多模态语篇的研究尚属少数。

本文尝试运用克瑞斯和凡利文所创立的视觉框架理论,以苏大建校110周年校庆徽标为例,从图像的构图意义、互动意义、再现意义等三方面对其进行分析,以说明多模态语篇中各种符号资源如何共同作用达到意义的构建,提高读者对于多模态话语的识读能力。

二、多模态话语的意义构建理论

多模态话语(multimodal discourse)是一种融合了多种交流模态(如声音、文字、形象等)来传递信息的语篇。李战子认为多模态指的是“除了文本之外,还带有图像、图表等的复合话语,或者说任何由一种以上的符号编码实现意义的文本。”曾蕾指出“超出文字语言符号以上的多种符号语篇”即为多模态话语。简言之,多模态话语就是由表达意义的两个或两个以上的单模态所构成的话语。

多模态话语分析理论借鉴以韩礼德为代表的语言学家所创立的系统功能语言学,认为语言以外的其他符号也是意义的源泉,把语言作为社会符号所具有的三大元功能延伸到除语言之外的其他符号,并把包括语言在内的各种符号看作是相对独立而又相互作用的符号资源,在分析语言特征的同时强调图像、颜色、声音和动作等视觉、听觉和行为方面的符号模态在话语中的作用。

在克瑞斯和凡利文的研究中,语法被延伸到包括视觉模式。他们认为:“正如语言的语法决定词如何组成小句、句子和语篇,视觉语法将描写所描绘的人物、地点和事物如何组成具体不同复杂程度的视觉的陈述。”在将图像看作是社会符号的前提下,他们将多模态话语分析把韩礼德所概括的语言的三大元功能(概念功能、人际功能和语篇功能)延伸到包括视觉符号在内的其他符号系统,并把它们在包含图像的多模态语篇中分别解释为再现意义(representation)、互动意义(interaction)和构图意义(composition)为核心内容的分析图像的视觉语法(the grammar of visual design)。

三、基于苏大建校110周年校庆徽标的多模态话语意义构建的分析

在选择多模态话语作为语篇来进行分析的时候,为了更好地说明问题,我们选取了苏州大学110周年校庆徽标作为分析对象。通过对苏大110周年校庆徽标这一由图像、文字和颜色组成的多模态话语意义构建的分析可以有助于我们把握其他多模态话语的意义构建。

校庆徽标以凸显110周年校庆的数字“110”为基础造型元素,融合了“风帆”、“海浪”和“书卷”的造型。

“风帆”和“海浪”寓意我校“长风破浪会有时,直挂云帆济沧海”的气势与魄力;“书卷”的造型则表明苏州大学高等教育机构的形象和行业属性。

两翼风帆和两朵浪花的运用,则寓示着苏州大学与台湾东吴大学同根同源,比翼齐飞,合作双赢,共创未来。整个徽标采用红色与黄色的渐变效果,烘托出110周年校庆喜庆热闹的氛围。

1.多模态话语的再现意义

在图像的再现意义上,克瑞斯和凡利文根据图像的特点,区分为叙述再现和概念再现两大类。在图像中,使用图中的元素形成斜线,通常是强烈的对角线,就会形成一个失量。李战子在分析图像的再现意义时指出在叙事再现的行动过程中,动作者(actor)即为发出矢量(vector)的参与者。在图像中,他们的位置通常最为突出。

苏大建校110周年校庆徽标中矢量是由“110”这一基础造型元素所代表的风帆和浪花构成。徽标两个数字“1”的设计借鉴了风帆的造型,右侧数字“0”则设计为两朵浪花图样,读者仿佛看见苏州大学从宝岛台湾起航,经过百年旅程,依旧扬起饱满的风帆,驶向未来。在整个徽标中,“110”这一造型元素作为最突出的动作参与者,被赋予的彩墨最多,置于最显著(salient)的中心位置,而且用红色这种饱和色调填充,色彩明快,格调喜庆,充分展现了苏大人喜迎百一年校庆的喜悦心情。

2.多模态话语的互动意义

在图像的互动意义中,图像可以造成观看者和图像中的世界之间特定的关系,并以此和观看者互动。这种互动关系的实现取决于距离、接触、视觉和情态。其中实现情态的资源在图像中格外丰富。李战子在分析图像的互动意义中指出,基于色彩的饱和程度,情态可以分为高、中、低三类:①高感官情态:图像自然主义地使用了高饱和度的色彩;②中感官情态:图像色彩不太饱和,如“水洗”的或飘逸的水粉;③低感官情态:图像只是黑白的。

苏大建校110周年校庆徽标以红黄二色为主色调,几乎占据整个布局。在中国传统色彩中,红色彰显热烈、庄严、喜庆等情感。在校庆徽标中,红色不仅烘托出建校110周年的欢快与喜庆,也呈现了苏大人喜迎八方来宾的热情。黄色作为华夏人的民族色彩,是华夏子孙的原色。作为暖色调,黄色彰显明亮、欢快和积极等情感。徽标中选取黄色,一方面传达了苏大人不忘源头,与东吴大学同根同源携手并进的理念,另一方面展现了苏大蓬勃的生机和向上的生命力。红黄相结合,赋予图像以艺术上的视觉冲击力和舒适感,增添了动感,充分展现了苏大的蓬勃朝气和不竭的生命力。

3.多模态话语的构图意义

在克瑞斯和凡利文看来,不同的位置反映了不同的信息值。在横轴图像中,从左到右的放置造成了已知—新信息的结构,即放在左边的信息是“已知”的,放在右边的是新信息。如同在功能语法中,已知信息是常识性的,或显而易见的,而新信息则是有问题的、可争议的。

在苏大110周年校庆徽标中,“110”这一构图元素位于图片的左侧,反映的“苏大建校110周年”的信息,相对于数字标识“1900-2010”所反映的信息“苏大建校始于1900年”要更加显而易见,在图像的世界中为观看者所熟知(观看者可以毫不费力地识别出“110”这一数字造型所反映的信息)。同时“Soochow University”作为最熟知的信息(观看者的首要已知信息),位于图像的上方最左侧,与“110”和“1900-2010”二者一起形成一个由已知到相对已知再到相对陌生的(主体苏州大学—校庆110周年—建校于1900)渐进关系的结构。

四、结束语

本文概述了在图像时代下多模态话语的意义构建,采用克瑞斯和凡利文的视觉语法框架,以苏大建校110周年校庆徽标为例,分析图像、文字、颜色等符号如何共同作用参与多模态话语整体意义的构建,说明忽视其中任何一种符号都不可能正确地、充分地解读话语的意义。正如胡壮麟所言,传统的以读写为主的识读能力在多媒体时代已不够用。本文力图通过对苏大建校110周年校庆徽标这一具体多模态话语的分析,以期提高读者对于多模态话语的识读能力。

参考文献

1 Halliday, M. A. K. An Introduction to Functional Grammar[M].London: Arnold,1994

2 Kress,G. & van Leeuwen, T. Multimodal Discourse: The Modes and Media of Contemporary Communication[M].London: Arnold,2001

3 Kress,G. & T. van Leeuwen Reading Images[M].London: Routledge,2006

4 Norris, S. Analyzing Multimodal Interaction: A Methodological Framework[M].London: Routledge,2004

5 O Toole, M. The Language of Displayed Art[M].London: Leicester University Press,1994

6 van Leeuwen, T. and C. Jewitt, eds. Handbook of Visual Analysis[M].London: Sage,2000

7 胡壮麟、董佳.意义的多模态构建[J].外语电化教学,2007(6):3~12

8 胡壮麟.社会符号学研究中的多模态化[J].语言教学与研究,2006(1):1~10

9 李战子.多模态话语的社会符号学分析[J].外语研究,2003(5):1~8

10 曾蕾.动态多符号语篇的整体意义构建[J].外语艺术教育研究,2006(3):42~48