文档库 最新最全的文档下载
当前位置:文档库 › 一种结合边缘和角点特征的视频字幕检测方法

一种结合边缘和角点特征的视频字幕检测方法

一种结合边缘和角点特征的视频字幕检测方法
一种结合边缘和角点特征的视频字幕检测方法

Scientific Journal of Information Engineering

October 2013, Volume 3, Issue 5, PP.85-91 A Video Caption Detection Method with Edge and Corner Features

Yunlan Zhao1?, Yonghong Song 1, Yi Zhou 2

1. Software Engineering School, Xi’an Jiaotong University, Xi’an Shanxi 710049, China

2. Broadcast and TV Center, propaganda department, Xi’an Jiaotong University, Xi’an Shanxi 710049, China

?Email: 617732720@https://www.wendangku.net/doc/bb220753.html,

Abstract

Video caption contains important clue of video content, so it plays a significant role in the content based video retrieval. In this paper, a video text detection approach which combines edge and corner point features is proposed. Firstly, the gradient map is obtained by applying Roberts edge operator on the three color components from a single video frame. Then the Harris corner point is extracted on the gradient maps. Thirdly, the candidate text regions are acquired by morphological operations. Finally, the captions are located using the proposed text features and connected component analysis. The experiment results show the proposed approach can detect captions with high speed and high accuracy.

Keywords:Caption Detection; Roberts Gradient Operator; Corner Detection; Video Text Features

一种结合边缘和角点特征的视频字幕检测方法

赵云兰1,宋永红1,周颐2

1.西安交通大学软件学院,陕西西安710049

2.西安交通大学宣传部广电中心,陕西西安710049

摘要:视频中的字幕提供了描述视频内容的有用信息,对于基于关键字的视频检索具有重要作用。对视频中字幕进行了研究,提出了一种结合视频帧中的边缘和角点特征进行字幕检测的方法。该方法首先提取彩色视频帧在RGB 3个颜色分量上的彩色Roberts梯度算子,得到凸显边缘区域的灰度图像,然后在得到的灰度图像上提取Harris角点,再通过形态学处理得到候选字幕连通区域,最后结合本文提出的一些视频文本特征进行连通区域分析得到最终字幕区域。实验证明,该算法能够快速定位字幕区域,定位准确性较高。

关键词:字幕检测;罗伯特交叉梯度算子;角点检测;视频文本特性

引言

近些年,随着多媒体技术和互联网的快速发展,以视频为主的多媒体信息正在以惊人的速度增长。传统的数据库检索中采取的基于注释的检索方法已经不能满足人们的需要,将视频帧中的字幕和文本提取出来作为检索依据的检索方法已经成为目前研究的主流。从图像和视频帧中提取出的字幕和文本与图像和视频本身要表达的信息具有很大的相关性,所以视频帧中的字幕和文本是视频检索中的关键信息。一般来说,数字视频中的字幕可以分为三类:1、场景文字,指的是视频中场景本身所包含的文字,如视频中的标识牌、广告牌等等。场景文字出现的位置、大小、颜色和文字方向都具有很高随机性。2、静态字幕,一般是后期制作中加入的文字信息,一般出现的位置、颜色大小等较为固定,与视频内容往往有直接联系。3、滚动字幕。与静态字幕一样,这种字幕也是后期加入的文字。但有所不同的是这种字幕在视频序列中以动态滚动方式呈现,在每一帧中出现位置不同。由于静态字幕针对视频内容能提供最全最可靠的信息,因此本文主要针对静态字幕进行研究。

1相关工作

目前,已有的视频字幕检测方法大致可以分为三类:基于连通区域[1]、基于边缘[2][3]和基于纹理[4][5]。下面分别对这三种典型的方法和我们的算法进行分析对比。

基于连通区域方法假设同一文字区域内的文字颜色相同,所以进行连通区域标注时会属于同一区域。该方法适用于高质量的简单背景图像,其根据灰度值、轮廓等特征把视频帧分割成多个区域,然后根据区域的最小外接矩形、面积、平均灰度值等特征来检测文字区域,该算法虽然简洁,但很难描述各种复杂的情况;我们的算法通过对复杂背景用彩色Roberts算子灰度化,突出背景变化显著的区域,再利用角点和形态学处理得到连通区域,这种方法适用于任何复杂背景。

基于边缘的方法利用图像中文字区域相对于背景具有较高的对比度这一特征,这一特征反应在边缘上即为文字区域具有丰富的边缘信息。该方法对于具有高对比度和平滑背景的图像具有较强的鲁棒性,单纯的边缘检测方法也可以快速地检测出文字,但是由于约束参数设置多且复杂,检测错误率较高。我们的算法使用边缘检测的同时还利用角点的特性对文字区域准确定位,很大程度上降低了检测错误率。

基于纹理分析的方法是通过考察像素的邻域,利用纹理特征去决定一个像素点或者像素块是否属于文字,虽然这种方法能检测复杂背景下的文字,但是其数学计算太过复杂,时间复杂度高。我们的算法结合边缘和角点的特征检测文本区域,不仅对背景复杂的图像具有很高的鲁棒性,而且时间复杂度比较低。

文献[6]提出了EDA(Edge Detection/Area based)算法,该算法是一种结合了彩色边缘检测与区域生长的图像分割方法。该方法首先定义一个彩色Roberts梯度算子,对原始图像经彩色Roberts算子处理后得到一灰度边缘图像,然后通过采用灰度图像中的一类最佳边缘检测算子LOG算子对提取出的彩色图像的灰度边缘作二次边缘提取,进而得到二值边缘图像完成彩色图像的边缘提取。再通过形态学膨胀技术生成区域图像,并采用区域生长方法标记候选字符块,然后对候选字符块分析与分解,利用字符空间频率分析和确定真正的字符块,得到最终的文本块。文献[7]使用了Harris角点检测,对角点图像通过形态学膨胀技术得到区域图像,然后通过一些图像区域特征判断候选区域块,进而得到最终的文本区域块。

本文提出的视频字幕检测算法结合了边缘和角点特征。在我们的方法中首先对彩色图像的RGB 空间进行3维彩色Robert算子处理[6],然后在对所得到的灰度图像进行Harris角点检测[7][8][9],经形态学处理之后形成连通区域[6][7],最后在综合考虑文字区域的各种特征的到最终的结果[6][7][10]。

2结合边缘与角点特征的视频字幕检测

本文提出的字幕检测算法结合了边缘和角点特征,通过彩色Roberts梯度算子、Harris角点检测方法和一系列后处理完成了图像字幕区域的准确定位。具体分四个步骤,分别是(1)对输入图像提取彩色Roberts边缘梯度算子,得到原图的强化字符区域的边缘梯度图像;(2)对边缘梯度图像进行角点检测;(3)对角点图像通过形态学处理得到候选字幕区域;(4)后处理。在后处理中对候选字幕区域分类得到字幕区域,最后合并重叠字幕区域得到最终结果。

2.1基于三维彩色空间ColorRoberts梯度算子

对于灰度图像而言,任一灰度边缘检测算子若要检测一个象素点是否为边缘点,其结果与被检测象素点相关邻域内象素点的灰度差有密切关系:若灰度差大,则对检测的结果影响也大。对于彩色图像来说,任何边缘检测算子与象素点之间的色差有密切关系。传统的彩色图像边缘检测算法往往单纯地把经典的灰度边缘检测算子分别作用于彩色空间的三分量上分别提取边缘,并用适当的方式合并三分量的处理结果,如当有两个分量有边缘时即可判定彩色图像存在边缘(单维空间投票法),或当有一分量存在边缘时才继续另一分量的边缘检测,以证实前一分量的检测结果,以上传统方法均不能取得好的结果。彩色空间的3个分量只反映了色彩的一部分信息,色彩的全部信息是由三分量共同综合反映出来的。本文使用的ColorRoberts算子是全

面作用于彩色三分量的综合方法,充分利用了全面的色彩信息,所以进行彩色图像边缘检测的效果优于只分别作用在彩色三分量上的传统彩色边缘检测方法。

ColorRoberts 梯度算子描述如下:

1)输入彩色图像I ,其中象素点(i, j )的彩色分量为 I (i, j, k ),k =1,2,3。

2)定义彩色图像彩色Roberts 梯度算子ColorRoberts ,ColorRoberts (i, j )=√ ;其中,

( , ; , ), ( , ; , )。

其中,Eud ( , ; , )定义为象素点( )与( )之间的彩色值欧式距离

( ) ( ( ( , , ) ( , , ))

( ( , , ) ( ,

, )) ( ( , , ) ( , , )) )

I 经ColorRoberts 处理后得到一灰度边缘梯度图像 。

本文使用的彩色Roberts 梯度算子在彩色图像边缘检测中时,没有将Robert 算子简单地应用于彩色图像的像素彩色值的各个分量上,而是采用欧式距离将像素彩色值的各个分量综合考虑。这种算法利用了字符边缘特征,弱化了变化缓慢的背景区域,突显出边缘变化剧烈的文本区域和部分边缘变化明显的背景区域。图2给出了灰度图像边缘检测Roberts 算子应用彩色图像中的结果,由图2可见,提取出的边缘图像中文本区域与背景易于分割,且文本区域完整、清晰,字符形状保持较好,基本符合最初提出的彩色图像边缘检测算子设计准则,满足后续工作提取文本区域的要求。

(a)原始输入图 (b)灰度图像 图2 ColorRoberts 算子在彩色图像中的灰度化图像

2.2 Harris 角点检测

本文采用基于模板的Harris 角点检测算法,得到角点检测图像 。角点是图像的一个重要局部特征,它以较少的数据量保存了图像中重要的特征信息。Harris 通过微分运算和自相关矩阵检测角点。这种算法具有计算简单、提取的角点特症均匀合理、可以定量提取特征点以及算子稳定的特点。对灰度边缘图像 进行Harris 角点检测,生成角点图像 。其处理过程表示如下:

使用高斯窗函数W(u ,v)计算图像偏导数,本文选用3*3的高斯窗函数,用( , )转换窗函数W(u ,v),即

( , ) ∑ [ ( ) ( , )]

( )

把公式(1)的第一项经过泰勒级数展开,即

( ) ( ) * ( ) ( )[ ]

+ ( )

其中和分别表示x和y方向上的偏导数。把公式(2)带入公式(1),即

( ,)()()[ ][ ] [ ] ( )在公式(3)中M为自相关矩阵,由公式(3)可得出M矩阵的计算公式,即

[

∑( ())

∑()()

∑()()

∑( ())

] ()

如果M的两个特征值都很小,则说明当前点处于平坦区域;如果M的两个特征值一个较大另一个较小时,表示当前点处于边缘上;当两个都很大时表示当前点是角点。Harris提供了另一个公式来获取这个点是否是角点的一个评价:

()()() R就代表了角点值,其中k是一个自己设定的可调灵敏参数,典型的为[0.4 0.6]之间,本文通过在测试集上进行大量实验之后选取k=0.6。

本文为了使角点选取更加准确,在计算了每个点的角点值R后,做了一个极大值抑制,即计算出每个点的角点值R后,找出其中最大的R值,赋值给。再判断每点的R值是否大于,和R值是否大于它的8邻域点的R值,当某点的R值大于,并且R值大于它的所有8邻域点的R值时,判断当前点为角点。本文经过大量的试验,取,图3(a)给出了对灰度图像的角点检测图像。

(a)角点图像(b)膨胀产生的连通区域

图3 文本区域连通域的产生

2.3生成候选字幕区域

由于角点是都是孤立的点,想利用连通区域性质判断文本定位区域的正确与否,需要先对角点图像进行形态学膨胀处理。膨胀技术能使原图像保持原有形状。对于图像,采用结构元素B,对的膨胀定义为

Diration(,B)=⊕B={x:?∩≠0,x=}

其中?={x-b:b∈B},即结构元素B关于原点对称后沿向量x平移。结构元素是具有一定形状的(如矩形、园、有向线段和有向点等)。结构元素包含原点,其尺寸相对地远远小于所考察目标。

选择合适的结构元素B,对提取出的角点图像采用形态学膨胀技术生成区域图像,经过膨胀处理互相离得很近的孤立角点就可以合并成一个区域。在文本和字幕区域角点的分布是一般是很紧密的,因为字符或汉字通常不会单独出现,而是和其他字符或汉字组成一个水平串。因此通过绘制连通区域的定位矩形就可以有效的检测到文本和字幕的位置。图3(b)给出了对角点图像经过形态学膨胀技术处理的结果。

结构元素B的选择对于候选文本区域形成与文本区域的提取至关重要。若结构元素的尺寸过大会导致无效的膨胀重叠现象,而结构元素的尺寸过小又不能有效的形成文本块区域,得到的可能是单字符或字符片段。视频中的字幕一般都是水平方向排列的字符串,所以本算法采用的结构元素B是高度为2和宽度为20的矩形长条。经过试验表明这样的结构元素既可以防止文本块的上下粘连,也能够有效定位水平方向的字幕位置。

2.4后处理

由于视频背景的复杂性,上述过程检测到的联通区域有可能并不是文本或字幕区域,因为角点密集的区域也可能出现在变化剧烈的非文本区域。我们通过分析文本区域的特征可以滤除掉大部分错检区域。为此本文提出了四个区域属性来描述文本区域,分别是:面积、饱和度、方向和纵横比。为了方便描述,在这里分别用、、和来表示上述四个特征[8],图4(a)(b)(c)(d)分别给出了经、、和处理后的图像。

(a)经处理后的图像(b) 经处理后的图像(c) 经处理后的图像(d) 经处理后的图像

图4 文本区域的定位

经过上述视频字幕特征处理之后会得到比较理想的字幕定位区域,但是由于新闻视频中有些字幕之间会离的比较近,经过形态学处理之后可能会出现字幕定位区域的重叠或者交叉。为此本文使用了一种在一定程度上消除重叠定位的方法。首先判断是否有重叠定位区域,当有重叠定位区域的时候需要取消原定位区域,然后计算出新定位区域的位置重新定位。当两个定位矩形的左上角坐标的最大值小于右下角坐标的最小值时判定这两个定位矩形相交,重新定位的矩形位置应外切这两个矩形。

通常情况下,通过上述提到的四个特征属性就可以有效的滤除掉非文本区域。在这儿值得说明的一点是本文提出的算法是独立于语言的,可以用于多语言场景。

3实验与结果分析

本文实验数据集来源于新浪视频网站和电影随机截图,共100幅bmp格式的图片,包含50%的新闻图片和50%的电影截图图片,共计字幕数642。语言包括汉语和英语,分辨率有576*432、624*352、672*378和600*480四种形式。

在对文本定位正确性的测量中,本文参考了文献[12]的评价标准,下面的分类定义了文本检测方法检测出的检测块的定位:

正确检测块TDB:检测块至少包含一个字符,并且检测出的字符数至少占本字幕字符数的80%以上。

错误检测块FDB:检测块不包含任何字符。

事实文本块ATB:对于每一幅测试图片,我们都可以手动的计算出本幅图片中实际含有的字幕数,这个字幕数就叫做事实文本块。

评价标准:

查全率R=?

?

查准率P=( )

?

F测量=( )

由于新闻视频和电影视频字幕复杂度的不同,本文分别统计了对以上两种测试集的测试数据。应用以上测试评判标准,可以的得出表1的测试数据。

表1 实验结果统计数据

表2 实验数据对比

本文还对文献[6]和文献[7]在本测试集上进行了仿真测试,并和本文提出的算法进行了比较分析,结果在表2中显示。从表2的对比数据可以看出本文算法总体上优于文献[6]和文献[7]中所提出的算法。文献[6]的算法首先采用彩色Roberts梯度算子,该梯度算子将彩色值的各分量综合考虑,充分利用全面的色彩信息,得到突显文本区域和弱化背景区域的边缘梯度图,然后在得到的边缘梯度图上利用Log算子进行二次边缘提取,再通过固定阈值得到二值图像,最后通过大量的经验阈值利用字符空间频率分析和确定真正字符块。由于本文献大量使用了边缘特性,所以对于背景剧烈变化的复杂图像和边缘信息很少的图像提取效果不佳,而且本文在二值化和字符空间频率分析时大量使用了固定阈值和经验阈值,所以测试数据对测试集的依赖程度较大。以上原因导致了测试结果的偏低。

文献[7]的算法首先对图像灰度化后进行Harris角点检测,再通过形态学膨胀技术形成连通区域图,最后使用了一些文本块的公共属性判断定位区域的正确性。本文献算法在灰度图像上直接提取角点,该灰度图像没有通过突出文本区域和弱化复杂背景区域的处理,所以角点的提取具有盲目性,导致了大量的漏检和错检区域,经过一些文本属性的过滤处理之后,虽然能够滤除掉大部分错检区域,但是同时也将增多漏检区域的数量,导致的直接结果就是虽然有很高的查准率,但是查全率较低。

本文提出的算法结合了以上两篇文献的特长,首先使用了ColorRoberts彩色梯度算子对图像进行灰度化,如上所说,该梯度算子不仅作用于彩色象素值的各分量上,而且使用欧氏距离将象素彩色值的各分量综合考虑。提取出的边缘梯度图滤除了背景中细节少、边缘变化缓慢的区域,从而很大程度上弱化了背景区域,同时也突出了细节丰富、边缘变化剧烈的文本区域。该算子检测出的文本区域完整、清晰,字符形状边缘保持较好,文本区域与背景易于进一步剥离,满足后续工作提取文本的要求。本文算法在检测出的该边缘梯度图上提取了Harris角点,既避免了文献[6]中后续工作中大量固定阈值的使用,也使得文献[7]中Harris角点的提取不具有盲目性,使角点对文本区域的定位更加准确,也对后续文本区域属性的使用提供了可靠性。进过以上分析,本文提出的算法总体效果优于文献[6]和文献[7]中提出的算法,这在表3中也得到了体现。

4结论

本文提出的算法结合了彩色图像边缘检测算子和角点检测,通过灰度化、焦点提取、形态学膨胀和特征描述等一系列操作对图像中的文本区域完成了定位。彩色图像边缘检测算子是一种全面作用在RGB 3个颜色空间分量上的灰度图像边缘检测算法,这种灰度变换采用欧氏距离将Roberts 梯度算子应用到图像像素彩色值的各分量上,这样变换出的灰度图像更能凸显出边缘变化剧烈的区域,而弱化背景中细节少、变化缓慢的区域。这样的处理对接下来的角点检测也更加有利,很大程度的提高了检测正确率。经过后期根据文本特性的排错处理,本算法可以达到相当好的结果。

本文是针对水平方向的文本,因为图像中重要的文本主要出现在水平方向。这也是本方法下一步将研究的方向。

R EFERENCES

[1]LI Fang, WU Bin, ZHANG Hong-ying. New Algorithm for video caption extraction based on 8-Connected components labeling[J].

China academic journal electronic publishing house, 2009, 33(02): 69-71

[2]Palaiahnakote Shivakumara, Weihua Huang, Chew Lim Tan. An efficient edge based technique for text detection in video frames[J].

IEEE computer society, 2008, 307-314

[3]LIANG Xue-zhan, ZHANG Xiang, ZHU Ming. News Captions Detection Based on Edge Detectionand Line Features[J]. Computer

simulation, 2009, 26(3): 223-226

[4]WANG Guang-yong, WANG Lin-lin, WANG Zuo-cheng. Texture Analysis—based Edge Detection Algorithm[J]. Computer

science, 2007, 34(9): 227-229

[5]Automatic caption location and extraction in digital video based on support vector machine[J]. Journal of computer-aided design &

computer graphics, 2002, 14(8): 1-3

[6]ZHANG Yin, PAN Yunhe. A new approach for text extraction from color image and video[J]. Journal of computer_aided design &

computer graphics, 2002, 14(1): 1-5

[7]Xu Zhao, KAI-Hsiang Lin, Yun Fu. Text From Corners: A Novel Approach to Detect Text and

Caption in

Videos[J].

IEEE

transactions on image processing, 2011, 20(3): 790-798

[8]ZHANG Yang, ZHU Ming. News Captions Detection Based on Corner Detection and Adaptive Threshold[J]. Computer

Engineering, 2009, 35(13): 186-187

[9]LIU Ya-zhou, LIU Guo-rong, WANG Tian-jia. Text detection in color images based on Harris corner[J]. Micro electronics &

computer, 2010, 27(10): 136-139

[10]Michael R. Lyu, Jiqiang Song, Min Cai. A Comprehensive Method for Multilingual Video Text Detection, Localization, and

Extraction[J]. IEEE transactions on circuits and systems for video technology, 2005, 15(2): 243-255

[11]Qixiang Ye, Qingming Huang, Wen Gao, Debin Zhao. Fast and robust text detection in images and video frames[J]. Image and

Vision Computing, 23 (2005): 565-576

[12]Palaiahnakote Shivakumara, Trung Quy Phan, Chew Lim Tan. A Laplacian Approach to Multi-Oriented Text Detection in Video[J].

IEEE transactions on pattern and machine intelligence, 2011, 33(2): 412-419

【作者简介】

1赵云兰(1987-),女,汉族,硕士,学生。研究方向:图像处理、模式识别与智能系统。学习经历:2007-2011,就读于山东工商学院通信工程专业(学士),2011-2014就读于西安交通大学软件工程专业(硕士)。

Email: 617732720@https://www.wendangku.net/doc/bb220753.html, 2宋永红(1967-),女,汉族,学士,高级工程师。研究方向:图像处理、模式识别与智能系统、软件工程。学习经历:1985-1989年就读于西安交通大学计算机科学与工程系。

Email: songyh@https://www.wendangku.net/doc/bb220753.html,

3周颐(1962-),男,汉族,学士,副编审。研究方向:图像处理、模式识别与智能系统。学习经历:毕业于中国传媒大学电视编导专业。

Email: zhouqinhan@https://www.wendangku.net/doc/bb220753.html,

边缘检测

CSDN亲密携手阿里云重磅推出云邮箱服务HTML5群组诚募管理员,“活跃之星”活动火热进行中Canny边缘检测算法原理及其VC实现详解(一) 2011-10-20 21:39560人阅读评论(0)收藏举报图象的边缘是指图象局部区域亮度变化显著的部分,该区域的灰度剖面一般可以看作是一个阶跃,既从一个灰度值在很小的缓冲区域内急剧变化到另一个灰度相差较大的灰度值。图象的边缘部分集中了图象的大部分信息,图象边缘的确定与提取对于整个图象场景的识别与理解是非常重要的,同时也是图象分割所依赖的重要特征,边缘检测主要是图象的灰度变化的度量、检测和定位,自从1959提出边缘检测以来,经过五十多年的发展,已有许多中不同的边缘检测方法。根据作者的理解和实践,本文对边缘检测的原理进行了描述,在此基础上着重对Canny检测算法的实现进行详述。 本文所述内容均由编程验证而来,在实现过程中,有任何错误或者不足之处大家共同讨论(本文不讲述枯燥的理论证明和数学推导,仅仅从算法的实现以及改进上进行原理性和工程化的描述)。 1、边缘检测原理及步骤 在之前的博文中,作者从一维函数的跃变检测开始,循序渐进的对二维图像边缘检测的基本原理进行了通俗化的描述。结论是:实现图像的边缘检测,就是要用离散化梯度逼近函数根据二维灰度矩阵梯度向量来寻找图像灰度矩阵的灰度跃变位置,然后在图像中将这些位置的点连起来

就构成了所谓的图像边缘(图像边缘在这里是一个统称,包括了二维图像上的边缘、角点、纹理等基元图)。 在实际情况中理想的灰度阶跃及其线条边缘图像是很少见到的,同时大多数的传感器件具有低频滤波特性,这样会使得阶跃边缘变为斜坡性边缘,看起来其中的强度变化不是瞬间的,而是跨越了一定的距离。这就使得在边缘检测中首先要进行的工作是滤波。 1)滤波:边缘检测的算法主要是基于图像强度的一阶和二阶导数,但导数通常对噪声很敏感,因此必须采用滤波器来改善与噪声有关的边缘检测器的性能。常见的滤波方法主要有高斯滤波,即采用离散化的高斯函数产生一组归一化的高斯核(具体见“高斯滤波原理及其编程离散化实现方法”一文),然后基于高斯核函数对图像灰度矩阵的每一点进行加权求和(具体程序实现见下文)。 2)增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将图像灰度点邻域强度值有显著变化的点凸显出来。在具体编程实现时,可通过计算梯度幅值来确定。 3)检测:经过增强的图像,往往邻域中有很多点的梯度值比较大,而在特定的应用中,这些点并不是我们要找的边缘点,所以应该采用某种方法来对这些点进行取舍。实际工程中,常用的方法是通过阈值化方法来检测。 2、Canny边缘检测算法原理

几种常用边缘检测算法的比较

几种常用边缘检测算法的比较摘要:边缘是图像最基本的特征,边缘检测是图像分析与识别的重要环节。基于微分算子的边缘检测是目前较为常用的边缘检测方法。通过对Roberts,Sobel,Prewitt,Canny 和Log 及一种改进Sobel等几个微分算子的算法分析以及MATLAB 仿真实验对比,结果表明,Roberts,Sobel 和Prewitt 算子的算法简单,但检测精度不高,Canny 和Log 算子的算法复杂,但检测精度较高,基于Sobel的改进方法具有较好的可调性,可针对不同的图像得到较好的效果,但是边缘较粗糙。在应用中应根据实际情况选择不同的算子。 0 引言 边缘检测是图像分析与识别的第一步,边缘检测在计算机视觉、图像分析等应用中起着重要作用,图像的其他特征都是由边缘和区域这些基本特征推导出来的,边缘检测的效果会直接影响图像的分割和识别性能。边缘检测法的种类很多,如微分算子法、样板匹配法、小波检测法、神经网络法等等,每一类检测法又有不同的具体方法。目前,微分算子法中有Roberts,Sobel,Prewitt,Canny,Laplacian,Log 以及二阶方向导数等算子检测法,本文仅将讨论微分算子法中的几个常用算子法及一个改进Sobel算法。 1 边缘检测 在图像中,边缘是图像局部强度变化最明显的地方,它

主要存在于目标与目标、目标与背景、区域与区域( 包括不同色彩) 之间。边缘表明一个特征区域的终结和另一特征区域的开始。边缘所分开区域的内部特征或属性是一致的,而不同的区域内部特征或属性是不同的。边缘检测正是利用物体和背景在某种图像特征上的差异来实现检测,这些差异包括灰度、颜色或纹理特征,边缘检测实际上就是检测图像特征发生变化的位置。边缘的类型很多,常见的有以下三种: 第一种是阶梯形边缘,其灰度从低跳跃到高; 第二种是屋顶形边缘,其灰度从低逐渐到高然后慢慢减小; 第三种是线性边缘,其灰度呈脉冲跳跃变化。如图1 所示。 (a) 阶梯形边缘(b) 屋顶形边缘 (b) 线性边缘 图像中的边缘是由许多边缘元组成,边缘元可以看作是一个短的直线段,每一个边缘元都由一个位置和一个角度确定。边缘元对应着图像上灰度曲面N 阶导数的不连续性。如果灰度曲面在一个点的N 阶导数是一个Delta 函数,那么就

图像边缘检测算法体验步骤

图像边缘检测算法体验步骤 图像边缘检测算法体验步骤(Photoshop,Matlab)1. 确定你的电脑上已经安装了Photoshop和Matlab2. 使用手机或其他任何方式,获得一张彩色图像(任何格式),建议图像颜色丰富,分辨率比较高,具有比较明显的图像边界(卡通图像,风景图像,桌面图像)3. 将图像保存到一个能够找到的目录中,例如img文件夹(路径上没有汉字)4. 启动Photoshop,打开img文件夹中的图像5. 在工具箱中选择“矩形选择”工具,到图面上选择一个区域(如果分辨率比较高,建议不要太大,否则计算过程比较长)6. 点击下拉菜单【文件】-【新建】,新建一个与矩形选择框同样尺寸的Photoshop图像,不要求保存该图像7. 将该彩色图像转换为亮度图像,即点击下拉菜单【图像】-【模式】-【灰度】,如提示是否合并,选择“Yes”8. 将该单色的亮度图像另存为Windows的BMP文件,点击下拉菜单【文件】-【存储为】,在“存储为”窗口中,为该文件起一个名字,例如test1(保存为test1.bmp)9. 启动Matlab,将当期路径(Current Directory)定位到图像文件夹,例如这里的img文件夹10. 使用imread命令读入该图像,在命令行输入:>> f = imread(test1.bmp);11. 在Matlab中显示该图像,在命令行输入:>> figure, imshow(f)12. 然后,分别使用Matlab图像工具箱中的Edge函数,分别使用Sobel算法,高斯-拉普拉斯(Log)算法和Canny算法得到的边缘图像:在命令行输入:>> g_sobel = edge(f, sobel, 0.05); >> g_log = edge(f, log, 0.003, 2.25); >> g_canny = edge(f, canny, [0.04 0.10], 1.5);13 得到边缘图像计算结果后,显示这些边缘图像: >> figure, imshow(g_sobel) >> figure, imshow(g_log) >> figure, imshow(g_canny)14 可以用不同的图像做对比,后续课程解释算法后,可以变换不同的阈值,得到不同的边缘图像

边缘检测原理(内含三种算法)

边缘检测原理的论述

摘要 数字图像处理技术是信息科学中近几十年来发展最为迅速的学科之一。图像边缘是图像最基本的一种特征,边缘在图像的分析中起着重要的作用。边缘作为图像的一种基本特征,在图像识别、图像分割、图像增强以及图像压缩等的领域中有较为广泛的应用,其目的就是精确定位边缘,同时更好地抑制噪声。目前,数字图像处理技术被广泛应用于航空航天、通信、医学及工业生产等领域中。图像边缘提取的手段多种多样,本文主要通过MATLAB语言编程分别用不同的算子例如Roberts算子、Prewitt算子、Sobel算子、Kirsch 算子、Laplacian算子、Log算子和Canny算子等来实现静态图像的边缘检测,并且和检测加入高斯噪声的图像进行对比。阐述了不同算子在进行图像边缘提取的特点,并在此基础上提出利用小波变换来实现静态图像的边缘检测。 【关键字】图像边缘数字图像边缘检测小波变换 背景 图像处理就是对图像信息加工以满足人的视觉心理或应用需求的方法。图像处理方法有光学方法和电子学方法。从20世纪60年

代起随着电子计算机和计算技术的不断提高和普及,数字图像处理进入了高速发展时期,而数字图像处理就是利用数字计算机或其它的硬件设备对图像信息转换而得到的电信号进行某些数学处理以提高图像的实用性。 计算机进行图像处理一般有两个目的:(1)产生更适合人观察和识别的图像。(2)希望能由计算机自动识别和理解图像。数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域的重要基础,图像处理和分析的第一步往往就是边缘检测。 边缘是图象最基本的特征.边缘检测在计算机视觉、图象分析等应用中起着重要的作用,是图象分析与识别的重要环节,这是因为子图象的边缘包含了用于识别的有用信息.所以边缘检测是图像分析和模式识别的主要特征提取手段。 所谓边缘是指其周围像素灰度后阶变化或屋顶状变化的那些像素的集合,它存在于目标与背景、目标与目标、区域与区域,基元与基元之间。因此它是图象分割所依赖的重要的特征,也是纹理特征的重要信息源和形状特征的基础;而图象的纹理形状特征的提取又常常依赖于图象分割。图象的边缘提取也是图象匹配的基础,因为它是位置的标志,对灰度的变化不敏感,它可作为匹配的特征点。 图象的其他特征都是由边缘和区域这些基本特征推导出来 的.边缘具有方向和幅度两个特征.沿边缘走向,像素值变化比较平缓;而垂直与边缘走向,则像素值变化比较剧烈.而这种剧烈可能呈

实验三图像分割与边缘检测

数字图像处理实验报告 学生姓名王真颖 学生学号L0902150101 指导教师梁毅雄 专业班级计算机科学与技术1501 完成日期2017年11月06日

计算机科学与技术系信息科学与工程学院

目录 实验一.................................................................................................. 错误!未定义书签。 一、实验目的.................................................................................................... 错误!未定义书签。 二、实验基本原理 ........................................................................................... 错误!未定义书签。 三、实验内容与要求....................................................................................... 错误!未定义书签。 四、实验结果与分析....................................................................................... 错误!未定义书签。实验总结............................................................................................... 错误!未定义书签。参考资料.. (3) 实验一图像分割与边缘检测 一.实验目的 1. 理解图像分割的基本概念; 2. 理解图像边缘提取的基本概念; 3. 掌握进行边缘提取的基本方法;

图像边缘检测方法比较研究

图像边缘检测方法比较研究 作者:关琳琳孙媛 来源:《现代电子技术》2008年第22期 摘要:边缘检测在数字图像处理中有着重要的作用。系统分析目前具有代表性的边缘检测方法,并用IDL6.3软件实现各种算法。实验结果表明,各种方法均有各自的优缺点和适用条件,在做图像边缘检测之前,应对图像进行分析,针对图像的特点和应用需求选用合适的方法。 关键词:边缘检测;检测算子;高通滤波;小波变换 中图分类号:TP391文献标识码:A 文章编号:1004-373X(2008)22-096-03 Comparison of Image Edge Detection Methods GUAN Linlin1,SUN Yuan2 (1.Department of Resource Science and Technology,Beijing Normal University,Beijing,100875,China; 2.96656 Unit of Second Artillery F orces,Chinese People′s Liberation Army,Beijing,100820,China) Abstract:Edge detection plays an important role in digital image processing.This paper comprehensively analyze the representative methods of edge detection at present,and realizes each algorithm with the IDL6.3 software.Results indicate that each method has some advantages and limitations.It should be carefully selected according to the characteristics of the image as well as application needs before conducting edge detection. Keywords:edge detection;detective operators;high-pass filtering;wavelet transform 1 引言 边缘检测技术是图像特征提取中的重要技术之一,也是图像分割、目标区域识别、区域形状提取等图像分析方法的基础。近年来,边缘检测技术被广泛地应用在各个领域,例如工程技术中零件检查[1]、医学中器官病变状况观察[2]、遥感图像处理中道路等典型地物的提取[3]以及估算遥感平台的稳定精度[4]等。这使得如何快速、准确地获得边缘信息成为国内外研究的热点。边缘检测方法在空间域和频域中均可以实现,而且不断涌现出新技术新方法。这些方法

目前为止全球最完美解决上下格式,左右格式字幕方案!

[原创]目前为止全球最完美解决上下格式,左右格式字幕方案! 本帖最后由 lsas 于 4/7/2011 12:06 编辑 在电脑上看3D的人都会碰到上下格式,左右格式加载文本字幕的难题。 网上目前的最普遍做法都是用ffdshow的3D字幕功能来解决左右格式的外挂文本,但其设定繁琐,而且在放普通视频时又得重新设定,令人不厌其烦。更令人无奈的时它对于上下格式的视频则毫无办法。只能跟其他普通播放器一样,一只眼睛有字幕,一只眼睛没字幕,导致字幕看起来闪烁不定,眼睛非常难受。 有没有什么更好的办法呢,回答是:有的。用一个叫3D Subtitler的软件将文本字幕转成图形字幕,这样就可以不用设定就能通杀2D,上下格式,左右格式。可是图形字幕的种种缺点却让人难以忍受。 难道就没有更好的办法了吗?在以前是没有更好的办法的了。 但现在我找到了一个非常简单而且有效的办法,可以简单到不用你做任何设定的地步,就可以让普通播放器近乎完美的正常播放外挂文本字幕的2D,上下格式,左右格式。 这是怎么做到的呢,其实非常的简单,就是利用文本字幕的字幕特效功能来对字幕进行定位。 具体怎么做呢,这里我就以SrtEdit字幕编辑器为例,向大家做个详细的介绍。 一:上下格式 用SrtEdit打开一个正常的文本字幕。

然后全选

在字幕区单击右键打开文本特效编辑 将字体缩放的纵向改为50%,位置坐标X改为192,Y改为124,确定。

将改完的文件另存为一个新的文件,这就完成了上半部字幕。

接下来做下半部字幕,单击撤销。 然后打开文本特效编辑 将字体缩放的纵向改为50%,位置坐标X改为192,Y改为268,这时候你会发现Y最多只能输入到255,怎么办?

Canny边缘检测

Canny边缘检测 图象的边缘是指图象局部区域亮度变化显著的部分,该区域的灰度剖面一般可以看作是一个阶跃,既从一个灰度值在很小的缓冲区域内急剧变化到另一个灰度相差较大的灰度值。图象的边缘部分集中了图象的大部分信息,图象边缘的确定与提取对于整个图象场景的识别与理解是非常重要的,同时也是图象分割所依赖的重要特征,边缘检测主要是图象的灰度变化的度量、检测和定位,自从1959提出边缘检测以来,经过五十多年的发展,已有许多中不同的边缘检测方法。根据作者的理解和实践,本文对边缘检测的原理进行了描述,在此基础上着重对Canny检测算法的实现进行详述。 本文所述内容均由编程验证而来,在实现过程中,有任何错误或者不足之处大家共同讨论(本文不讲述枯燥的理论证明和数学推导,仅仅从算法的实现以及改进上进行原理性和工程化的描述)。 1、边缘检测原理及步骤 在之前的博文中,作者从一维函数的跃变检测开始,循序渐进的对二维图像边缘检测的基本原理进行了通俗化的描述。结论是:实现图像的边缘检测,就是要用离散化梯度逼近函数根据二维灰度矩阵梯度向量来寻找图像灰度矩阵的灰度跃变位置,然后在图像中将这些位置的点连起来就构成了所谓的图像边缘(图像边缘在这里是一个统称,包括了二维图像上的边缘、角点、纹理等基元图)。 在实际情况中理想的灰度阶跃及其线条边缘图像是很少见到的,同时大多数的传感器件具有低频滤波特性,这样会使得阶跃边缘变为斜坡性边缘,看起来其中的强度变化不是瞬间的,而是跨越了一定的距离。这就使得在边缘检测中首先要进行的工作是滤波。 1)滤波:边缘检测的算法主要是基于图像强度的一阶和二阶导数,但导数通常对噪声很敏感,因此必须采用滤波器来改善与噪声有关的边缘检测器的性能。常见的滤波方法主要有高斯滤波,即采用离散化的高斯函数产生一组归一化的高斯核(具体见“高斯滤波原理及其编程离散化实现方法”一文),然后基于高斯核函数对图像灰度矩阵的每一点进行加权求和(具体程序实现见下文)。 2)增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将图像灰度点邻域强度值有显著变化的点凸显出来。在具体编程实现时,可通过计算梯度幅值来确定。

图像边缘检测方法的研究与实现刘法200832800066

图像边缘检测方法的研究与实现刘法200832800066

青岛大学专业课程设计 院系: 自动化学院 专业: 电子信息工程 班级: 08级电子信息工程3班学生姓名: 刘法 指导教师: 王汉萍庄晓东 日期: 2011年12月23日

题目:图像边缘检测方法的研究与实现 一、边缘检测以及相关概念 1.1边缘,边缘检测的介绍 边缘(edge)是指图像局部强度变化最显著的部分.边缘主要存在于目标与目标、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征和形状特征等图像分析的重要基础.图像分析和理解的第一步常常是边缘检测(edge detection). 边缘检测是指使用数学方法提取图像像元中具有亮度值(灰度)空间方向梯度大的边、线特征的过程。 在讨论边缘算子之前,首先给出一些术语的定义: 边缘点:图像中具有坐标] ,[j i且处在强度显著变化的位置上的点.边缘段:对应于边缘点坐标] i及其方位 ,边缘的方位可能是梯度角. ,[j 边缘检测器:从图像中抽取边缘(边缘点和边缘段)集合的算法. 轮廓:边缘列表,或是一条表示边缘列表的拟合曲线. 边缘连接:从无序边缘表形成有序边缘表的过程.习惯上边缘的表示采用顺时针方向序. 边缘跟踪:一个用来确定轮廊的图像(指滤波后的图像)搜索过程. 边缘点的坐标可以是边缘位置像素点的行、列整数标号,也可以在子像素分辨率水平上表示.边缘坐标可以在原始图像坐标系上表示,但大多数情况下是在边缘检测滤波器的输出图像的坐标系上表示,因为滤波过程可能导致图像坐标平移或缩放.边缘段可以用像素点尺寸大小的小线段定义,或用具有方位属性的一个点定义.请注意,在实际中,边缘点和边缘段都被称为边缘.边缘连接和边缘跟踪之间的区别在于:边缘连接是把边缘检测器产生的无序边缘集作为输入,输出一个有序边缘集;边缘跟踪则是将一幅图像作为输入,输出一个有序边缘集.另外,边缘检测使用局部信息来决定边缘,而边缘跟踪使用整个图像信息来决定一个像素点是不是边缘. 1.2 边缘检测算子 边缘检测是图像特征提取的重要技术之一, 边缘常常意味着一个区域的终结和另一个区域的开始. 图像的边缘包含了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,而且还保护了目标的边界结构. 因此,边缘检测可以看做是处理许多复杂问题的关键. 边缘检测的实质是采用某种算法来提取出图像中对对象与背景间的交界线。图像灰度的变化情况可以用图像灰度分布的梯度来反映,因此可以用局部图像微分技术来获取边缘检测算子。经典的边缘检测方法是对原始图像中的像素的某个邻域来构造边缘检测算子。以下是对几种经典的边缘检测算子进行理论分析,并对各自的性能特点做出比较和评价。 边缘检测的原理是:由于微分算子具有突出灰度变化的作用,对图像进行微分运算,在图像边缘处其灰度变化较大,故该处微分计算值教高,可将这些微分值作为相应点的边缘强度,通过阈值判别来提取边缘点,即如果微分值大于阈值,则为边缘点。

影音把视频和字幕合并的简单办法

QQ影音能把视频文件和字幕文件合并起来的简单办法 1)用QQ影音打开视频文件,并导入外挂字幕文件。 2)点击QQ影音播放器右下角的图标,在弹出的对话框中点击 3)截取你选取的视频,两个坐标间是截取 的片段,还可以再微调到最合适开始和结束。 4)点击“保存”,出现的对话框, 必须必须必须点击“保存视频”,否则字幕就不能和视频结合在一起的!保存格式 自定。 大功告成啦,该方法不必用其他专业软件,就能快速便捷合并字幕和视频。网友们,你们也试试吧。^_^倚窗远眺,目光目光尽处必有一座山,那影影绰绰的黛绿色的影,是春天的颜色。周遭流岚升腾,没露出那真实的面孔。面对那流转的薄雾,我会幻想,那里有一个世外桃源。在天阶夜色凉如水的夏夜,我会静静地,静静地,等待一场流星雨的来临… 许下一个愿望,不乞求去实现,至少,曾经,有那么一刻,我那还未枯萎的,青春的,诗意的心,在我最美的年华里,同星空做了一次灵魂的交流…

秋日里,阳光并不刺眼,天空是一碧如洗的蓝,点缀着飘逸的流云。偶尔,一片飞舞的落叶,会飘到我的窗前。斑驳的印迹里,携刻着深秋的颜色。在一个落雪的晨,这纷纷扬扬的雪,飘落着一如千年前的洁白。窗外,是未被污染的银白色世界。我会去迎接,这人间的圣洁。在这流转的岁月里,有着流转的四季,还有一颗流转的心,亘古不变的心。 When you are old and grey and full of sleep, And nodding by the fire, take down this book, And slowly read, and dream of the soft look Your eyes had once, and of their shadows deep; How many loved your moments of glad grace, And loved your beauty with love false or true, But one man loved the pilgrim soul in you, And loved the sorrows of your changing face; And bending down beside the glowing bars, Murmur, a little sadly, how love fled And paced upon the mountains overhead And hid his face amid a crowd of stars. 5)

图像边缘检测方法的研究与实现刘法200832800066

青岛大学 专业课程设计 院系: 自动化学院 专业: 电子信息工程 班级: 08级电子信息工程3班 学生姓名: 刘法 指导教师: 王汉萍庄晓东 日期: 2011年12月23日 题目:图像边缘检测方法的研究与实现 一、边缘检测以及相关概念 1.1边缘,边缘检测的介绍 边缘(edge)是指图像局部强度变化最显著的部分.边缘主要存在于目标与目标、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征和形状特征等图像分析的重要基础.图像分析和理解的第一步常常是边缘检测(edge detection). 边缘检测是指使用数学方法提取图像像元中具有亮度值(灰度)空间方向梯度大的边、线特征的过程。 在讨论边缘算子之前,首先给出一些术语的定义: 边缘点:图像中具有坐标] i且处在强度显著变化的位置上的点. ,[j 边缘段:对应于边缘点坐标] i及其方位 ,边缘的方位可能是梯度角. ,[j 边缘检测器:从图像中抽取边缘(边缘点和边缘段)集合的算法. 轮廓:边缘列表,或是一条表示边缘列表的拟合曲线. 边缘连接:从无序边缘表形成有序边缘表的过程.习惯上边缘的表示采用顺时针方向序. 边缘跟踪:一个用来确定轮廊的图像(指滤波后的图像)搜索过程. 边缘点的坐标可以是边缘位置像素点的行、列整数标号,也可以在子像素分辨率水平上表示.边缘坐标可以在原始图像坐标系上表示,但大多数情况下是在边缘检测滤波器的输出图像的坐标系上表示,因为滤波过程可能导致图像坐标平移或缩放.边缘段可以用像素点尺寸大小的小线段定义,或用具有方位属性的一个点定义.请注意,在实际中,边缘点和边缘段都被称为边缘.

边缘连接和边缘跟踪之间的区别在于:边缘连接是把边缘检测器产生的无序边缘集作为输入,输出一个有序边缘集;边缘跟踪则是将一幅图像作为输入,输出一个有序边缘集.另外,边缘检测使用局部信息来决定边缘,而边缘跟踪使用整个图像信息来决定一个像素点是不是边缘. 1.2 边缘检测算子 边缘检测是图像特征提取的重要技术之一, 边缘常常意味着一个区域的终结和另一个区域的开始. 图像的边缘包含了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,而且还保护了目标的边界结构. 因此,边缘检测可以看做是处理许多复杂问题的关键. 边缘检测的实质是采用某种算法来提取出图像中对对象与背景间的交界线。图像灰度的变化情况可以用图像灰度分布的梯度来反映,因此可以用局部图像微分技术来获取边缘检测算子。经典的边缘检测方法是对原始图像中的像素的某个邻域来构造边缘检测算子。以下是对几种经典的边缘检测算子进行理论分析,并对各自的性能特点做出比较和评价。 边缘检测的原理是:由于微分算子具有突出灰度变化的作用,对图像进行微分运算,在图像边缘处其灰度变化较大,故该处微分计算值教高,可将这些微分值作为相应点的边缘强度,通过阈值判别来提取边缘点,即如果微分值大于阈值,则为边缘点。 Roberts,Sobel,Prewwit是基于一阶导数的边缘检测算子,图像的边缘检测是通过2*2或者3*3模板作为核与该图像中的每个像素点做卷积和运算,然后选取合适的阈值以提取边缘。 Laplace边缘检测算子是基于二阶导数的边缘检测算子,该算子对噪声敏感。Laplace算子的改进方式是先对图像进行平滑处理,然后再应用二阶导数的边缘检测算子,其代表是拉普拉斯高斯(LOG)算子。前边介绍的边缘检测算法是基于微分方法的,其依据是图像的边缘对应一阶导数的极大值点和二阶导数过零点。Canny算子是另外一类边缘检测算子,它不是通过微分算子检测边缘,而是在满足一定约束条件下推导出的边缘检测最优化算子。 1.3 边缘检测算法 对于边缘的检测常常借助于空域微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘。灰度边缘是灰度值不连续(或突变) 的结果,这种不连续常可利用求一阶和二阶导数方便地检测到。已有的局部技术边缘检测方法,主要有一次微分(Sobel 算子、Robert s 算子等) 、二次微分(拉普拉斯算子等)。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像,大多数提取算法均可以取得较好的效果。但对于边缘复杂、采光不均匀的图像来说,则效果不太理想。主要表现为边缘模糊、边缘非单像素宽、弱边缘丢失和整体边缘的不连续等方面。 用算子检测图像边缘的方法是用小区域模板对图像进行处理,即采用卷积核作为掩模模板在图像中依次移动,完成图像中每个像素点同模板的卷积运算,最终输出的边缘幅度结果可以检测出图像的边缘。卷积运算是一种邻域运算。图像处理认为:某一点像素的结果不但和本像素灰度有关,而且和其邻域点值有关。运用模板在图像上依此对每一个像素进行卷积, 即模板上每一个点的值与其在图像上当前位置对应的像素点值相乘后再相加,得出的值就是该点处理后的新值。 边缘检测算法有如下四个步骤:

图像边缘检测技术综述

第 42 卷增刊 1 中南大学学报(自然科学版) V ol.42 Suppl. 1 2011 年 9 月 Journal of Central South University (Science and Technology) Sep. 2011 图像边缘检测技术综述 王敏杰 1 ,杨唐文 1, 3 ,韩建达 2 ,秦勇 3 (1. 北京交通大学 信息科学研究所,北京,100044; 2. 中国科学院沈阳自动化研究所 机器人学国家重点实验室,辽宁 沈阳,110016; 3. 北京交通大学 轨道交通控制与安全国家重点实验室,北京,100044) 摘要:边缘检测是图像处理与分析中最基础的内容之一。首先介绍了几种经典的边缘检测方法,并对其性能进行 比较分析;然后,综述了近几年来出现的一些新的边缘检测方法;最后,对边缘检测技术的发展趋势进行了展望。 关键词:数字图像;边缘检测;综述 中图分类号:TP391.4 文献标志码:A 文章编号:1672?7207(2011)S1?0811?06 Review on image edge detection technologies W ANG Min-jie 1 , Y ANG Tang-wen 1,3 , HAN Jian-da 2 ,QIN Y ong 3 (1.Institute of Information Science,Beijing Jiaotong University, Beijing 100044, China? 2.State Key Laboratory of Robotics, Shenyang Institute of Automation, Chinese Academic of Science,Shenyang 110016, China? 3.State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044, China) Abstract: Edge detection is one of the most fundamental topics in the research area of image processing and analysis. First, several classical edge detection methods were introduced, and the performance of these methods was compared? then, several edge detection methods developed in the latest years were reviewed? finally, the trend of the research of the image edge detection in the future was discussed. Key words:digital image?edge detection?review 图像是人们从客观世界获取信息的重要来源 [1?2] 。 图像信息最主要来自其边缘和轮廓。所谓边缘是指其 周围像素灰度急剧变化的那些象素的集合,它是图像 最基本的特征。边缘存在于目标、背景和区域之 间 [3?4] ,它是图像分割所依赖的最重要的依据。边缘检 测 [5?8] 是图像处理和计算机视觉中的基本问题, 图像边 缘检测是图像处理中的一个重要内容和步骤,是图像 分割、目标识别等众多图像处理的必要基础 [9?10] 。因 此,研究图像边缘检测算法具有极其重要的意义。 边缘检测是计算机视觉和图像处理领域的一项基 本内容。准确、高效地提取出边缘信息一直是该领域 研究的重点内容 [11] 。最初的经典算法可分为边缘算子 法、曲面拟合法、模板匹配法、门限化法等。近年来, 随着数学理论和人工智能的发展,又出现了一些新的 边缘检测的算法 [12?13] ,如基于数学形态学的边缘检 测 [14] 、小波变换和小波包变换的边缘检测法 [15] 、基于 模糊理论的边缘检测法 [16?17] 、基于神经网络的边缘检 测法 [18] 、基于分形几何的边缘检测算法 [19] 、基于遗传 算法的边缘检测法 [20?21] 、漫射边缘的检测方法 [22] 、多 尺度边缘检测技术 [23] 、亚像素边缘的定位技术 [24] 、 收稿日期:2011?04?15;修回日期:2011?06?15 基金项目:轨道交通控制与安全国家重点实验室开放基金资助项目(RCS2010K02);机器人学国家重点实验室开放基金资助项目(RLO200801);北 京交通大学基本科研业务费资助项目(2011JBM019) 通信作者:王敏杰(1988-), 女, 黑龙江五常人, 硕士研究生, 从事图像处理和计算机视觉研究; 电话: 010-51468132; E-mail: wangminjie1118@https://www.wendangku.net/doc/bb220753.html,

边缘检测

边缘检测对于灰度级间断的检测是最为普遍的检测方法。 当我们沿着剖面线从左到右经过时,在进入和离开斜面的变化点,一阶导数为正。在灰度级不变的区域一阶导数为0.在边缘与黑色一边相关的跃变点二阶导数为正,在边缘与亮色一边相关的跃变点二阶导数为负,沿着斜坡和灰度为常数的区域为0. 结论:一阶导数可以用于检测图像中的一个点是否是边缘的点(也就是判断一个点是否在斜坡上)。同样,二阶导数的符号可以用于判断一个边缘像素是在边缘亮的一边还是暗的一边。暗的为正,亮的为负。 二阶导数的两条附加性质(1)对图像中的每条边缘二阶导数生成两个值(一个不希望得到的特点);(2)一条连接二阶导数正极值和负极值的虚构直线将在边缘中点附近穿过零点。二阶导数的这个过零点的性质对于确定粗边线的中心非常有用。 浅黑色和白色的线是如图所描述的正和负的分量。 灰色描绘了由于比例缩放而生成的零点。 结论:为了对有意义的边缘点进行分类,与这个点相联系的灰度级变换必须比在这一点的背景上的变换更为有效。由于我们用局部计算进行处理,决定一个值是否有效的选择方法就是使用门限。图像中的一阶导数用梯度计算,二阶导数使用拉普拉斯算子得到。 一幅数字图像的一阶导数是基于各种二维梯度的近似值。 边缘在(x,y)处的方向与此点的梯度向量的方向垂直。 所有模版中的系数总和为零,表示正如导数算子中所预示的,此时在灰度级不变的区域,模版响应为0. 拉普拉斯算子一般不以其原始形式用于边缘检测是由于存在下列原因:作为一个二阶导数,拉普拉斯算子对噪声具有无法接受的敏感性;拉普拉斯算子的幅值产生双边缘,这是复杂的分割不希望有的结果;最后,拉普拉斯算子不能检测边缘的方向。 拉普拉斯算子在分割中所起的作用:(1)利用它的零交叉的性质进行边缘定位(2)确定一个像素是在一条边缘暗的一边还是亮的一边。 函数edge()是专门提取图像边缘的,输入原图像,输出是二值图像、边缘为1,其它像素为0。B=edge(A,F,T) A为输入灰度图像,F是算子,T是阈值,决定检测边缘的强度,T值小检出的边缘多,T值大检测出的边缘少。 图像病灶边缘检测。分别选用Roberts算子、Prewitt算子、Sobel算子、Laplacian算子和Canny算子对图像进行边缘提取发现病灶。 使用数学方法提取图像像元中具有亮度值(灰度)空间方向梯度大的边、线特征的过程。

边缘检测算子比较

边缘检测算子比较 不同图像灰度不同,边界处一般会有明显的边缘,利用此特征可以分割图像。需要说明的是:边缘和物体间的边界并不等同,边缘指的是图像中像素的值有突变的地方,而物体间的边界指的是现实场景中的存在于物体之间的边界。有可能有边缘的地方并非边界,也有可能边界的地方并无边缘,因为现实世界中的物体是三维的,而图像只具有二维信息,从三维到二维的投影成像不可避免的会丢失一部分信息;另外,成像过程中的光照和噪声也是不可避免的重要因素。正是因为这些原因,基于边缘的图像分割仍然是当前图像研究中的世界级难题,目前研究者正在试图在边缘提取中加入高层的语义信息。 课题所用图像边缘与边界应该算是等同的。 在实际的图像分割中,往往只用到一阶和二阶导数,虽然,原理上,可以用更高阶的导数,但是,因为噪声的影响,在纯粹二阶的导数操作中就会出现对噪声的敏感现象,三阶以上的导数信息往往失去了应用价值。二阶导数还可以说明灰度突变的类型。在有些情况下,如灰度变化均匀的图像,只利用一阶导数可能找不到边界,此时二阶导数就能提供很有用的信息。二阶导数对噪声也比较敏感,解决的方法是先对图像进行平滑滤波,消除部分噪声,再进行边缘检测。不过,利用二阶导数信息的算法是基于过零检测的,因此得到的边缘点数比较少,有利于后继的处理和识别工作。 各种算子的存在就是对这种导数分割原理进行的实例化计算,是为了在计算过程中直接使用的一种计算单位; Roberts算子:边缘定位准,但是对噪声敏感。适用于边缘明显且噪声较少的图像分割。Roberts边缘检测算子是一种利用局部差分算子寻找边缘的算子,Robert算子图像处理后结果边缘不是很平滑。经分析,由于Robert算子通常会在图像边缘附近的区域内产生较宽的响应,故采用上述算子检测的边缘图像常需做细化处理,边缘定位的精度不是很高。Prewitt算子:对噪声有抑制作用,抑制噪声的原理是通过像素平均,但是像素平均相当于对图像的低通滤波,所以Prewitt算子对边缘的定位不如Roberts算子。 Sobel算子:Sobel算子和Prewitt算子都是加权平均,但是Sobel算子认为,邻域的像素对当前像素产生的影响不是等价的,所以距离不同的像素具有不同的权值,对算子结果产生的影响也不同。一般来说,距离越远,产生的影响越小。 Isotropic Sobel算子:加权平均算子,权值反比于邻点与中心点的距离,当沿不同方向检测边缘时梯度幅度一致,就是通常所说的各向同性。 在边沿检测中,常用的一种模板是Sobel 算子。Sobel 算子有两个,一个是检测水平边沿的;另一个是检测垂直平边沿的。Sobel算子另一种形式是各向同性Sobel(Isotropic Sobel)算子,也有两个,一个是检测水平边沿的,另一个是检测垂直平边沿的。各向同性Sobel 算子和普通Sobel算子相比,它的位置加权系数更为准确,在检测不同方向的边沿时梯度的幅度一致。由于建筑物图像的特殊性,我们可以发现,处理该类型图像轮廓时,并不需要对梯度方向进行运算,所以程序并没有给出各向同性Sobel算子的处理方法。 由于Sobel算子是滤波算子的形式,用于提取边缘,可以利用快速卷积函数,简单有效,因此应用广泛。美中不足的是,Sobel算子并没有将图像的主体与背景严格地区分开来,换言之就是Sobel算子没有基于图像灰度进行处理,由于Sobel算子没有严格地模拟人的视觉生理特征,所以提取的图像轮廓有时并不能令人满意。在观测一幅图像的时候,我们往往首先注意的是图像与背景不同的部分,正是这个部分将主体突出显示,基于该理论,我们可以给出阈值化轮廓提取算法,该算法已在数学上证明当像素点满足正态分布时所求解是最优的。

边缘检测

图像最基本的特征是边缘,边缘是图像分割所依赖的最重要特征。经典的边缘检测方法,是对原始图像按像素的某领域构造边缘检测算子。本文就这些算子进行理论分析、实际验证并对各自性能特点作出比较和评价,以便实际应用中更好地发挥其长处,为新方法的研究提供衡量尺度和改进依据。 1经典的边缘检测方法 经典的边缘检测是以原始图像为基础,对图像的各个像素考察它的某个领域内灰度阶跃变化,利用边缘邻近一阶或二阶方向导数变化规律检测边缘。常用的边缘检测方法有:差分边缘检测、梯度边缘检测、Roberts边缘检测算子、Sobel边缘检测算子、Prewitt边缘检测算子、Laplace边缘检测算子等。 1.1差分边缘检测方法 利用像素灰度的一阶导数算子在灰度迅速变化处得到高值。它在某一点的值就代表该点的‘边缘强度’,可以对这些值设置门限明确地从图像中检测到边缘元。用差分检测边缘必须使差分的方向与边缘方向垂直,这就需要对图像的不同方向都进行差分运算,增加了实际运算的繁琐性。 1.2梯度边缘检测方法 梯度运算是一种不受施加运算方向限制的算子,既能检测出边缘的存在(幅度突变),又与施加运算的方向无关。 1.3Roberts边缘检测算子 Roberts边缘检测算子根据任意一对互相垂直方向上的差分可用来计算梯度的原理,采用对角线方向相邻两像素之差,即 (1) 它们的卷积算子为 有了Δxf,Δyf之后,很容易计算出Roberts的梯度幅值R(i,j),适当取门限TH,作如下判断:R(i,j)>TH ,(i,j)为阶跃状边缘点.{R(i,j)}为边缘图像。 1.4Sobel边缘检测算子 对数字图像{f(i,j)}的每个像素,考察它上、下、左、右邻点灰度的加权差,与之接近的邻点的权大。据此,定义Sobel算子如下: (2) 卷积算子为 适当取门限TH,作如下判断:S(i,j)>TH ,(i,j)为阶跃状边缘点.{S(i,j)}为边缘图像。 1.5Prewitt边缘检测算子 对数字图像{f(i,j)}的每个像素,考察它上、下、左、右邻点灰度之差。据此,定义Prewitt 算子如下: (3)

基于数学形态学的图像边缘检测方法研究文献综述

文献综述 课题:基于数学形态学的图像边缘检测方法研究 边缘检测是图像分割的核心容,而图像分割是由图像处理到图像分析的关键步骤,在图像工程中占据重要的位置,对图象的特征测量有重要的影响。图像分割及基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。从而边缘检测在图像工程中占有重要的地位和作用。因此对边缘检测的研究一直是图像技术研究中热点,人们对其的关注和研究也是日益深入。 首先,边缘在边界检测、图像分割、模式识别、机器视觉等中有很重要的作用。边缘是边界检测的重要基础,也是外形检测的基础。同时,边缘也广泛存在于物体与背景之间、物体与物体之间,基元与基元之间,是图像分割所依赖的重要特征。其次,边缘检测对于物体的识别也是很重要的。第一,人眼通过追踪未知物体的轮廓而扫视一个未知的物体。第二,如果我们能成功地得到图像的边缘,那么图像分析就会大大简化,图像识别就会容易得多。第三,很多图像并没有具体的物体,对这些图像的理解取决于它们的纹理性质,而提取这些纹理性质与边缘检测有极其密切的关系。 理想的边缘检测是能够正确解决边缘的有无、真假、和定向定位。长期以来,人们一直关心这一问题的研究,除了常用的局

部算子及以后在此基础上发展起来的种种改进方法外,又提出了许多新的技术,其中,比较经典的边缘检测算子有 Roberts cross算子、Sobel算子、Laplacian算子、Canny算子等,近年来又有学者提出了广义模糊算子,形态学边缘算子等。这些边缘检测的方法各有其特点,但同时也都存在着各自的局限性和不足之处。 本次研究正是在已有的算法基础上初步进行改进特别是形 态学边缘算子,以期找到一个更加简单而又实用的算子,相信能对图像处理中的边缘检测方法研究以及应用有一定的参考价值。 一、课题背景和研究意义: 伴随着计算机技术的高速发展,数字图像处理成为了一门新兴学科,并且在生活中的各个领域得以广泛应用。图像边缘检测技术则是数字图像处理和计算机视觉等领域最重要的技术之一。在实际图像处理中,图像边缘作为图像的一种基本特征,经常被用到较高层次的图像处理中去。边缘检测技术是图像测量、图像分割、图像压缩以及模式识别等图像处理技术的基础,是数字图像处理重要的研究课题之一。 边缘检测是图像理解、分析和识别领域中的一个基础又重要的课题, 边缘是图像中重要的特征之一,是计算机视觉、模式识别等研究领域的重要基础。图像的大部分主要信息都存在于图像的边缘中,主要表现为图像局部特征的不连续性,是图像中灰度变化比较强烈的地方,也即通常所说的信号发生奇异变化的地

相关文档
相关文档 最新文档