|
蓝森林 http://www.lslnet.com 2006年7月28日 20:08
gfw幕后的英雄
董开坤,胡铭曾,方滨兴 高性能图像处理计算结构研究
Web突发事件新闻内容过滤中的若干关键技术研究
刘永强,方滨兴,胡铭曾,云晓春 Linux下大流量捕包方法的研究与改进
高永英,章毓晋. 基于多级描述模型的渐进式图像内容理解
罗浩,云晓春,方滨兴 一种基于嵌入式协议栈的内容过滤防火墙技术
董开坤,胡铭曾,方滨兴 基于图像内容过滤的防火墙技术综述
董开坤,胡铭曾,方滨兴 一个并行图像处理模拟运行环境的研究与实现
晓群,季振洲 基于SSL的Web服务器安全实现策略的研究
胡铭曾,方滨兴,张宏莉 一个Internet路由器级拓扑自动发现系统
王佰玲,方滨兴,云晓春 传统报文捕获平台性能影响因素分析
杜阿宁,方滨兴,胡铭曾,云晓春 中文交互式网络搜索引擎及其自学习能力
贺龙涛,方滨兴,云晓春 关于在交换局域网进行主动捕包的研究
王东滨,方滨兴,云晓春 基于Web管理的网络监测技术的设计与实现
基于图像内容过滤的防火墙技术综述
1. 《一种基于词聚类的中文文本主题抽取方法》 《计算机应用 》2005 第四期 ISSN1001
-9081CN51-1307/TP 科学出版社
2. 《汉语文本聚类及其算法设计》 《山西电子技术》 2005.2
3.《信息过滤中用户兴趣变化研究》 《山西大学学报》 2004增刊
4、突发事件新闻文本主题抽去方法的研究
5、Web突发事件新闻个性化推荐方法的研究 硕士研究生学位论文
A survey of firewall technology based onimage content filtering
董开坤 胡铭曾 方滨兴
摘 要:介绍了基于图像内容过滤的防火墙技术的研究现状,给出了典型的防火墙系统结构,
对其中的关键技术进行了分析、讨论.
关键词:防火墙;图像内容;网络安全
分类号:TP393.08 文献标识码:A
文章编号:1000-436X(2003)01-0083-08
基金项目:国防"十五"预研基金资助项目(41316.3.3)
作者简介:董开坤(1969-),男,黑龙江哈尔滨人,哈尔滨工业大学博士生,主要研究方向为高
性能计算、网络安全;胡铭曾(1935-),男,江苏江阴人,哈尔滨工业大学教授,博士生导师,主
要研究方向为高性能计算机体系结构;方滨兴(1960-),男,黑龙江哈尔滨人,博士,国家计算机
网络与信息安全管理中心副主任兼总工程师,哈尔滨工业大学兼职教授,博士生导师,主要研
究方向为信息安全、计算机网络、并行计算.
作者单位:董开坤(哈尔滨工业大学,国家计算机信息内容安全重点实验室,黑龙江,哈尔
滨,150001)
胡铭曾(哈尔滨工业大学,国家计算机信息内容安全重点实验室,黑龙江,哈尔
滨,150001)
方滨兴(哈尔滨工业大学,国家计算机信息内容安全重点实验室,黑龙江,哈尔
滨,150001)
利用颜色和纹理特征的图像过滤方法
徐欣欣 袁华 张凌
(华南理工大学广东省计算机网络重点实验室,510640)
摘要:随着互联网络和多媒体技术的发展,色情图像的传播越发猖獗,影响恶劣.为了有效地防
止色情图像的传播,本文提出一种综合利用颜色和纹理特征的色情图像过滤方法,实验结果表
明,该方法具有较高的准确率.
关键字:图像过滤;HSV空间;粗细度
中图分类号:TP 391
1. 引言
近年来,随着互联网络的不断壮大发展,Internet用户持续高速增加,同时,网上信息源海量增
长,良莠不齐.各种不良信息,越来越多地借助于互连网络这种跨地域,跨国界,开放式的通讯
方式进行传播,其中色情图像的传播非常剧烈,影响恶劣.因此国内外采取一系列措施进行网
络反黄,反色情,包括:根据IP地址或URL控制色情网站的访问;根据文本信息限制访问;根据图
像内容实时过滤等[1].第一种措施直接,快捷,准确,但是需维护的数据量庞大且不能适应互
联网的高速发展.第二种措施受到语言种类,词汇多义性等的限制.对于互联网每年新增图片
数超过800亿[2]的今天,基于图像内容的分析过滤方式是实现网络反黄,反色情的最有效手段
.
美国衣阿华大学M.M. Fleck和加州大学伯克利分校 D.A. Forsyth等人研制的不良图像搜索
引擎Naked People Finder,斯坦福大学J.Z.Wang等人研究的不良图像分类系统WIPE,VIMA公
司2003年7月发布的图像过滤软件ImageBeagle等都是利用计算机视觉和图像理解技术对色情
图像进行识别和过滤的,取得了较好的效果.
色情图像具有一些自身的特点:它首先是一幅人体图像;其次是具有裸露肌肤,而且达到一定
的面积;具有一些特定的分布;进一步它还可能有一些关键部位的暴露.本文提出了一种综合
利用颜色和纹理特征的色情图像过滤方法,根据颜色和纹理特征建立的肤色模型和皮肤纹理
模型对图像进行检测识别,对含有大面积裸露肌肤的图像进行过滤.
2. 利用颜色和纹理特征的色情图像检测识别
色情图像的最主要特征是含有大量人体皮肤区域.因此,对色情图像的检测问题又可以归结为
皮肤检测[3].常见的皮肤检测方法是直接利用颜色模型,如:统计直方图模型,简单色度空间
模型,高斯混合模型等,直接将检测结果认为是皮肤区域.这样做会造成一定的误差,因为有些
符合肤色特征的区域未必就是皮肤区域,例如:黄色的草原,堆积的大豆.如果对这些肤色区域
再作纹理特征分析,将有助于降低误检率,所以本文的过滤方法综合利用颜色和纹理特征建立
模型.
2.1 肤色模型
在图像的低级特征中,颜色是最显著,最有区别性的视觉特征[4].建立肤色模型进行皮肤检测
是直接有效的方法.M.M.Fleck等[5]把图像每个象素的R,G,B值进行对数变换,进而计算出色
度和饱和度,根据色度和饱和度的阈值进行肤色分割.J.Z.Wang等[6]和H.Zheng等[7]在RGB空
间中利用统计的方法计算肤色分布的规律,从而分割肤色.段立娟等[8]通过对肤色色调在YUV
和YIQ颜色空间中的分布作线性化处理,得到图像中的肤色区域.尹显东等[9]找到HSV空间中
HS平面普遍代表黄种人肤色的区域.以上方法在实际应用中都有一定效果.
RGB空间是计算机显示的彩色空间,YUV和YIQ空间是彩色电视系统的彩色空间,它们在视觉上
与人眼识别有一定的偏差,因为根据研究所得,人的视觉是把物体的色调,饱和度和亮度独立
反映给大脑.HSV空间中的色度H,饱和度S和亮度V是三个相互独立的分量,在HSV空间分析颜色
比较符合人眼的视觉规律.因此,本文的肤色模型建立在HSV空间上.
本文在HSV空间对500幅具有明显裸露皮肤的色情图像进行分析,大约包含900多万个属于肤色
的象素点,以H分量的分布作初步统计,发现具有一定的分布规律(如图1所示).从图1可见H值
主要集中在0~0.1之间.经进一步统计分析得H值大量集中在一定范围之内,由此可得到肤色
在H分量上的阈值.
图1 色情图像的色度H的分布
Fig.1 Hue distribution of pornographic images
考虑到非皮肤区域也有可能呈现肤色色调,如果仅仅从色度的阈值判断是否象素是否为皮肤
肤色象素,就很容易把非皮肤区域的象素误判.因此需要利用统计方法计算阈值内肤色象素的
分布情况,从而给出各象素是肤色象素的概率.根据贝叶斯决策规则可得:
其中,,,,.
,分别是肤色象素与非肤色象素落入色度值的数目,与分别是统计模型中肤色象素总数与非肤
色象素总数.当概率值时,则可认为该象素为肤色象素.其中是阈值,.
本文利用500幅具有明显裸露皮肤的色情图像和1000幅不含人的正常图像(包括动植物,风景
等)作为训练集,建立起H分量的肤色统计模型.将该肤色模型(模型一)分别与M.M.Fleck等
[5](模型二),段立娟等[8](模型三),尹显东等[9](模型四)的肤色模型作肤色分割对比(如图
2,3,4所示,从左到右依次是原图,模型一,二,三,四的肤色分割图).分析图3,4可发现,模型三
,四容易受绿色,淡黄色背景,橙色的干扰.模型一,二也把图4的橙色上衣分割成皮肤.由此可
以看出,肤色模型有一定的局限性,因此必须采取其他方法弥补肤色模型的缺陷.本文利用纹
理特征模型方法.
图2 肤色分割对比一
Fig.2 Skin Segmentation Contrast I
图3 肤色分割对比二
Fig.3 Skin Segmentation Contrast II
图4 肤色分割对比三
Fig.4 Skin Segmentation Contrast III
2.2 纹理模型
纹理可认为是灰度(颜色)在空间以一定的形式变化而产生的图案,是真实图像区域固有的特
征之一.任何物体的表面,如果一直放大下去进行观察的话一定会显示出纹理.粗细度,对比度
,方向性,线状性,规则性,凹凸性等是一系列与视觉感受相关的纹理特征.常用的纹理描述方
法有:统计法,频谱法和结构法[10].本文利用统计法对图像纹理的对比度和粗细度进行分析
研究.
对比度(contrast)依赖于象素的灰度分布,可测量图像中局部的灰度变化.一种具体的计算公
式如下:.其中是图像灰度的标准方差,是图像灰度的4阶中心矩.
粗细度(coarseness)测量纹理的间隔尺寸/粒度,一种具体的计算公式如下:.其中能使X和Y方
向的最大化,的取值在0到5之间.
本文随机抽取训练集中的200幅色情图像和200幅正常图像进行肤色检测,分割出可能的皮肤
区域,分别计算这些区域的对比度和粗细度,得到图5的分布.
图5 纹理特征分布对比
(左边是色情图像,右边是正常图像)
Fig.5 Texture Distribution Contrast
(Pornographic images on the left, benign images on the right)
从图5第二行的左,右两幅分布图可以看出色情图像和正常图像的可能皮肤区域的纹理粗细度
分布有一定区别.正常图像的粗细度较小且分布分散,色情图像的粗细度较大且分布相对集中
,根据这一分布特点可以得到区分色情图像和正常图像的纹理粗细度阈值.
3. 试验结果与分析
本文在上述建立的肤色模型和纹理模型的基础上,对752幅色情图像和4000幅正常图像(包括
风景,建筑,动植物,日常生活照等)作过滤试验.首先对图像进行肤色检测,然后提取肤色区域
的纹理粗细度特征,如果满足模型的阈值范围,则认为该图像是色情图像.为提高识别效率,试
验只对肤色区域占图像总面积一定比例以上的图像作纹理特征分析.结果如表1所示,可以看
出,本文提出的图像过滤方法具有较高的准确率.
表1 图像过滤试验结果
Table 1 Result of image filtering test
试验图像数
正检图像数
误检图像数
正检率
误检率
Precision
Recall
色情图像
752
630
122
83.78%
16.22%
57.07%
83.78%
正常图像
4000
3526
474
88.15%
11.85%
通过试验发现本文提出的过滤方法还存在一定的误检率,对于某些图像没能作出正确的过滤.
这些影响过滤效果的因素有:
图像的光照条件不好,或者图像经过了特殊处理;
容易对日出或者日落时的天空和海面图像作出误过滤.
根据以上分析的影响因素,今后要对过滤方法作进一步的改进,可以继续完善颜色和纹理特征
的分析,还可以使用一些形状检测的方法提高检测过滤的准确率.
4. 小结
在互联网络信息膨胀,网上色情图像泛滥的今天,色情图像过滤技术的研究具有巨大的应用价
值.本文根据色情图像的内容特点,提出一种综合利用颜色和纹理特征的色情图像过滤方法,
实验结果表明,该方法具有较高的准确率.
参考文献
[1] 董开坤,胡铭曾,方滨兴.基于图像内容过滤的防火墙技术综述[J].通信学报,2003,24
(1):81-90.
[2] FRANCIS P. Image is everything[EB/OL].
http://www.tcbizreview.com/currentissue/internet0502.htm, 2002-07.
[3] 李雁,申铉京,赵德斌.基于纹理的皮肤检测[J].计算机工程与应用,2003,19:74-77.
[4] Yining Deng,B. S. Manjunath,Charles Kenney,Michael S. Moore. An Efficient
Color Representation for Image Retrieval. IEEE TRANSACTIONS ON IMAGE PROCESSING,
VOL. 10, NO. 1, JANUARY 2001
[5] M.M.Fleck, D.A.Forsyth, C.Bregler. Finding Naked People[A].In: Proceedings
of the 4th European Conference on Computer Vision[C].Cambridge,UK,1996,2:593-
602.
[6] J.Z.Wang,J.Li,G.Wiederhold, et al. System for screening objectionable
images[J]. Computer Communications, 1998, 21(15): 1355-1360.
[7] H.Zheng,M.Daoudi,B.Jedynak. Blocking Adult Images Based on Statistical Skin
Detection. Electronic Letters on Computer Vision and Image Analysis,2004.
[8] 段立娟,崔国勤,高文,等.多层次特定类型图像过滤方法[J].计算机辅助设计与图形学学
报,2002,14(5):404-409.
[9] 尹显东,唐丹,邓君,李在铭.基于内容的特定图像过滤方法[J].计算机测量与控
制,2004,12(3):283-286.
[10] 章毓晋 著.基于内容的视觉信息检索.北京:科学出版社,2003. 84-88.
Color and Texture-Based Method for Nude Image Filtering
Xu Xin-xin Yuan Hua Zhang Ling
(South China University of Technology, Guangdong key Laboratory of Computer
Network, 510640)
Abstract: With the development of Internet and multimedia, the rampant spread of
pornographic images becomes a very serious problem. This paper presents a color
and texture-based method for nude image filtering to avoid the problem.
Experiments show that pornographic images can be filtered accurately with this
method.
Keywords: image filtering; HSV space; coarseness
基金项目:本项目获高等学校优秀青年教师教学科研奖励计划资助和广东省科技攻关项目资
助(2004A10302003)
作者简介:徐欣欣(1979~),女,硕士生,主研方向:计算机网络与应用 |
| |