最近在做头发检测的算法研究,在此做个总结。
发色检测目前主要的方法有:1,基于颜色空间统计的发色检测;2,基于概率模型、高斯模型的发色检测;3,基于神经网络机器学习的发色检测;
这三种方法中,最稳定的是第3种,但是该方法实现起来比较复杂,样本量大;最简单的是第1种,但是不精确;
说实在的,这三种方法,都没办法完美检测发色,也就是没办法避开同色的干扰,不过,今天本人还是要介绍一种,相对来讲,比较实用的方法:
本文的算法使用最简单的颜色空间模型和概率模型,参考文献为:《Hair color modeling and head detection》,在此文献基础上修改而成。
为了便于理解,本文直接介绍算法实现过程,相信大家对于没用的也不太想看呵呵,因此,对于理论,大家没兴趣的可以跳过。
理论基础:
1,基于YCbCr颜色空间,对N个头发区域像素进行 采样统计,结果如下图:
![](https://box.kancloud.cn/2015-12-30_56837df183630.jpg)
2,将统计结果投影在Cb-Cr平面,结果如下:
![](https://box.kancloud.cn/2015-12-30_56837df19e763.jpg)
3,采用高斯混合概率模型对发色的色度概率分布进行描述:
![](https://box.kancloud.cn/2015-12-30_56837df1ae8f7.jpg)
![](https://box.kancloud.cn/2015-12-30_56837df1bf500.jpg)
4,根据Cb和Cr的取值范围对当前像素进行肤色判断:
if(Cb=115&&Cr>=115&&Cr<=143)
P(i,j)为发色
else
P(i,j)非发色
上面1-4的过程即论文《Hair color modeling and head detection》中所介绍的方法,测试效果如下:
![](https://box.kancloud.cn/2015-12-30_56837df1d4cb0.jpg)
![](https://box.kancloud.cn/2015-12-30_56837df2082fe.jpg)
经过我的测试,论文中的方法检测准确率很低,这里简单放上两张测试图,大家可以看到,误检率很高,把较多的背景和肤色都检测成了发色。
因此,本人对这个算法进行了改进,添加了一个约束条件:
由于发色主要是黑色为主,偏黄或者偏白,这几种情况都跟RGB三分量中的R分量关系最密切,因此,本人添加了R约束:R<Th
Th是经验值,这里我们实际使用中可以使用Th=60,这个值是我测试N张图的到的经验值,同时,也可以使用动态调节Th来获取发色区域,这里我
给出几张测试效果:
![](https://box.kancloud.cn/2015-12-30_56837df22a66e.jpg)
大家可以从效果上看出,改进的方法效果很不错,呵呵,最后改进后的判断条件如下:
if(Cb=115&&Cr>=115&&Cr<=143&&R<Th)
P(i,j)为发色
else
P(i,j)非发色
默认值Th = 60
这里,给出C#代码如下:
~~~
public Bitmap HairD(Bitmap src, int k )
{
Bitmap a = new Bitmap(src);
Rectangle rect = new Rectangle(0, 0, a.Width, a.Height);
System.Drawing.Imaging.BitmapData bmpData = a.LockBits(rect, System.Drawing.Imaging.ImageLockMode.ReadWrite, System.Drawing.Imaging.PixelFormat.Format24bppRgb);
int stride = bmpData.Stride;
unsafe
{
byte* pIn = (byte*)bmpData.Scan0.ToPointer();
byte* p;
int R, G, B;
double Cr, Cb, BrightV;
for (int y = 0; y < a.Height; y++)
{
for (int x = 0; x < a.Width; x++)
{
p = pIn;
R = p[2];
G = p[1];
B = p[0];
Cb = 128 - 37.797 * R / 255 - 74.203 * G / 255 + 112 * B / 255;
Cr = 128 + 112 * R / 255 - 93.768 * G / 255 - 18.214 * B / 255;
if (!(Cb >= 115 && Cb <= 141 && Cr >= 115 && Cr <= 143&&R<k))
{
pIn[0] = (byte)255;
pIn[1] = (byte)255;
pIn[2] = (byte)255;
}
pIn += 3;
}
pIn += stride - a.Width * 3;
}
}
a.UnlockBits(bmpData);
return a;
}
~~~
最后,放上一个DEMO,下载地址:[点击打开链接](http://download.csdn.net/detail/trent1985/9217947)