乐山住房和规划建设局门户网站,桂林seo代排名,从事建站业务还有前景吗,网络搭建drc图像数据不平衡问题
图像数据不平衡#xff1a;在进行图像分割时#xff0c;二分类问题中#xff0c;背景过大#xff0c;前景过小#xff1b;多分类问题中#xff0c;某一类别的物体体积过小。在很多图像数据的时候都会遇到这个情况#xff0c;尤其是在医学图像处理的…图像数据不平衡问题
图像数据不平衡在进行图像分割时二分类问题中背景过大前景过小多分类问题中某一类别的物体体积过小。在很多图像数据的时候都会遇到这个情况尤其是在医学图像处理的时候例如分割官腔轮廓、识别肿瘤、识别斑块等等。
图像数据不平衡会产生的问题占据绝大多数的类别会支配模型的训练过程导致模型只需要把占比大的类别分准损失就收敛了占比小的类别反而分的很差而我们很多时候需要分准的其实是占比小的类别。
这个问题的产生也和交叉熵损失函数有关。
交叉熵损失函数通常进行图像分割的时候都会使用交叉熵损失函数交叉熵的特点就是“平等”地看待每一个样本无论什么类别权重都是一样的。所以当正负样本不均衡时大量简单的负样本会占据主导地位少量的难样本和正样本就会分不出来。
Dice Loss
公式
之前在介绍深度学习指标的时候提到过Dice。
Dice可以计算集合的相似程度取值范围在[0,1]公式如下所示 D i c e ( X , Y ) 2 ∗ ∣ X ∩ Y ∣ ∣ X ∣ ∣ Y ∣ Dice(X,Y)\frac{2*|X\cap Y|}{|X||Y|} Dice(X,Y)∣X∣∣Y∣2∗∣X∩Y∣
Dice Loss表达式 1 − D i c e ( X , Y ) 1 − 2 ∗ ∣ X ∩ Y ∣ ∣ X ∣ ∣ Y ∣ 1-Dice(X,Y)1-\frac{2*|X\cap Y|}{|X||Y|} 1−Dice(X,Y)1−∣X∣∣Y∣2∗∣X∩Y∣
为什么能解决图像数据不平衡问题
进行图像二分类问题的时候X看作是Label标签像素点值集合Y看作是Prediction预测像素点值集合将前景真实值设为1背景真实值设为0。这样在计算Dice的时候求X和Y交集和并集就会把真实值为0的背景过滤掉相当于做了个mask掩码操作从而使得训练更关注我们要前景。 使用注意
在实际使用的时候损失函数并不会单纯使用Dice Loss通常都会和其他Loss结合起来用会给其他Loss和Dice Loss分别上不同的权重作为损失函数。
为什么不只简单Dice Loss在训练模型的时候我们通常都是要把模型训练到损失收敛才停下。而Dice Loss本身并不稳定Dice Loss是mask了背景的在前景目标很小的情况下一旦有少部分分类错误就会导致Dice Loss产生严重的震荡。而且背景预测不正确但是前景都预测涵盖了会导致Loss也非常低但实际上预测的并不对。