图像处理中的“能量”是什么?

问题描述 投票:20回答:13

我已经阅读了几本图像处理书籍和网站,但我仍然不确定图像处理中“能量”一词的真正定义。我找到了几个定义,但有时它们只是不匹配。

当我们在图像处理中说“能量”时,我们暗示什么?

image-processing computer-vision artificial-intelligence definition energy
13个回答
2
投票

图像处理中有“能量”的定义不止一个,因此它取决于使用它的位置。

当在诸如MAP(最大先验)估计的概率框架下结合马尔可夫随机场来制定操作时,能量被用于描述“信息”的度量。有时,能量可以是最小化的负面措施,有时它是最大化的积极措施。


1
投票

Snake算法是一种用于确定物体轮廓的图像处理技术,蛇只是带有一些约束的(X,Y)点矢量,其最终目标是围绕物体并描述其形状(轮廓)和然后通过其形状跟踪或表示对象。

该算法有两种能量,内部和外部。

内部能量(蛇能量)(IE)是用户定义的能量,它作用于蛇(内部)以对蛇的光滑度施加约束,没有这样的力,蛇的形状将最终与物体的确切形状这是不可取的,因为由于光线条件,图像质量,噪声等,很难获得物体的确切形状。

外部能量(EE)来自数据(图像强度),它只是x和y方向强度的绝对差值(强度梯度)乘以-1,与内部能量相加,因为总能量必须最小化。因此,所有蛇点的总能量应该最小化,理想情况下,当有边缘时,这会成为现实,因为边缘上的梯度或(EE)最大化,并且因为它乘以-1,所以总能量最近物体周围的蛇被最小化,因此算法收敛于解决方案,这有望成为研究对象的真实轮廓。

因为这种算法依赖于EE,它不仅边缘高而且噪声点高,有时蛇算法不会收敛到最优解,这就是为什么它是近似贪心算法。


1
投票

我在图像处理书上找到了这个;

能源:S_N = sum (from b=0 to b=L-1) of abs(P(b))^2

P(b) = N(b) / M

其中M表示以(j,k)为中心的邻域窗口中的像素总数,N(b)是同一窗口中幅度的像素数。

如果我们用熵看到这个等式,它可以让我们更好地理解;

熵:S_E = - sum (from b=0 to b=L-1) of P(b)log2{P(b)}

来源:Pp。由William K. Pratt编写的538~539数字图像处理(第4版)


0
投票

对于我目前的渲染漫射光源的成像项目,我想将能量视为光能或辐射能。我最初的问题:RGB“像素值”是否代表光能?可以使用光强度计来断言,并生成具有灰度像素值(n,n,n)的后续屏幕,用于0..255。根据matlabs forum的说法,1个灰度像素的辐射能量总是与其像素值成比例,但是像素到像素的辐射能量会略有不同。

关于能量还有另一个假设:在执行前向光线跟踪时,我会在每个采样位置命中时产生光线计数。该射线计数是或者优选地应该与在该位置处击中目标的辐射能量成比例。为了能够将它与实际拍摄的照片进行比较,我必须将光线计数标准化为某个像素值范围。(?)我在下面附上一个例子,能量源是一个黑暗圆柱体内的漫射光发射器。

enter image description here


-4
投票

Image Energy通过MATLAB使用以下公式计算:

image_energy = graycoprops(i1, {'energy'})

7
投票

它取决于上下文,但通常,在信号处理中,“能量”对应于信号的均方值(通常相对于全局平均值测量)。这个概念通常与Parseval theorem有关,它允许我们将总能量视为沿“频率”分布(因此可以说,例如,图像的大部分能量集中在低频)。

另一个相关用途是图像变换:例如,DCT变换(JPEG压缩方法的基础)将像素块(8×8图像)变换为变换系数矩阵;对于典型的图像,结果是,虽然原始8x8图像的能量均匀分布在64个像素中,但是变换后的图像的能量集中在左上“像素”中(再次对应于“低频”,在一些类似的意义上)。


5
投票

能量是一个相当宽松的术语,用于描述任何用户定义的函数(在图像域中)。

使用术语“能量”的动机是典型的物体检测/分割任务被视为能量最小化问题。我们定义能量来捕获我们想要的解决方案并执行梯度下降来计算其最低值,从而为图像分割提供解决方案。


4
投票

能量是衡量图像局部变化的指标。

能量获得了许多不同的名称和许多不同的背景,但往往指的是相同的东西。它是局部区域上像素的颜色/亮度/幅度的变化率。对于图像内部物体的边缘尤其如此,并且由于压缩的性质,这些区域是最难压缩的,因此可以猜测这些区域更重要,它们通常是边缘或快速渐变。这些是不同的背景,但它们指的是同一件事。

接缝雕刻算法使用能量的确定(使用梯度幅度)来找到被移除的最少注意力。 JPEG表示相对于第一个能量的局部像素簇。 Snake算法使用它来查找图像中物体的局部轮廓边缘。所以有很多不同的定义,但它们都指的是图像的那种魅力。无论是绝对亮度的平方还是在jpeg中压缩的硬位,或Canny边缘检测中的边缘或梯度幅度,本地像素的总和:

重要的是能量就是能量所在。

图像的能量更广泛地是某些地方的像素之间的某种质量的距离。

我们可以在适当加权的2d高斯内核中获取LABdE2000颜色距离的总和。这里将距离相加在一起,局部性由高斯核定义,质量为颜色,距离为2000年的LAB Delta公式(勘误表:此前声称E代表欧几里德,但标准ΔE的距离是欧几里得但是94和00的公式并不是严格的欧几里得,而'E'代表Empfindung;德语代表“感觉”)。我们还可以将局部3x3内核的局部亮度差异或亮度平方等加起来。我们需要测量图像的局部变化。

skull default

在此示例中,local定义为2d高斯内核,颜色距离定义为LabDE2000算法。

skull energy

如果您拍摄了一张图像并移动了所有像素,并出于某种原因按颜色对其进行了排序。你会减少图像的能量。您可以采集50%黑色像素和50%白色像素的集合,并将它们排列为随机噪声以获得最大能量,或将它们作为图像的两侧以获得最小能量。同样,如果您有100%的白色像素,无论您如何排列它们,能量都将为0。


2
投票

如果你认为(对于相机拍摄的自然图像)光是一种能量,你可以将能量称为某个通道上像素的值。

但是,我认为通过能量,书籍指的是谱密度。来自维基百科:

能谱密度描述了信号或时间序列的能量(或方差)如何随频率分布

http://en.wikipedia.org/wiki/Spectral_density


2
投票

回到我的化学反应 - 能量和熵是密切相关的术语。而熵和随机性也密切相关。因此在图像处理中,能量可能类似于随机性。例如,平原墙的图片能量较低,而从直升机拍摄的城市图片可能具有较高的能量。


2
投票

图像“能量”应与图像的Shannon entropy成反比。但正如已经说过的图像能量是松散耦合的术语,最好使用“压缩性”术语。也就是说 - 高图像“能量”应对应于高图像压缩率。

http://lcni.uoregon.edu/~mark/Stat_mech/thermodynamic_entropy_and_information.html


1
投票

能量就像“图像上的信息”。压缩图像会导致能量损失。我猜它是那样的。


1
投票

基于图像的标准化直方图来定义能量。能量显示灰度级如何分布。当灰度级数低时,能量很高。

© www.soinside.com 2019 - 2024. All rights reserved.