您的位置  > 互联网

传统滤波器设计的新深度卷积神经网络(DCNNS)

下载链接:

概括

传统的滤波器设计具有良好的可操作性(参数可调),例如Gabor滤波器,它使特征能够处理空间变换。 然而,这种优异的性能在目前流行的深度卷积神经网络(DCNNS)中还没有得到很好的研究。 本文提出了一种新的深度模型,称为Gabor卷积网络(GCN或Gabor CNN),将Gabor滤波器引入DCNNS中,以增强深度学习特征对方向和尺度变化的适应性(方向不变性和尺度不变性,因为一般深度卷积网络不具备这两个特性,除非添加了很多池化层)。 通过用 Gabor 滤波器替换 DCNNS 中的卷积算子,形成了一种新方法 GCN,并且与任何流行的深度学习架构兼容。 实验结果表明,该算法具有较强的目标识别能力,特别是在尺度和旋转频繁变化的目标识别方面。 所提出的 GCN 具有更少的可学习网络参数,因此更容易使用端到端进行训练。

1 简介

引言介绍了各向异性滤波技术在提取鲁棒图像特征方面的优势。 特别地,Gabor滤波器可以保持图像中的频域信息并提取提取方向取决于频率的模式内容。 尽管DCNNS可以实现端到端训练并提取鲁棒的数据驱动特征表示,但它往往需要较高的训练成本和模型复杂性,并且难以构造几何变化(方向变化和尺度变化)。 模型,因此在数据量不足时很难处理大目标和未知变化。 幸运的是,研究人员已经认识到增强模型转换能力的必要性,并在近年来做出了一些尝试。 例如,使用变形滤波器(如扩张卷积)以及与DCNNS结合可以提高网络对旋转的适应性,但这些方法相对复杂并且对于3D卷积来说难以实现。 另外,从视觉卷积滤波器的角度来看,这些滤波器具有参数冗余。 浅层滤波器与Gabor滤波器非常相似,如图1所示。众所周知,Gabor滤波器的可控特性在传统滤波器设计中得到了广泛的应用,因为它增强了信号的尺度和方向分解能力,同时DCNNS 中的大多数卷积滤波器不具备这些功能。 然而,将Gabor滤波器和DCNNS结合起来的研究却很少。 有些使用Gabor滤波器提取图像特征并将其发送到CNN,并通过Gabor滤波器固定第一或第二卷积层。 这主要是为了降低训练CNNs的复杂度。

图1 DCNNs卷积图像与Gabor滤波器模板对比

在本文中,我们建议使用传统的手工制作的 Gabor 滤波器来调整可学习的卷积滤波器,以减少可学习的网络参数的数量,并增强学习特征对方向和尺度变化的鲁棒性。 具体来说,在每个卷积层中,卷积滤波器通过不同方向和尺度的Gabor滤波器进行调制,产生卷积Gabor方向滤波器(GoFs),从而使卷积滤波器输出的特征中捕获空间位置、方向选择性和空间频率选择性。数字。 GoF 是在 CNN 的基本元素(即卷积滤波器)上实现的,因此可以轻松集成到任何深度的架构中。 带有 GoF 的 DCNN,称为 GCN,可以学习更鲁棒的特征表示,特别是对于具有空间变换的图像。 此外,由于 GoF 是基于一组小型可学习卷积滤波器生成的,因此所提出的 GCN 模型更紧凑且更易于训练。 主要贡献点:(1)Gabor滤波器首次集成到DCNN中,从而提高了后者对各种变化(例如变换、尺度和方向变化)的鲁棒性; (2) GCNs提高了基于DCNNs的架构的性能,得到了最好的结果。

2相关工作

2.1 伽博滤波器

我们采用不同的方法,使用 Gabor 滤波器来调节学习到的卷积滤波器。 具体来说,我们将CNN的基本单元卷积滤波器改为GoFs,以增强Gabor滤波器对每个卷积层的影响。 因此,可操作的特征被继承到 DCNNS 中,以增强特征表示中对缩放和方向变化的鲁棒性。

2.2 学习特征表示

考虑到丰富且通常冗余的卷积滤波器,数据增强用于实现局部/全局变换不变性。 尽管数据增强很有效,但其主要缺点是学习所有可能的变换通常需要大量的网络参数,这显着增加了训练成本和过度拟合的风险。 下面介绍四种学习特征表示的方法: 、 、 、 和 ,并分别介绍它们的优缺点。

3 加博

Gabor 卷积网络(GCN)是一种使用 Gabor 方向滤波器(GoF)的深度卷积神经网络。 GoF 是一种参数可调滤波器,它通过 Gabor 滤波器组操纵学习的卷积滤波器来生成增强的特征图。 对于 GoF,GCN 不仅学习的过滤参数显着减少,而且还导致了增强的深度模型。

3.1 加博(GoF)

Gabor 滤波器有 U 方向和 V 尺度。 为了将可操作的特征合并到 GCN 中,方向信息被编码到学习的滤波器中,而尺度信息被嵌入到不同的层中。 由于Gabor滤波器捕获了GoF中的方向和尺度信息,相应的卷积特征得到增强。

令学习到的滤波器大小为

,在

是二维滤波器的尺寸,

是Gabor滤波器的方向数。因此,一个GoF对应于给定尺度下的U Gabor滤波器,尺度为

滤波器的调制如下:

是学习过滤器,

对于点积运算,

是调制滤波器。 GoF 表示为

因此,第i个GoF实际上是U个3D滤波器,如图2所示

图2 GoFs采集与卷积示意图

在GoFs中,v随着层数的增加而增加,这意味着Gabor滤波器的尺度随着层数的变化而变化。在每个尺度下,GoF的大小为

.但是,我们只保存

可学习的滤波器,使得我们可以在不增加参数数量的情况下通过调制学习增强的特征。

3.2 GCN

在GCN中,GoF用于生成特征图,可以增强深层特征的尺度和方向信息。 输出特征图表示如下:

特征图

通道可以通过如下卷积得到:

为了理解图2,左边是获取GoF的过程,其中可学习滤波器和Gabor滤波器组进行点积。 可以看到尺度为4的四个不同方向的Gabor卷积模板,每个方向分别与可学习滤波器进行点积,最终得到

GoF,这个可以看作是传统CNN中的卷积模板,可以看作是4个3D卷积滤波器,每个滤波器的大小为

.再看右图,输入的特征图是

,GoF中的每个3D卷积分别与特征图进行卷积,得到每个尺度下的增强特征图,最终得到

,其中卷积方法使用“Valid”。

3.3 更新GoF参数

BP过程中,只需要学习过滤器

参数在:

4 和

为了评估本文的方法,在Mnist数据集上进行了实验,并与ORNs方法进行了比较。 作者还对另外3个不同的数据集进行了实验:SVHN数据集、CIFAR数据集、数据集。 下面列出的是从实验中获得的一些图表。

4.1 MNIST

有些训练参数这里就不详细说了,大家可以在论文中查看。

由表1可知,当尺度数为4时,效果优于单一尺度。

由表2可知,当尺度为4时,Gabor滤波器在方向为3~6时有较好的效果。

4.2 SVHN

4.3 图像

4.4 大尺寸图像

5

本文提出了一种新的端到端深度模型,它将 Gabor 滤波器与 DCNNS 相结合,以通过操纵方向和尺度功能来增强深度特征表示。 所提出的Gabor卷积网络(GCN)通过在DCNNS的基本元素(即卷积滤波器)上引入额外的功能模块,提高了DCNN对旋转和尺度变化的泛化能力。 GCN 可以使用流行的架构轻松实现。 大量实验表明,GCN 显着改善了结果,在多个基准测试中实现了最先进的性能。

完成: