tf.nn.atrous_conv2d如何实现空洞卷积？

2023-11-18

转载自 https://blog.csdn.net/mao_xiao_feng/article/details/78003730
介绍
关于空洞卷积的理论可以查看以下链接，这里我们不详细讲理论：

1.Long J, Shelhamer E, Darrell T, et al. Fully convolutional networks for semantic segmentation[C]. Computer Vision and Pattern Recognition, 2015.

2.Yu, Fisher, and Vladlen Koltun. “Multi-scale context aggregation by dilated convolutions.” arXiv preprint arXiv:1511.07122 (2015).

3.如何理解空洞卷积（dilated convolution）？

其实用一句话概括就是，在不用pooling的情况下扩大感受野（pooling层会导致信息损失）

为了阅读方便再贴一些相关链接：

【TensorFlow】tf.nn.conv2d是怎样实现卷积的？

【TensorFlow】tf.nn.conv2d_transpose是怎样实现反卷积的？

惯例先展示函数：

tf.nn.atrous_conv2d(value,filters,rate,padding,name=None）
1
除去name参数用以指定该操作的name，与方法有关的一共四个参数：

value：
指需要做卷积的输入图像，要求是一个4维Tensor，具有[batch, height, width, channels]这样的shape，具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]

filters：
相当于CNN中的卷积核，要求是一个4维Tensor，具有[filter_height, filter_width, channels, out_channels]这样的shape，具体含义是[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]，同理这里第三维channels，就是参数value的第四维

rate：
要求是一个int型的正数，正常的卷积操作应该会有stride（即卷积核的滑动步长），但是空洞卷积是没有stride参数的，这一点尤其要注意。取而代之，它使用了新的rate参数，那么rate参数有什么用呢？它定义为我们在输入图像上卷积时的采样间隔，你可以理解为卷积核当中穿插了（rate-1）数量的“0”，把原来的卷积核插出了很多“洞洞”，这样做卷积时就相当于对原图像的采样间隔变大了。具体怎么插得，可以看后面更加详细的描述。此时我们很容易得出rate=1时，就没有0插入，此时这个函数就变成了普通卷积。

padding：
string类型的量，只能是”SAME”,”VALID”其中之一，这个值决定了不同边缘填充方式。

ok，完了，到这就没有参数了，或许有的小伙伴会问那“stride”参数呢。其实这个函数已经默认了stride=1，也就是滑动步长无法改变，固定为1。

结果返回一个Tensor，填充方式为“VALID”时，返回[batch,height-2*(filter_width-1),width-2*(filter_height-1),out_channels]的Tensor，填充方式为“SAME”时，返回[batch, height, width, out_channels]的Tensor，这个结果怎么得出来的？先不急，我们通过一段程序形象的演示一下空洞卷积。

实验
首先创建一张2通道图

img = tf.constant(value=[[[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]]]],dtype=tf.float32)
img = tf.concat(values=[img,img],axis=3)

然后用一个3*3卷积核去做卷积

filter = tf.constant(value=1, shape=[3,3,2,5], dtype=tf.float32)
out_img = tf.nn.atrous_conv2d(value=img, filters=filter, rate=1)

建立好了img和filter，就可以做卷积了

out_img = tf.nn.conv2d(input=img, filter=filter, strides=[1,1,1,1], padding='VALID')

输出5个channel，我们设置rate=1，此时空洞卷积可以看做普通的卷积，分别在SAME和VALID模式下输出如下：

这里写图片描述

ok，调整rate=2，继续运行程序

out_img = tf.nn.atrous_conv2d(value=img, filters=filter, rate=2, padding='SAME')

查看输出结果

[[[[ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]
   [ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]]

  [[ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]
   [ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]]

  [[ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]
   [ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]]

  [[ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]
   [ 16.  16.  16.  16.  16.]
   [ 24.  24.  24.  24.  24.]]]]

这个结果怎么出来的呢？再用一张图
这里写图片描述

这里我们看到rate=2时，通过穿插“0”，卷积核由3*3膨胀到了5*5。再看看“VALID”模式下，会发生什么？

这里写图片描述

直接报错了。因为卷积核的大小已经超过了原图大小

好了，看到这里相信大家对于空洞卷积有了基本的了解了。那么，填充方式为“VALID”时，返回[batch,height-2*(filter_width-1),width-2*(filter_height-1),out_channels]的Tensor，这个结果，相信大家就可以证明了。

代码清单

import tensorflow as tf


img = tf.constant(value=[[[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]],[[1],[2],[3],[4]]]],dtype=tf.float32)
img = tf.concat(values=[img,img],axis=3)
filter = tf.constant(value=1, shape=[3,3,2,5], dtype=tf.float32)
out_img1 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=1, padding='SAME')
out_img2 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=1, padding='VALID')
out_img3 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=2, padding='SAME')

#error
#out_img4 = tf.nn.atrous_conv2d(value=img, filters=filter, rate=2, padding='VALID')

with tf.Session() as sess:
    print 'rate=1, SAME mode result:'
    print(sess.run(out_img1))

    print 'rate=1, VALID mode result:'
    print(sess.run(out_img2))

    print 'rate=2, SAME mode result:'
    print(sess.run(out_img3))

    # error
    #print 'rate=2, VALID mode result:'
    #print(sess.run(out_img4))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tf.nn.atrous_conv2d如何实现空洞卷积？的相关文章

如何在 keras 模型中使用张量流度量函数？

使用Python 3 5 2张量流RC 1 1 我正在尝试在 keras 中使用张量流度量函数所需的功能接口似乎是相同的但调用 import pandas import numpy import tensorflow contrib k
如何使用 keras.backend.gradients() 获取梯度值

我试图获得 Keras 模型的输出相对于模型输入 x 而不是权重的导数似乎最简单的方法是使用 keras backend 中的梯度它返回梯度张量 https keras io backend https keras io backe
Tensorflow DecodeJPEG：预期图像（JPEG、PNG 或 GIF）以“\000\000\000\000\000\000\000\00”开头的格式未知

我正在循环浏览图像文件夹这种情况不断发生 tensorflow python framework errors impl InvalidArgumentError 预期的图像 JPEG PNG或GIF 以 000 000 000 000
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
Keras：加载多个模型并在不同线程中进行预测

我正在使用带有张量流核心的 Keras 我想在构造函数中加载 2 个不同的模型然后在不同的线程中进行预测根据请求我尝试在张量流图上下文中加载这些模型但它不起作用我的代码 from keras models import load
如何在nodejs（tensorflow.js）中训练模型？

我想做一个图像分类器但我不会python Tensorflow js 使用我熟悉的 javascript 可以用它来训练模型吗训练步骤是什么坦白说我不知道从哪里开始我唯一想到的是如何加载 mobilenet 它显然是一组预先训练的
从 [tensorflow 1.00] 中的 softmax 层提取概率

使用张量流我有一个 LSTM 分类模型以 softmax 作为最终节点这是我的 softmax 层 with tf name scope Softmax as scope with tf variable scope Softmax
使用输入管道时如何替换 feed_dict？

假设您有一个已与feed dict到目前为止将数据注入到图表中每隔几个时期我就会通过将任一数据集的一批数据输入到我的图表中来评估训练和测试损失现在出于性能原因我决定使用输入管道看看这个虚拟示例 import tensorflow
ValueError：形状（无，50）和（无，1）在 Tensorflow 和 Colab 中不兼容

我正在使用 LSTM 训练 Tensorflow 模型以进行预测维护对于每个实例我创建一个矩阵 50 4 其中 50 是历史序列的长度 4 是每个记录的特征数量因此为了训练模型我使用例如 55048 50 4 张量和 55048 1
您必须使用 dtype float(Tensorflow) 为占位符张量“Placeholder”提供值

import tensorflow as tf import os import sklearn preprocessing import pandas as pd import numpy as np print os getcwd os
Tensorflow中的Tensor和Variable有什么区别

有什么区别Tensor and Variable在张量流中我注意到在这个 stackoverflow 答案 https stackoverflow com questions 38556078 in tensorflow what is
Tensorflow新Op CUDA内核内存管理

我已经使用 GPU CUDA 内核在 Tensorflow 中实现了一个相当复杂的新 Op 该操作需要大量动态内存分配这些变量不是张量并且在操作完成后被释放更具体地说它涉及使用哈希表现在我正在使用cudaMalloc and cu
Tensorflow如何生成不平衡组合数据集

我对新数据集 API tensorflow 1 4 有疑问我有两个数据集我需要创建一个组合的不平衡数据集即每个批次应包含第一个数据集中一定数量的元素和第二个数据集中一定数量的元素例如 dataset1 tf data Datase
如何强制tensorflow使用所有可用的GPU？

我有一个 8 GPU 集群当我运行Kaggle 的一段 Tensorflow 代码 https www kaggle com keegil keras u net starter lb 0 277 scriptVersionId 2164
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
需要 TensorFlow 依赖项。如何在 Windows 上运行 TensorFlow

我有兴趣让 TensorFlow 在 Windows 上运行但目前我意识到这是不可能的因为某些依赖项无法在 Windows 上使用例如巴泽尔之所以出现这种需求是因为据我目前了解从 TensorFlow 访问 GPU 的唯一方法是
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
如何在 py_function 之后重塑（图像，标签）数据集

我正在尝试读取自定义映射数据集进行训练但是在使用 py function 映射数据集后我得到了未知的形状例如 def process path file path label get label file path img tf io

随机推荐

java------int=20是存在堆里还是栈里

如果方法里的局部变量就会存在栈帧里的局部变量表中如果是成员变量则存在于堆中它属于int类的一个实例存放在堆中开辟的空间
【Mo 人工智能技术博客】图卷积网络概述及其在论文分类上的应用

近年来深度学习在计算机视觉自然语言处理等领域大放异彩这些领域所面对的数据都是结构化的如图像音频文本等它们内部都有明确的排列规则结构化的数据由于具有这些确定的规则而方便处理但是在现实生活中非结构化的关系数据才是主流我们无
Ubuntu 18.04换国内源中科大源阿里源 163源清华源

国内有很多Ubuntu的镜像源包括阿里的网易的还有很多教育网的源比如清华源中科大源我们这里以中科大的源为例讲解如何修改Ubuntu 18 04里面默认的源编辑 etc apt sources list文件在文件最前面添加以
华为OD机试 - 跳格子1（Java）

题目描述小明和朋友玩跳格子游戏有 n 个连续格子每个格子有不同的分数小朋友可以选择以任意格子起跳但是不能跳连续的格子也不能回头跳给定一个代表每个格子得分的非负整数数组计算能够得到的最高分数输入描述给定一个数列如 1 2
3D游戏设计大作业

Unity大作业粒子系统效果一前言 1 此篇文章记录了2022年第二学期中山大学软件工程3D游戏与编程的大作业本次大作业可选择范围众多最终我选择了粒子系统效果作为了本次大作业的主题 2 一个粒子系统可以模拟并渲染许多称为粒子的小图
CRC校验总结

事实上网上很多CRC校验算法在接收端进行CRC校验时余数不为零这往往是因为CRC校验算法本身是有问题的但不妨碍我们进行校验接收端可以对需要校验的字段带入CRC校验算法计算得到校验值并与发送数据中的校验值进行比较如果两者相等
生信技能树R语言学习

一数据类型和向量 1 数据类型 1 1 判断数据类型class 1 2 按Tab键自动补全 1 3 数据类型的判断和转换 1 is 族函数判断返回值为TRUE或FALSE is numeric 123 is character a i
32位/64位WINDOWS驱动之-突破进程保护映射的方法进行跨进程读内存2

32位 64位WINDOWS驱动之突破进程保护映射的方法进行跨进程读内存2 一在过保护读写筛选器中添加读写驱动2 c 驱动层代码如下 include
黑马头条热点文章实时计算、kafkaStream

热点文章实时计算 1 今日内容 1 1 定时计算与实时计算 1 2 今日内容 kafkaStream 什么是流式计算 kafkaStream概述 kafkaStream入门案例 Springboot集成kafkaStream 实时计算用
cout 格式化输出

将 cout 的 flag 保存到变量以便修改后的恢复 ostream fmtflags old cout flag 无参将返回当前 flag 值 cout flag old 恢复到原先保存的值将 bool 值以 literals 输出
第六章课后习题及答案

第六章习题答案转载于 https www cnblogs com hhdn archive 2007 05 27 761356 html
Mysql字段设置默认值

方法一 select 默认值字段名 from 表名方法二 SELECT 默认值 as 字段名 FROM 表名以上方法将默认值和表名互换则可以产生给表名去别名的作用
计算分组后的记录行数（count group）

小弟有这样一个问题想用hql计算分组之后的总记录行数语句如 from aTable a left outer join bTable b group by a f1 b f1 现在要计算它的总记录数 select count from
对useReducer的理解

useReducer是React提供的一个高级Hook 它不像useEffect useState useRef等必须hook一样没有它我们也可以正常完成需求的开发但useReducer可以使我们的代码具有更好的可读性可维护性可预测
Android通用流行框架大全，零基础入门学习android

Picasso transformations 一个为Picasso提供多种图片变换的库 Glide transformations 一个为Glide提供多种图片变换的库 Android gpuimage 基于OpenGL的Android过
Jenkins持续集成项目实践 —— 基于Python Selenium自动化测试（二）

上一篇讲了如何搭建jenkins 这篇主要讲怎么将自动化代码与jenkins衔接起来 jenkins上运行的两种方式第一种在jenkins上面运行本地代码操作如下新建项目项目名称根据自己项目情况填写并选择自由模式进行配置根据如
LaTeX中插入matlab代码(可添加中文注释)的几种方法

最近在用LaTeX写文件时需要插入matlab代码但是matlab代码编写时没有注意到注释为中文所带来的不便导致在编写LaTeX文件时总是报错经查阅网上有关这方面的资料和自己不断地尝试之后总结其中的方法如下使用matlab的mc
【满分】【华为OD机试真题2023 JS】字母组合

华为OD机试真题 2023年度机试题库全覆盖刷题指南点这里字母组合知识点回溯时间限制 1s 空间限制 256MB 限定语言不限题目描述每个数字对应多个字母对应关系如下 0 a b c 1 d e f 2 g h i 3 j
Android MVP 详解（上）

作者李旺成时间 2016年4月3日 Android MVP 详解下已经发布欢迎大家提建议 MVP 在 Android 上的使用其实已经有挺长一段时间了长到似乎有点过时了目前风头正劲的是MVVM 那为什么现在还要讲 MVP
tf.nn.atrous_conv2d如何实现空洞卷积？

转载自 https blog csdn net mao xiao feng article details 78003730 介绍关于空洞卷积的理论可以查看以下链接这里我们不详细讲理论 1 Long J Shelhamer E Darr

tf.nn.atrous_conv2d如何实现空洞卷积？

tf.nn.atrous_conv2d如何实现空洞卷积？ 的相关文章

随机推荐

热门标签

tf.nn.atrous_conv2d如何实现空洞卷积？的相关文章