大图像的语义分割

2023-11-26

我正在处理数量有限的大尺寸图像,每个图像都可以有3072*3072像素。为了使用 FCN 或 U-net 训练语义分割模型,我构建了一个大样本的训练集,每个训练图像是128*128.

在预测阶段,我所做的是将大图像切成小块,与训练集相同128*128,并将这些小块输入到训练好的模型中,得到预测的掩模。之后,我只需将这些小补丁缝合在一起即可获得整个图像的蒙版。这是对大图像执行语义分割的正确机制吗?


您的解决方案经常用于解决此类问题。然而,我认为这是否真正有意义取决于数据。让我给你举两个你仍然可以在 Kaggle 上找到的例子。

如果您想屏蔽卫星图像的某些部分,您可能会采用这种方法,而不会降低准确性。这些图像高度重复,并且分割区域与原始图像中的拍摄位置之间可能没有相关性。

如果你想从背景中分割出一辆汽车,那么将其分成碎片是不可取的。通过多个层,网络将了解框架中汽车的全局分布。掩模很可能在图像的中间为正,在图像的角落为负。

由于您没有给出您要解决的任何具体问题,我只能给出一般性建议:尝试将输入图像保持在硬件允许的范围内。在许多情况下,我宁愿对原始图像进行缩减采样,也不愿将其分解为补丁。

关于 curio1729 的推荐,我只能建议不要在小补丁上进行训练并在原始图像上进行测试。虽然由于完全卷积网络,这在技术上是可能的,但您正在扩展数据,这很可能会损害性能。 CNN 因其提取局部特征而闻名,但通过多层抽象可以学到大量全局信息。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

大图像的语义分割 的相关文章

随机推荐

  • python appdata 环境变量中的元音变音问题

    我找不到正确的方法来获取 python 中 appdata 路径的环境变量 问题是我的用户名包含特殊字符 德语 ae 和 ue 我为 Vista 和 Windows 7 使用 PyQt 做了一个解决方法 但它不适用于 XP 系统 有谁知道这
  • keras 将两种损失与可调权重结合起来

    所以这里是详细描述 我有一个 keras 功能模型 有两层 输出为 x1 和 x2 x1 Dense 1 activation relu prev inp1 x2 Dense 2 activation relu prev inp2 我需要使
  • 将模块写入 .bc 位码文件

    我假设从模块转储 bc 文件是一个微不足道的操作 但现在 第一次我必须真正从代码中做到这一点 为了我的一生 我 在这个过程中找不到一个缺失的步骤 static void WriteModule const Module M Bitstrea
  • 资源不在java项目的构建路径上?

    我的 Eclipse 上有一个 Maven 项目 当我执行调用层次结构时 我收到消息 该资源不在 java 项目的构建路径上 为此需要配置什么 我按照以下步骤操作 它起作用了 属性 gt 项目方面 gt 检查java gt 确定 转换为ma
  • 在 O(n) 和常数空间中查找重复[重复]

    这个问题在这里已经有答案了 可能的重复 简单的面试问题变得更难 给定数字 1 100 找到缺失的数字 在线性时间和常量空间中查找数组中缺失和重复的元素 我在一个论坛上看到一个有趣的问题 你有从 1 到 100 的 100 个元素 但由于错误
  • 使用 tweepy 流式传输用户的时间线和过滤的推文

    几天前我开始探索 tweepy 并且能够实时流式传输经过过滤 带有关键字 的推文 现在我不仅想流式传输经过过滤的推文 还想流式传输来自多个特定 Twitter 用户的推文 使用 tweepy 可以吗 看来stream userstream
  • 所以在java中你不能有具有不同返回值和参数的重复方法名称?

    Java中是否可以有两个名称相同但参数和返回类型不同的方法 看起来这将是概括一个简单的 getter 和 setter 的好方法 您可以使用构造函数来做到这一点 为什么不使用常规方法呢 例如 为什么不能做 int getVal return
  • 将 Sencha Cmd 与动态加载的控制器结合使用

    我使用 Ext JS 4 创建了一个应用程序 controllers我的财产app js仅包含主控制器 Ext application name MyApp appFolder app controllers main App loadCo
  • 使用 Selenium WebDriver 和 python 按下 ENTER 键[重复]

    这个问题在这里已经有答案了 如何使用 selenium python 绑定模拟 ENTER 按键 我已经尝试过以下块 但它不起作用 driver find element by xpath html xxxxx send keys keys
  • 如何从 sklearn 反转标签编码器以获取多列?

    我想在多列上使用 LabelEncoder 的 inverse transform 函数 这是我在数据帧上应用 LabelEncoder 时用于多个列的代码 class MultiColumnLabelEncoder def init se
  • matplotlib 3d 表面上的连续阴影

    在 matplotlib 3D 图中 我可以设置行 列数来确定表面上可见的面总数 s ax plot surface x y z color gray shade True rstride 1 cstride 1 其中 rstride 和
  • 使用 ORDER BY 子句的替代结果

    CREATE TABLE TEST customername varchar 50 INSERT INTO TEST VALUES CUSTOMER 1 INSERT INTO TEST VALUES CUSTOMER 1 INSERT I
  • 如何在 jsoup 中获取元素的第一级子元素

    在jsoup中Element children 返回 Element 的所有子元素 后代 但是 我想要元素的第一级子级 直接子级 我可以使用哪种方法 Element children 仅返回直接子元素 既然你把他们绑在树上 他们也会有孩子
  • 如何创建接受不超过 10 位数字的正则表达式?

    如何创建接受不超过 10 位数字的正则表达式 thanks 既然你问了 如何 我将尝试逐步解释 因为您没有指定您正在使用哪种正则表达式风格 所以我将在PCRE and 两个 POSIX 正则表达式变体 For simple在这种情况下 您应
  • 使用 iPhone 音频适配器传输数据

    我刚刚开始在一家生物医学公司工作 我们需要将我们正在制造的设备中的数据传输到 iPhone 显然 使用 iPhone 程序就足够了 但对于原型设计和更简单的解决方案 我想知道我们是否可以使用现有的蓝牙音频发射器 例如 http www bu
  • python高效子字符串搜索[重复]

    这个问题在这里已经有答案了 可能的重复 string find 在 CPython 中是如何实现的 我在堆栈溢出中阅读了许多文章 比较了子字符串搜索的性能 例如Python字符串搜索效率 这是搜索子字符串最有效的方法吗 python 中的子
  • RecyclerView:如何创建插入动画效果?

    我有一个ReyclerView与一个LinearLayoutManager and an Adapter
  • 如何将MySQLi结果集加载到二维数组中?

    我的 mysqli 结果集有问题 我有一个包含一堆消息的表 表中的每一行代表一条消息 我有一些列 例如 ID 标题 正文和 公共 公共列包含布尔值 指定消息是向所有人显示还是仅向发布者显示 我有一个页面 我想在其中显示所有公共消息 如果您单
  • 无法将下载的文件存储在相关文件夹中

    我用 python 结合 selenium 编写了一个脚本 用于从网页下载一些文档文件 以 doc 结尾 我不想使用的原因requests or urllib下载文件的模块是因为我当前正在玩的网站没有任何真实的网址连接到每个文件 它们是 J
  • 大图像的语义分割

    我正在处理数量有限的大尺寸图像 每个图像都可以有3072 3072像素 为了使用 FCN 或 U net 训练语义分割模型 我构建了一个大样本的训练集 每个训练图像是128 128 在预测阶段 我所做的是将大图像切成小块 与训练集相同128