大图像的语义分割

2023-11-26

我正在处理数量有限的大尺寸图像，每个图像都可以有3072*3072像素。为了使用 FCN 或 U-net 训练语义分割模型，我构建了一个大样本的训练集，每个训练图像是128*128.

在预测阶段，我所做的是将大图像切成小块，与训练集相同128*128，并将这些小块输入到训练好的模型中，得到预测的掩模。之后，我只需将这些小补丁缝合在一起即可获得整个图像的蒙版。这是对大图像执行语义分割的正确机制吗？

您的解决方案经常用于解决此类问题。然而，我认为这是否真正有意义取决于数据。让我给你举两个你仍然可以在 Kaggle 上找到的例子。

如果您想屏蔽卫星图像的某些部分，您可能会采用这种方法，而不会降低准确性。这些图像高度重复，并且分割区域与原始图像中的拍摄位置之间可能没有相关性。

如果你想从背景中分割出一辆汽车，那么将其分成碎片是不可取的。通过多个层，网络将了解框架中汽车的全局分布。掩模很可能在图像的中间为正，在图像的角落为负。

由于您没有给出您要解决的任何具体问题，我只能给出一般性建议：尝试将输入图像保持在硬件允许的范围内。在许多情况下，我宁愿对原始图像进行缩减采样，也不愿将其分解为补丁。

关于 curio1729 的推荐，我只能建议不要在小补丁上进行训练并在原始图像上进行测试。虽然由于完全卷积网络，这在技术上是可能的，但您正在扩展数据，这很可能会损害性能。 CNN 因其提取局部特征而闻名，但通过多层抽象可以学到大量全局信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大图像的语义分割的相关文章

Tensorflow：尽管数据中没有字符串，但使用 tflearn 时不支持将字符串转换为浮点数错误

我似乎无法在我的代码中找到错误其中有任何字符串被错误地转换为浮点数但它却给了我这个错误 W tensorflow core framework op kernel cc 958 Unimplemented Cast string to
无需安装 Tensorflow 即可服务 Tensorflow 模型

我有一个经过训练的模型想在 python 应用程序中使用但我看不到任何在不安装 TensorFlow 或创建 gRPC 服务的情况下部署到生产环境的示例有可能吗在这种情况下正确的做法是什么如果不使用 TensorFlow 本身或
batch_size = x.shape[0] AttributeError: 'tuple' 对象没有属性 'shape'

该代码结合图像和掩模进行图像检测我怎样才能纠正这个错误 batch size x shape 0 AttributeError tuple 对象没有属性 shape 这是用于训练的代码 train datagen ImageDataGen
神经网络 - 我的网络似乎训练得很好，但在分类报告中它是完全随机的

我正在训练一个模型来对 3 种类型的车辆进行分类一切看起来都很顺利直到我尝试用我的模型预测任何事情预测结果是完全随机的我使用 3 个类别的 15000 张图像每个类别 5000 个进行训练并使用 3 个类别的 6000 个图像
预处理 csv 文件以与 tflearn 一起使用

我的问题是关于在将 csv 文件输入神经网络之前对其进行预处理我想使用 python 3 中的 tflearn 为著名的 iris 数据集构建一个深度神经网络数据集 http archive ics uci edu ml machine
Keras：binary_crossentropy 和 categorical_crossentropy 混淆

使用 TensorFlow 一段时间后我阅读了一些 Keras 教程并实现了一些示例我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数我想binary crossentro
如何识别与我的对象相关的轮廓并找到它们的几何质心

问题陈述和背景信息 EDIT 约束法兰上的红色会随着时间的推移而变化所以我此时不会尝试使用颜色识别来识别我的对象除非它足够强大此外外部照明也可能是一个因素因为将来这将是在室外区域我有 RGB 深度相机有了它我就能捕捉到这个
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
对象检测 ARKit 与 CoreML

我正在建设ARKitiPhone 的应用程序我需要检测特定的香水瓶并根据检测到的内容显示内容我使用来自developer apple com的演示应用程序来扫描现实世界的对象并导出 arobject我可以在资产中使用的文件它工作正常
Keras CNN 回归模型损失低，准确度为 0

我在 keras 中遇到这个 NN 回归模型的问题我正在研究一个汽车数据集以根据 13 个维度预测价格简而言之我已将其读取为 pandas 数据帧将数值转换为浮点数缩放值然后对分类值使用 one hot 编码这创建了很多新列
使用 scikit 时 scipy.sparse 矩阵的缩放问题

在使用 scikit learn 解决机器学习问题时我需要在使用 SVM 进行训练之前对 scipy sparse 矩阵进行缩放但在文档 http scikit learn org stable modules preprocessin
Swift 3：如何访问48字节CFData中matrix_float3x3的值？

我正在尝试访问内在矩阵answer https stackoverflow com a 48159895 9296667 通过运行下面的命令我能够得到一个 48 字节的任意对象 https developer apple com docu
具有动态 num_partitions 的动态分区

变量num partitions在方法中tf dynamic partition不是一个Tensor 但是一个int 因此如果事先不知道分区的数量则无法通过计算唯一值的数量等方式从数据中推断出分区的数量也无法通过tf placehol
与 XGBoost gridsearch rating='roc_auc' 和 roc_auc_score 不同的 roc_auc 吗？

我使用 GridSearch 来解决分类问题 A parameter grid for XGBoost params min child weight 1 5 10 gamma 0 5 1 1 5 2 5 subsample 0 6 0 8
如何使用SIFT算法计算两幅图像的相似度？

我已经用过SIFT http en wikipedia org wiki Scale invariant feature transform实施安德里亚维达尔迪 http www vlfeat org overview sift html
Tensorflow：ValueError：形状必须具有相同的等级，但为 0 和 2

我在乘以 x1 Wo1 时遇到形状错误但我找不到原因错误 ValueError 形状必须具有相同的等级但为 0 和 2将形状 0 与其他形状合并对于 add 2 x 操作 Pack 输入形状 20 1 import tensorfl
安装了tensorflow，但pycharm忽略它

我安装了tensorflow 约书亚的回答如何在anaconda python 3 6上安装tensorflow https stackoverflow com questions 43419795 how to install tens
在张量流中保存模型

Tensorflow 允许我们使用 tf train write graph 方法保存加载模型的结构以便我们可以在将来恢复它以继续我们的训练但是我想知道这是否有必要因为我可以创建一个模块例如 GraphDefinition py
smooth_idf 是多余的吗？

The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html

随机推荐

python appdata 环境变量中的元音变音问题

我找不到正确的方法来获取 python 中 appdata 路径的环境变量问题是我的用户名包含特殊字符德语 ae 和 ue 我为 Vista 和 Windows 7 使用 PyQt 做了一个解决方法但它不适用于 XP 系统有谁知道这
keras 将两种损失与可调权重结合起来

所以这里是详细描述我有一个 keras 功能模型有两层输出为 x1 和 x2 x1 Dense 1 activation relu prev inp1 x2 Dense 2 activation relu prev inp2 我需要使
将模块写入 .bc 位码文件

我假设从模块转储 bc 文件是一个微不足道的操作但现在第一次我必须真正从代码中做到这一点为了我的一生我在这个过程中找不到一个缺失的步骤 static void WriteModule const Module M Bitstrea
资源不在java项目的构建路径上？

我的 Eclipse 上有一个 Maven 项目当我执行调用层次结构时我收到消息该资源不在 java 项目的构建路径上为此需要配置什么我按照以下步骤操作它起作用了属性 gt 项目方面 gt 检查java gt 确定转换为ma
在 O(n) 和常数空间中查找重复[重复]

这个问题在这里已经有答案了可能的重复简单的面试问题变得更难给定数字 1 100 找到缺失的数字在线性时间和常量空间中查找数组中缺失和重复的元素我在一个论坛上看到一个有趣的问题你有从 1 到 100 的 100 个元素但由于错误
使用 tweepy 流式传输用户的时间线和过滤的推文

几天前我开始探索 tweepy 并且能够实时流式传输经过过滤带有关键字的推文现在我不仅想流式传输经过过滤的推文还想流式传输来自多个特定 Twitter 用户的推文使用 tweepy 可以吗看来stream userstream
所以在java中你不能有具有不同返回值和参数的重复方法名称？

Java中是否可以有两个名称相同但参数和返回类型不同的方法看起来这将是概括一个简单的 getter 和 setter 的好方法您可以使用构造函数来做到这一点为什么不使用常规方法呢例如为什么不能做 int getVal return
将 Sencha Cmd 与动态加载的控制器结合使用

我使用 Ext JS 4 创建了一个应用程序 controllers我的财产app js仅包含主控制器 Ext application name MyApp appFolder app controllers main App loadCo
使用 Selenium WebDriver 和 python 按下 ENTER 键[重复]

这个问题在这里已经有答案了如何使用 selenium python 绑定模拟 ENTER 按键我已经尝试过以下块但它不起作用 driver find element by xpath html xxxxx send keys keys
如何从 sklearn 反转标签编码器以获取多列？

我想在多列上使用 LabelEncoder 的 inverse transform 函数这是我在数据帧上应用 LabelEncoder 时用于多个列的代码 class MultiColumnLabelEncoder def init se
matplotlib 3d 表面上的连续阴影

在 matplotlib 3D 图中我可以设置行列数来确定表面上可见的面总数 s ax plot surface x y z color gray shade True rstride 1 cstride 1 其中 rstride 和
使用 ORDER BY 子句的替代结果

CREATE TABLE TEST customername varchar 50 INSERT INTO TEST VALUES CUSTOMER 1 INSERT INTO TEST VALUES CUSTOMER 1 INSERT I
如何在 jsoup 中获取元素的第一级子元素

在jsoup中Element children 返回 Element 的所有子元素后代但是我想要元素的第一级子级直接子级我可以使用哪种方法 Element children 仅返回直接子元素既然你把他们绑在树上他们也会有孩子
如何创建接受不超过 10 位数字的正则表达式？

如何创建接受不超过 10 位数字的正则表达式 thanks 既然你问了如何我将尝试逐步解释因为您没有指定您正在使用哪种正则表达式风格所以我将在PCRE and 两个 POSIX 正则表达式变体 For simple在这种情况下您应
使用 iPhone 音频适配器传输数据

我刚刚开始在一家生物医学公司工作我们需要将我们正在制造的设备中的数据传输到 iPhone 显然使用 iPhone 程序就足够了但对于原型设计和更简单的解决方案我想知道我们是否可以使用现有的蓝牙音频发射器例如 http www bu
python高效子字符串搜索[重复]

这个问题在这里已经有答案了可能的重复 string find 在 CPython 中是如何实现的我在堆栈溢出中阅读了许多文章比较了子字符串搜索的性能例如Python字符串搜索效率这是搜索子字符串最有效的方法吗 python 中的子
RecyclerView：如何创建插入动画效果？

我有一个ReyclerView与一个LinearLayoutManager and an Adapter
如何将MySQLi结果集加载到二维数组中？

我的 mysqli 结果集有问题我有一个包含一堆消息的表表中的每一行代表一条消息我有一些列例如 ID 标题正文和公共公共列包含布尔值指定消息是向所有人显示还是仅向发布者显示我有一个页面我想在其中显示所有公共消息如果您单
无法将下载的文件存储在相关文件夹中

我用 python 结合 selenium 编写了一个脚本用于从网页下载一些文档文件以 doc 结尾我不想使用的原因requests or urllib下载文件的模块是因为我当前正在玩的网站没有任何真实的网址连接到每个文件它们是 J
大图像的语义分割

我正在处理数量有限的大尺寸图像每个图像都可以有3072 3072像素为了使用 FCN 或 U net 训练语义分割模型我构建了一个大样本的训练集每个训练图像是128 128 在预测阶段我所做的是将大图像切成小块与训练集相同128

大图像的语义分割

大图像的语义分割 的相关文章

随机推荐

热门标签

大图像的语义分割的相关文章