LMDB 文件以及它们如何用于 caffe 深度学习网络

2024-01-01

我对深度学习很陌生，在使用 caffe 深度学习网络时遇到一些问题。基本上，我没有找到任何文档来解释如何解决我现在正在处理的一系列问题。

请让我先解释一下我的情况。

我有数千张图像，我必须对它们进行一系列预处理操作。对于每个预处理操作，我必须将这些预处理图像保存为 4D 矩阵，并存储带有图像标签的向量。我会将此信息存储为 LMDB 文件，该文件将用作 caffe googlenet 深度学习的输入。

我尝试将图像保存为 .HD5 文件，但最终文件大小为 80GB，以我的内存无法处理。

那么，另一个选择是使用 LMDB 文件，对吧？我对这种文件格式很陌生，感谢您帮助我了解如何在 Matlab 中创建它们。基本上，我的菜鸟问题是：

1-这些 LMDB 文件的扩展名为 .MDB，对吗？这个扩展和microsoft access使用的一样吗？或者正确的格式是 .lmdb 并且它们不同？

2-我找到了创建 .mdb 文件的解决方案（https://github.com/kyamagu/matlab-leveldb https://github.com/kyamagu/matlab-leveldb），它是否创建caffe所需的文件格式？

3-对于caffe，我是否应该为标签创建一个.mdb 文件，为图像创建另一个.mdb 文件，或者两者都可以是同一.mdb 文件的字段？

4-当我创建 .mdb 文件时，我必须标记数据库字段。我可以将一个字段标记为图像，将其他字段标记为标签吗？ caffe能理解哪个字段的意思吗？

5- 该功能的作用是什么（在https://github.com/kyamagu/matlab-leveldb https://github.com/kyamagu/matlab-leveldb）database.put（'key1'，'value1'）和database.put（'key2'，'value2'）做什么？我是否必须将 4 维矩阵保存在一个字段中，并将标签向量保存在另一字段中？

LMDB 文件和 MS Access 文件之间没有联系。

在我看来，你有两个选择：

使用“convert_imageset”工具 - 它位于 caffe 中的 tools 文件夹下，可将图像文件和标签列表转换为 lmdb。
使用“图像数据层”代替“数据层”作为网络的输入。这种类型的图层将包含图像文件名和标签列表的文件作为源，因此您不必构建数据库（训练的另一个好处 - 您可以使用随机播放选项并获得稍微更好的训练结果）

为了使用图像数据层，只需将图层类型从 Data 替换为 ImageData 即可。源文件是文件的路径，每行包含图像文件的路径和以空格分隔的标签。例如：

/path/to/filnename.png 23

如果您想对数据进行一些预处理而不将预处理后的文件保存到磁盘，您可以使用 caffe 提供的转换（镜像和裁剪）（请参阅此处了解信息http://caffe.berkeleyvision.org/tutorial/data.html http://caffe.berkeleyvision.org/tutorial/data.html）或实现你自己的DataTransformer.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LMDB 文件以及它们如何用于 caffe 深度学习网络的相关文章

matlab中的正则逻辑回归代码

我正在尝试正则化 LR 在 matlab 中使用以下公式很简单成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
计算边界框重叠的百分比，用于图像检测器评估

在测试大图像中的对象检测算法时我们根据地面实况矩形给出的坐标检查检测到的边界框根据 Pascal VOC 挑战有这样的如果预测的边界框重叠更多则认为它是正确的超过 50 带有真实边界框否则边界框被认为是误报检测多次检测是
理解高斯混合模型的概念

我试图通过阅读在线资源来理解 GMM 我已经使用 K 均值实现了聚类并且正在了解 GMM 与 K 均值的比较以下是我的理解如有错误请指出 GMM 类似于 KNN 在这两种情况下都实现了聚类但在 GMM 中每个簇都有自己独立的均值和
从凸点获取角点

我编写了算法来提取图像中显示的点它们形成凸形我知道它们的顺序如何从这些点中提取角点顶部 3 个和底部 3 个我正在使用opencv 如果你已经有了物体的凸包并且该包包含角点那么你需要做的就是简化包直到它只有 6 个点有很多方
神经网络 - 我的网络似乎训练得很好，但在分类报告中它是完全随机的

我正在训练一个模型来对 3 种类型的车辆进行分类一切看起来都很顺利直到我尝试用我的模型预测任何事情预测结果是完全随机的我使用 3 个类别的 15000 张图像每个类别 5000 个进行训练并使用 3 个类别的 6000 个图像
访问图像的 Windows“标签”元数据字段

我正在尝试进行一些图像处理所以现在我正在尝试读取图像 exif 数据有 2 个内置函数可用于读取图像的 exif 数据问题是我想读取图像标签 exifread and imfinfo这两个函数都不显示图像标签 Is there any
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
了解 fminunc 参数和匿名函数、函数处理程序

请多多包涵问题在最后我试图找出 fminunc 调用方式的差异这个问题源于 Andrew Ng 在他的 Coursera 机器学习课程中的第 3 周材料我正在回答这个问题 Matlab Andrew Ng 机器学习课程中 t cos
MATLAB 中的霍夫变换

有谁知道如何使用霍夫变换来检测二值图像中最强的线 A zeros 7 7 A 6 10 18 24 36 38 41 1 使用 rho theta 格式其中 theta 以 45 为步长从 45 到 90 以及如何在 MATLAB 中显
“Desort”向量（撤消排序）

在Matlab中 sort返回排序后的向量和索引向量显示哪个向量元素已移动到以下位置 v ix sort u Here v是一个包含所有元素的向量u 但已排序 ix是一个向量显示每个元素的原始位置v in u 使用 Matlab 的语法
在matlab中绘制给定区域内（两个圆之间）的向量场

我想在 Matlab 中绘制下面的向量场 u cos x x 0 y y 0 v sin x x 0 y y 0 我可以在网格中轻松完成例如 x 和 y 方向从 2 到 2 x 0 2 y 0 1 x y meshgrid 2 0 2 2
Matlab 的 imresize 函数中用于插值的算法是什么？

我正在使用 Matlab Octaveimresize 对给定的二维数组重新采样的函数我想了解如何使用特定的插值算法imresize works 我在Windows上使用八度 e g A 1 2 3 4 是一个二维数组然后我使用命令 b
检测数据集中线性行为的算法

我已经发布了一个关于对数据集的一部分进行多项式拟合的算法 https stackoverflow com q 17595932 2320757前一段时间收到一些建议去做我想做的事但我现在面临另一个问题我尝试应用答案中建议的想法我的目标
在 HSV 颜色空间内定义组织学图像掩模的颜色范围（Python、OpenCV、图像分析）：

为了根据颜色将组织学切片分成多个层我修改了 OpenCV 社区提供的一些广泛分布的代码 1 我们的染色程序用不同的颜色标记组织横截面的不同细胞类型 B 细胞为红色巨噬细胞为棕色背景细胞核为蓝色 I m interested in se
辍学训练

如何对由 dropout 产生的许多薄层进行平均在测试阶段要使用哪些重量我对这个问题真的很困惑因为每个细化层都会学习一组不同的权重那么反向传播是为每个稀疏网络单独完成的吗这些细化网络之间的权重究竟是如何共享的因为在测试时仅使用一
Matlab Builder JA - 将 Matlab 编译成 Java jar - 免费版本？

请记住我对 Matlab 一无所知 Matlab Builder JA 允许开发人员构建 Matlab 应用程序并将其导出到 Java jar 中太棒了我只需要生成一个 jar 然后就可以从其他 java 代码中使用它有谁知道单罐包
Swift 3：如何访问48字节CFData中matrix_float3x3的值？

我正在尝试访问内在矩阵answer https stackoverflow com a 48159895 9296667 通过运行下面的命令我能够得到一个 48 字节的任意对象 https developer apple com docu
从 numpy 数组中删除连续的 RGB 值

我最初根据灰度图像的初始数组创建了一个子数组从 numpy 数组中删除连续数字 https stackoverflow com questions 50743769 deleting consecutive numbers from a
opencv - 在图像中绘制轮廓

我正在尝试在图像周围绘制轮廓我可以看到找到了轮廓但无法绘制轮廓轮廓的颜色似乎是两种黑色和白色颜色中的一种 import cv2 import numpy as np import matplotlib pyplot as plt
读出 Matlab / Octave fft2() 函数输出的特定点

我正在熟悉 Octave 及其功能fft2 在此玩具示例中我的目标是生成以下 256 x 256 png 图像的 2D DFT 为了能够轻松理解输出我尝试将此图像转换为 256 x 256 图像消除颜色信息 Im imread cir

随机推荐

如何在微调器中设置所选项目的颜色？
如何显示浮点值的编码

我们如何在 C 中打印浮点值的编码我知道我可以使用 A 但这不是我想要的格式例如如果我的值为1 3416407 我想打印 0x3FABBAE2 而不是 0X1 5775C4P 0 您可以使用联合例如 include
作为数组表示法的 C# 属性

使用 JavaScript 可以使用点表示法或数组表示法访问对象 var myArray e1 elem1 e2 elem2 e3 elem3 e4 elem4 var val1 myArray e1 var val2 myArray e1
在 asp:repeater 中查找按钮单击事件的控件

我在 asp repeater 项目模板中有一个下拉列表如何在按钮单击事件上获取其值
如何解决形状圆形矩形太大而无法渲染成 android TextBox 中的纹理

我为文本视图背景创建一个形状
为什么没有为 CMFCMenuButton 绘制下拉箭头？

我在尝试将 CMFCMenuButton 添加到现有 MFC 应用程序时遇到了此问题它工作正常甚至调整了按钮的大小以适应下拉箭头但它没有绘制下拉箭头当我将鼠标悬停在按钮上时我看到以下调试输出 gt Can t load bitma
在平面布局中发现多个顶级包

我正在尝试从使用 Poetry 的源代码安装一个库但出现此错误 error Multiple top level packages discovered in a flat layout tulips fixtures To avoid
如何获取重叠的矩形坐标

假设我有以下重叠的矩形 a 和 b aaaaaaaa aaaaccccbbbbb aaaaccccbbbbb aaaaccccbbbbb bbbbbbbbb bbbbbbbbb 我见过很多关于如何计算的想法area内部矩形 c 的坐标但是
什么时候可以在 #include 指令中省略文件扩展名？

我正在玩 gmock 并注意到它包含这一行 include
使用 .NET 标准库在 Xamarin.Android 上 JsonSerializationException“无法找到构造函数”

我已将 Xamarin Native UI 用于 Android 应用程序并为 API 调用和数据创建了不同的类库并使用反序列化 api 数据Newtonsoft Json 该类库 Target Framework 是 NET Stan
将 SQL Server 查询转换为 MySQL [重复]

这个问题在这里已经有答案了可能的重复选择 MySQL 中数值的前 X 或后百分比 https stackoverflow com questions 4741239 select top x or bottom percent for
如何使用样式表自定义 QLabels 中链接的外观？

我有一个QLabel使用设置深色背景的 Qt 样式表 QLabel background black color white 在我添加带有嵌入 URL 的文本并设置Qt TextFormat to Qt RichText 该链接显示为默认的
“返回”后不必要的“其他”。（无其他返回）

我正在使用 es lint 来清理代码中的错误我遇到过这个错误返回后不必要的其他无其他返回 else 我总是在返回后使用 else 语句有什么我可能会忽略的事情吗 if cctot lt 3 cctot gt 0 alert C
如何在 bash 中的文件中的特定行末尾附加字符串[重复]

这个问题在这里已经有答案了我想将别名附加到主机文件某一行的末尾例如 I have 192 168 1 1 www address1 com 192 168 1 2 www address2 com 192 168 1 3 www add
SVG：使用属性还是 CSS 来设置样式？

在 HTML 中建议将内容与样式分开因此您应该为样式创建外部 CSS 文件由于我刚刚开始使用 SVG 我现在想知道这条规则是否也适用于 SVG 什么被认为是更好的代码风格
QML 如何将文本光标放在 TextEdit 元素的末尾

我有一个QMLTextEdit元素我计划附加一些文本并将光标放在末尾我的方法 import QtQuick 1 1 Rectangle color black anchors fill parent focus false TextEd
java web应用程序中数据库字符串连接存储在哪里？

我即将开始我的第一个 java 项目让我说说我以前是如何处理这些事情的到目前为止我一直在使用 VB6 制作的 com 组件来开发 asp 该组件通过 com 管理控制台向域用户注册例如我的公司域 my app account 这些组
Android 文件加密

如何对sd卡上的应用程序文件进行加密和解密这样我就可以保护 SD 卡上的文件并且其他人无法在不解密这些文件的情况下访问该应用程序之外的内容有没有人可以给我任何好的示例源来在 Android 应用程序上实现加密我编写了这个程序它将使
AngularJS：从 bootstrap-ui 手风琴访问范围

我正在尝试 watch ui bootstrap 手风琴中模型的更改绑定在视图中起作用但是当模型更改时 watch 不会触发 http plnkr co edit DcoGT2 p preview http plnkr co edit
LMDB 文件以及它们如何用于 caffe 深度学习网络

我对深度学习很陌生在使用 caffe 深度学习网络时遇到一些问题基本上我没有找到任何文档来解释如何解决我现在正在处理的一系列问题请让我先解释一下我的情况我有数千张图像我必须对它们进行一系列预处理操作对于每个预处理操作我必须将

LMDB 文件以及它们如何用于 caffe 深度学习网络

LMDB 文件以及它们如何用于 caffe 深度学习网络 的相关文章

随机推荐

热门标签

LMDB 文件以及它们如何用于 caffe 深度学习网络的相关文章