如何在 Tensorflow 对象检测 API 中查找边界框坐标

2024-05-23

我正在使用 Tensorflow 对象检测 API 代码。我训练了我的模型并获得了很高的检测百分比。我一直在尝试获取边界框坐标，但它不断打印出 100 个奇怪数组的列表。

经过在线广泛搜索后，我发现数组中的数字意味着什么（边界框坐标相对于底层图像的宽度和高度在 [0.0, 1.0] 中浮动。）但是，我的数组仍然与在线示例中显示的内容。另一个奇怪的事情是，我用少于 100 个图像来测试我的模块，所以怎么会有 100 个边界框坐标的数据。

我得到的数组；

 [[3.13721418e-01 4.65148419e-01 7.11575747e-01 6.85783863e-01]
 [9.78936195e-01 6.50490820e-03 9.97096300e-01 1.82596639e-01]
 [9.51383412e-01 0.00000000e+00 1.00000000e+00 3.88432704e-02]
 [9.85813320e-01 8.96016136e-02 9.97273505e-01 3.15960884e-01]
 [9.88873005e-01 2.13812709e-01 1.00000000e+00 4.14675951e-01]

 ......
 [4.42647263e-02 9.90755498e-01 2.57772505e-01 1.00000000e+00]
 [2.69711018e-05 5.21758199e-02 6.37509704e-01 6.62899792e-01]
 [0.00000000e+00 3.00989419e-01 9.92376506e-02 1.00000000e+00]
 [1.87531322e-01 2.66501214e-04 4.50700432e-01 1.23927500e-02]
 [9.36755657e-01 4.61095899e-01 9.92406607e-01 7.62619019e-01]]

执行检测并获取边界框坐标的函数。 output_dict['detection_boxes'] 是保存上面数组的位置。

def run_inference_for_single_image(image, graph):
  with graph.as_default():
    with tf.Session() as sess:
      # Get handles to input and output tensors
      ops = tf.get_default_graph().get_operations()
      all_tensor_names = {output.name for op in ops for output in op.outputs}
      tensor_dict = {}
      for key in [
          'num_detections', 'detection_boxes', 'detection_scores',
          'detection_classes', 'detection_masks'
      ]:
        tensor_name = key + ':0'
        if tensor_name in all_tensor_names:
          tensor_dict[key] = tf.get_default_graph().get_tensor_by_name(
              tensor_name)
      if 'detection_masks' in tensor_dict:
        # The following processing is only for single image
        detection_boxes = tf.squeeze(tensor_dict['detection_boxes'], [0])
        detection_masks = tf.squeeze(tensor_dict['detection_masks'], [0])
        # Reframe is required to translate mask from box coordinates to image coordinates and fit the image size.
        real_num_detection = tf.cast(tensor_dict['num_detections'][0], tf.int32)
        detection_boxes = tf.slice(detection_boxes, [0, 0], [real_num_detection, -1])
        detection_masks = tf.slice(detection_masks, [0, 0, 0], [real_num_detection, -1, -1])
        detection_masks_reframed = utils_ops.reframe_box_masks_to_image_masks(
            detection_masks, detection_boxes, image.shape[1], image.shape[2])
        detection_masks_reframed = tf.cast(
            tf.greater(detection_masks_reframed, 0.5), tf.uint8)
        # Follow the convention by adding back the batch dimension
        tensor_dict['detection_masks'] = tf.expand_dims(
            detection_masks_reframed, 0)
      image_tensor = tf.get_default_graph().get_tensor_by_name('image_tensor:0')

      # Run inference
      output_dict = sess.run(tensor_dict,
                             feed_dict={image_tensor: image})

      # all outputs are float32 numpy arrays, so convert types as appropriate
      output_dict['num_detections'] = int(output_dict['num_detections'][0])
      output_dict['detection_classes'] = output_dict[
          'detection_classes'][0].astype(np.int64)
      output_dict['detection_boxes'] = output_dict['detection_boxes'][0]
      output_dict['detection_scores'] = output_dict['detection_scores'][0]
      if 'detection_masks' in output_dict:
        output_dict['detection_masks'] = output_dict['detection_masks'][0]
  return output_dict

我希望输出是边界框的常规 x,y 坐标。

中的值output_dict['detection_boxes']确实是标准化格式。通过检查您提供的数组中的值，这些值都在 0 到 1 之间，因此它们是合理的。

有 100 个框，因为模型始终输出相同数量的边界框。（它等于max_total_detections在配置文件中）。但并非所有的框都总是有意义的，您需要根据置信度得分过滤掉一些框，该置信度存储在output_dict['scores'].

获得规则的边界框。您可以执行以下操作：

boxes = np.squeeze(output_dict['detection_boxes'])
scores = np.squeeze(output_dict['detection_scores'])
#set a min thresh score, say 0.8
min_score_thresh = 0.8
bboxes = boxes[scores > min_score_thresh]

#get image size
im_width, im_height = image.size
final_box = []
for box in bboxes:
    ymin, xmin, ymax, xmax = box
    final_box.append([xmin * im_width, xmax * im_width, ymin * im_height, ymax * im_height])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Tensorflow 对象检测 API 中查找边界框坐标的相关文章

在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
调用 tf.linalg.inv 时，TensorFlow 崩溃并显示无法创建 cuSolverDN 实例

我正在运行tensorflow tensoflow latest gpu码头集装箱我可以运行简单的向量运算例如矩阵乘法没有问题但是当我运行以下最小示例时 import tensorflow as tf tf linalg inv
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
Python，Tkinter：如何获取可滚动画布上的坐标

我有一个带有滚动条的 Tkinter 画布还有一些项目当我单击它们时它应该返回坐标使用Python 这对于窗口中最初可见的对象效果很好但是当我向下滚动并且画布上更下方的项目进入视图时单击时我不会获得它们的画布坐标而是获得窗口
跨多个 GPU/机器的 TF-Slim 的配置/标志

我很好奇是否有关于如何使用部署 model deploy py 在多台机器上的多个 GPU 上运行 TF Slim models slim 的示例该文档非常好但我缺少一些内容具体来说需要为worker device和ps devic
Keras：加载多个模型并在不同线程中进行预测

我正在使用带有张量流核心的 Keras 我想在构造函数中加载 2 个不同的模型然后在不同的线程中进行预测根据请求我尝试在张量流图上下文中加载这些模型但它不起作用我的代码 from keras models import load
支持 Nvidia CUDA 工具包 9.2

Tensorflow gpu 绑定到 Nvidia CUDA Toolkit 的特定版本的原因是什么当前版本似乎专门寻找 9 0 并且不适用于任何更高版本例如我安装了最新的 Toolkit 9 2 并将其添加到路径中但 Tensor
Tensorflow GPU 设置：PyCharm 上的 CUDA 错误

我在 Python3 MacOSX El Capitan 上安装了 TF 0 8 当为 TF 运行简单的测试代码时我收到以下消息 ImportError dlopen Library Frameworks Python framework
用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
使用 SURF 在检测到的对象周围绘制矩形

我正在尝试从涉及冲浪检测器的以下代码中检测对象我不想绘制匹配项我想在检测到的对象周围绘制一个矩形但不知何故我无法获得正确的单应性请任何人指出在哪里我走错了 include
如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典
Tensorflow：尽管数据中没有字符串，但使用 tflearn 时不支持将字符串转换为浮点数错误

我似乎无法在我的代码中找到错误其中有任何字符串被错误地转换为浮点数但它却给了我这个错误 W tensorflow core framework op kernel cc 958 Unimplemented Cast string to
计算边界框重叠的百分比，用于图像检测器评估

在测试大图像中的对象检测算法时我们根据地面实况矩形给出的坐标检查检测到的边界框根据 Pascal VOC 挑战有这样的如果预测的边界框重叠更多则认为它是正确的超过 50 带有真实边界框否则边界框被认为是误报检测多次检测是
Tensorflow seq2seq 获取序列隐藏状态

我不久前才开始研究tensorflow 我正在研究 seq2seq 模型并以某种方式让教程起作用但我一直坚持获取每个句子的状态据我了解 seq2seq 模型采用输入序列并通过 RNN 为序列生成隐藏状态随后模型使用序列的隐藏状态来
无需安装 Tensorflow 即可服务 Tensorflow 模型

我有一个经过训练的模型想在 python 应用程序中使用但我看不到任何在不安装 TensorFlow 或创建 gRPC 服务的情况下部署到生产环境的示例有可能吗在这种情况下正确的做法是什么如果不使用 TensorFlow 本身或
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
tf.print() vs Python print vs tensor.eval()

看来在Tensorflow中至少有三种方法可以打印出张量的值我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
Tensorflow Eager Execution 不适用于学习率衰减

在这里尝试让一个热切的执行模型与 LR 衰减一起工作但没有成功这似乎是一个错误因为学习率衰减张量似乎没有更新如果我遗漏了什么你可以帮我一下吗谢谢下面的代码正在学习一些词嵌入但是那学习率衰减部分根本不起作用 class Wo

随机推荐

是否需要销毁运算符删除的形式才能真正销毁对象？

C 20 添加了破坏形式operator delete区别于std destroying delete t范围它导致delete表达式在调用之前不再销毁对象operator delete 目的是在显式调用对象的析构函数和释放内存之前允许
将图层坐标导出到 Excel 的脚本

我找到了一个脚本可以将我的图层坐标从 Photoshop CS5 导出到 XML 我希望这里有人可以帮助我编辑该脚本以将坐标记录到 xls 文件中另外如果可以将每个坐标放在单独的行上那就太好了下面是我想修改以满足我需要的脚本 Th
Ajax 内容和 jQuery 动画效果

我正在尝试使用 jQuery 动画效果为 WordPress 帖子制作 Ajax 内容问题是第一个动画在本例中 fadeOut 工作正常但第二个 FadeIn 或我尝试使用的任何动画效果没有对新内容生效加载的内容只是出现没有任何效
增量后清除推送通知徽章

我正在研究 iPhone 中的推送通知当我收到推送通知时它在我的应用程序图标上显示 1 下次显示 2 3 4 如果我打开应用程序它是 0 下次它应该是 1 2 3 4 但它显示最后一个数字和 1 我想在打开应用程序后重置推送通知徽章
刷新/重新加载 ASP.net 的副作用？

我在 Web 和 ASP Net 开发方面相对较新所以请耐心等待在测试我们的网页的过程中我注意到如果用户单击刷新重新加载并在重新发送信息对话框提示时单击重试则无论用户选择之前触发的最后一个事件如何到刷新随后将再次被
无法解析“...”的依赖关系：无法解析项目：react-native-navigation

问题描述仔细按照中的说明进行操作后https wix github io react native navigation docs Installing https wix github io react native navigatio
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
从休眠乐观锁定异常中恢复

我有一个这样的方法 Transactional propagation Propagation REQUIRES NEW public void doSomeWork Entity entity dao loadEntity do some
jquery 中可点击 div 中的按钮

我有整个 div 您可以单击它来切换该 div 的主要部分问题是我在该 div 中也有可点击的按钮当我点击它时它会执行它应该做的事情但同时也会切换整个 div 我怎样才能禁用它 Use event stopPropagation 单
Jquery.Validate - 基于哪个选项卡添加/删除规则

我有一个 Bootstrap 4 选项卡式界面每个选项卡上都有输入框我想允许用户根据他们所在的选项卡输入不同的必填字段因此我希望根据该选项卡添加或删除验证无论用户位于哪个选项卡还有一些强制输入我所做的是创建一个默认验证函数添加
在 Delphi 中将对象转换为 OleVariant

有没有办法在 OleVariant 中传递包装并解开 TObject 后代我正在尝试跨自动化对象传递 TObject 我知道这不是一个好主意但我没有更好的选择该对象将在来自同一自动化 dll 的对象之间传递如果这有什么区别的话像这
静态构造函数和 BeforeFieldInit？

如果类型没有静态构造函数则将执行字段初始值设定项就在使用该类型之前或者在某个时间点突发奇想运行时为什么这段代码 void Main start Dump Test EchoAndReturn Hello end Dump clas
使用 ADAL v3 使用 ClientID 对 Dynamics 365 进行身份验证

我正在尝试对我们的在线 Dynamics CRM 进行身份验证以使用可用的 API 我能找到的唯一关于执行此操作的官方文档是 https learn microsoft com en us dynamics365 customer enga
GoogleJsonResponseException：500 内部服务器错误：响应太大而无法返回

我正在代码中使用库 com google api services bigquery Bigquery 批量获取 bigquery 中存在的表 20000 来获取结果列表直到前一天它工作正常但从今天开始我开始遇到下面提到的错误 com
数据库分区 - 水平与垂直 - 规范化和行拆分之间的区别？

我试图理解不同的概念数据库分区这就是我的理解水平分区分片将表拆分为不同的表其中将包含初始表中的行的子集如果按大陆拆分用户表我见过很多这样的示例例如北美的子表欧洲的另一个子表 ETC 每个分区位于不同的物理位置理解机器据
添加到列表时有没有办法避免循环？

我想知道这样的代码 List
MySQL 两种日期格式之间的转换

用户将以这种格式输入日期 2017 年 2 月 17 日存储在 mysql 数据库中的日期格式如下 2015 02 17 00 00 00 我想做的是 SELECT FROM insurance where DATE FORMAT in
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
如何在 Tensorflow 对象检测 API 中查找边界框坐标

我正在使用 Tensorflow 对象检测 API 代码我训练了我的模型并获得了很高的检测百分比我一直在尝试获取边界框坐标但它不断打印出 100 个奇怪数组的列表经过在线广泛搜索后我发现数组中的数字意味着什么边界框坐标相对于底层

如何在 Tensorflow 对象检测 API 中查找边界框坐标

如何在 Tensorflow 对象检测 API 中查找边界框坐标 的相关文章

随机推荐

热门标签

如何在 Tensorflow 对象检测 API 中查找边界框坐标的相关文章