我是 TensorFlow 的新手。
目前,我正在TensorFlow网站上测试一些分类示例“卷积神经网络”,它解释了如何将输入图像分类到预定义的类中,但问题是:我不知道如何在相同的图像。例如,我有一个带有猫和狗的输入图像,我希望我的图形在输出中显示图像中都有“猫和狗”。
很好的问题。检测同一图像中的多个对象本质上是一个“分割问题”。两种不错且流行的算法是
YOLO(你只看一次)和SSD(单次多盒检测器)。我在底部添加了它们的链接。
我会观看一些有关 YOLO 如何工作的视频,看看你是否掌握了这个想法。然后阅读有关 SSD 的论文,看看您是否明白为什么该算法更快、更精确。
这两种算法都是单通道的:它们只查看图像“一次”并预测它们发现的类别的边界框。有更精确的算法,但它们速度较慢(它们首先选择许多想要查看的点,然后仅在该点上运行分类器。结果是它们在每个图像上运行该分类器多次,这很慢)。
正如您所说,您是 Tensorflow 的新手,您可以尝试其他人编写的代码:https://github.com/thtrieu/darkflow https://github.com/thtrieu/darkflow。非常广泛的自述文件向您展示了如何开始使用您自己的数据集。
祝你好运,如果您还有其他问题,或者这些算法不适合您的用例,请告诉我们。
- 优洛 9000(https://pjreddie.com/darknet/yolo/ https://pjreddie.com/darknet/yolo/)
- SSD(单发多盒检测器)(https://arxiv.org/abs/1512.02325 https://arxiv.org/abs/1512.02325)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)