从 Tensorflow 中的文件队列访问文件名

2024-01-28

我有一个图像目录,以及一个将图像文件名与标签相匹配的单独文件。因此,图像目录包含“train/001.jpg”等文件,标签文件如下所示:

train/001.jpg 1
train/002.jpg 2
...

通过根据文件名创建文件队列,我可以轻松地从 Tensorflow 中的图像目录加载图像:

filequeue = tf.train.string_input_producer(filenames)
reader = tf.WholeFileReader()
img = reader.read(filequeue)

但我不知道如何将这些文件与标签文件中的标签结合起来。看来我需要在每一步访问队列内的文件名。有办法得到它们吗?此外,一旦我有了文件名,我就需要能够查找由文件名键入的标签。标准 Python 字典似乎不起作用,因为这些计算需要在图中的每个步骤进行。


鉴于您的数据不太大,无法以 python 数组的形式提供文件名列表,我建议只在 Python 中进行预处理。创建文件名和标签的两个列表(相同的顺序),并将它们插入 randomshufflequeue 或队列中,然后从中出列。如果您想要 string_input_ Producer 的“无限循环”行为,您可以在每个纪元开始时重新运行“入队”。

一个非常玩具的例子:

import tensorflow as tf

f = ["f1", "f2", "f3", "f4", "f5", "f6", "f7", "f8"]
l = ["l1", "l2", "l3", "l4", "l5", "l6", "l7", "l8"]

fv = tf.constant(f)
lv = tf.constant(l)

rsq = tf.RandomShuffleQueue(10, 0, [tf.string, tf.string], shapes=[[],[]])
do_enqueues = rsq.enqueue_many([fv, lv])

gotf, gotl = rsq.dequeue()

with tf.Session() as sess:
    sess.run(tf.initialize_all_variables())
    tf.train.start_queue_runners(sess=sess)
    sess.run(do_enqueues)
    for i in xrange(2):
        one_f, one_l = sess.run([gotf, gotl])
        print "F: ", one_f, "L: ", one_l

关键是,当您执行以下操作时,您可以有效地将文件名/标签对排队enqueue,这些对由dequeue.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从 Tensorflow 中的文件队列访问文件名 的相关文章

随机推荐