tensorflow 利用tfrecords文件制作数据集

2023-05-16

TensorFlow之tfrecords文件详细教程

制作数据集思路：
将训练数据和测试数据生成tfrecords文件  为什么呢？ 这种文件以二进制进行存储，只占用一个内存块 对于大数据能够提高cpu效率

代码步骤
首先对数据进行处理 方便后面写入tfrecords文件
1：使用tf.python_io.TFRecordWriter('定义一个文件名')类 定义一个tfrecords 文件
2：将每一条样本数据按照相应的特征组织好，即将样本数据组织成Example的过程
3：将组织好的Example写入进tfrecords文件，并关闭tfrecords文件即可

import tensorflow  as tf
import numpy as np
from PIL import Image
import os

data_path = './data'
"""
制作数据集思路：
将训练数据和测试数据生成tfrecords文件  为什么呢？ 这种文件以二进制进行存储，只占用一个内存块 对于大数据能够提高cpu效率
代码步骤
首先对数据进行处理 方便后面写入tfrecords文件
1：使用tf.python_io.TFRecordWriter('定义一个文件名')类 定义一个tfrecords 文件
2：将每一条样本数据按照相应的特征组织好，即将样本数据组织成Example的过程
3：将组织好的Example写入进tfrecords文件，并关闭tfrecords文件即可
"""


def write_tfrecord(tfRecordName, image_path, label_path):
    # 使用tf.python_io.TFRecordWriter类定义一个tfrecords 文件
    writer = tf.python_io.TFRecordWriter(tfRecordName)
    num_pic = 0
    # 文件内容为 第一行  图片名  label 第二行 图片名 label
    f = open(label_path, 'r')
    contents = f.readline()
    f.close()
    for content in contents:
        value = content.split()  # 以空格为分隔符，包含 \n
        img_path = image_path + value[0]
        img = Image.open(img_path)
        # 将图片转换为二进制流
        img_raw = img.tobytes()
        labels = [0] * 10  # 生成10列 0
        # 获取图片标签并标记
        labels[int(value[1])] = 1
        # 按照数据特征进行包装 参数features   tf.train.Features() 设置每一个特征
        # 它有三个可选的关键字参数，float_list、int64_list、byteslist 分别对应于取值为浮点数的特征、整数的特征、二进制数的特征。
        example = tf.train.Example(features=tf.train.Features(feature={
            'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])),
            'label': tf.train.Feature(int64_list=tf.train.Int64List(value=labels))
        }))
        # 把数据序列化成字符串处理
        writer.write(example.SerializeToString())
        num_pic += 1
        print('the number of pidture :', num_pic)
    writer.close()
    print('writer tfrecord successful')


def generate_tfRecord():
    isExists = os.path.exists(data_path)
    if not isExists:
        os.makedirs(data_path)
        print('the directory was created successfully ')
    else:
        print('directory already exists')


# tfrecords文件的读取
def read_tfRecord(tfRecord_path):
    # 文件从哪里来 tf.train.string_input_producer([tfrecords 文件名])
    filename_queue = tf.train.string_input_producer([tfRecord_path])
    # 创建reader 对象 用来对tfrecords 文件的读取
    reader = tf.TFRecordReader()
    _, serialized_example = reader.read(filename_queue)
    # 上面那个函数它返回的是(key,value)的元祖形式。上面的serialized_example是无法直接查看的，需要去按照特征进行解析

    # 把读出的每个样本保存在 serialized_example 中进行解序列化，标签和图片的
    # 键名应该和制作 tfrecords 的键名相同，
    features = tf.parse_single_example(serialized_example,
                                       features={
                                           'label': tf.FixedLenFeature([10], tf.int64),
                                           'img_raw': tf.FixedLenFeature([], tf.string)
                                       })
    # tf.decode_raw函数的意思是将原来编码为字符串类型的变量重新变回来，
    img = tf.decode_raw(features['imf_raw'], tf.uint8)
    img.set_shape([784])
    # 将转化为字符串的图像转换为无符号整型数据然后进行图像处理为 1行 数据 方便传入神经网络
    img = tf.cast(img, tf.float32) * (1./255)
    # 标签转化
    label = tf.cast(features['label', tf.float32])
    return img, label

def get_tfrecode(num, isTrain=True):
    img, label = read_tfRecord(tfRecord_path)
    # 随机读取一个batch 的数据
    # tf.train.shuffle_batch(
    # tensor                待乱序处理的列表中的样本 [img, label],
    # batch_size,           从队列中提取的新批量大小
    # capacity,             队列中元素的最大数量
    # min_after_dequeue,    出队后队列中的最小数量元素，用于确保元素的混合级别
    # num_threads=1,        排列 tensors 的线程数
    # seed=None,            用于队列内的随机洗牌
    # enqueue_many=False,   tensor 中的每个张量是否是一个例子
    # shapes=None,          每个示例的形状
    # allow_smaller_final_batch=False,   (可选)如果设置，该队列将在多个会话中以给定名称共享
    # shared_name=None,     (可选)如果设置，该队列将在多个会话中以给定名称共享
    # name=None)            操作的名称（可选）
    img_batch, label_batch = tf.train.shuffle_batch([img, label],
                                                    batch_size=num,
                                                    num_threads=2,
                                                    capacity=1000,
                                                    min_after_dequeue=700
                                                    )
    return img_batch, label_batch

def main():
    generate_tfRecord()


if __name__ == '__main__':
    main()

https://blog.csdn.net/qq_27825451/article/details/83301811

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tfrecords

文件制作数据集

tensorflow 利用tfrecords文件制作数据集的相关文章

Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
调用 tf.linalg.inv 时，TensorFlow 崩溃并显示无法创建 cuSolverDN 实例

我正在运行tensorflow tensoflow latest gpu码头集装箱我可以运行简单的向量运算例如矩阵乘法没有问题但是当我运行以下最小示例时 import tensorflow as tf tf linalg inv
如何安装libcusolver.so.11

我正在尝试安装 Tensorflow 但它要求 libcusolver so 11 而我只有 libcusolver so 10 有人可以告诉我我做错了什么吗这是我的 Ubuntu nvidia 和 CUDA 版本 uname a Lin
如何将 std::vector 转换为张量而不在 C++ 中的张量流中进行复制？

在c 中多维矩阵存储在std vector
跨多个 GPU/机器的 TF-Slim 的配置/标志

我很好奇是否有关于如何使用部署 model deploy py 在多台机器上的多个 GPU 上运行 TF Slim models slim 的示例该文档非常好但我缺少一些内容具体来说需要为worker device和ps devic
如何在nodejs（tensorflow.js）中训练模型？

我想做一个图像分类器但我不会python Tensorflow js 使用我熟悉的 javascript 可以用它来训练模型吗训练步骤是什么坦白说我不知道从哪里开始我唯一想到的是如何加载 mobilenet 它显然是一组预先训练的
在 Tensorflow 对象检测 API 中将图像裁剪到边界框

如何将图像裁剪到 Tensorflow 中的边界框我正在使用Python API 从文档来看 tf image crop to bounding box image offset height offset width target he
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
通过 cmake 使用预编译的张量流

我已经建立了一个 C 项目CLion使用CMake 我正在使用各种第三方库并且还想集成张量流我试过了bazel编译张量流到共享库libtensorflow so哪种工作有效但是仍然有相当多的依赖项例如当前的 protobuf 版本
Tensorflow中的Tensor和Variable有什么区别

有什么区别Tensor and Variable在张量流中我注意到在这个 stackoverflow 答案 https stackoverflow com questions 38556078 in tensorflow what is
从字符串列表创建 TfRecords 并在解码后在张量流中提供图形

目的是创建 TfRecords 数据库给定我有 23 个文件夹每个文件夹包含 7500 个图像以及 23 个文本文件每个文件有 7500 行描述单独文件夹中 7500 个图像的特征我通过以下代码创建了数据库 import ten
Tensorflow seq2seq 获取序列隐藏状态

我不久前才开始研究tensorflow 我正在研究 seq2seq 模型并以某种方式让教程起作用但我一直坚持获取每个句子的状态据我了解 seq2seq 模型采用输入序列并通过 RNN 为序列生成隐藏状态随后模型使用序列的隐藏状态来
AttributeError：模块“tensorflow.python.framework.ops”没有属性“RegisterShape”

我正在使用 TensorFlow 2 1 0 dev20191125 不幸的是我无法编译一个带有错误的简单示例 AttributeError 模块 tensorflow python framework ops 没有属性 Registe
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
在tensorflow.js中对张量进行分区、屏蔽或过滤

我有 2 个相同长度的张量 data and groupIds 我想分开data通过相应的值分成几组groupId 例如 const data tf tensor 1 2 3 4 5 const groupIds tf tensor 0 1
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
ExpirationError（代码= StatusCode.DEADLINE_EXCEEDED，详细信息=“超过截止日期”）

我正在关注tutorial https www youtube com watch v T afaArR0E8用于使用tensorflow services部署inception模型我使用的是ubuntu 16 04和bazel 13 0
tf.print() vs Python print vs tensor.eval()

看来在Tensorflow中至少有三种方法可以打印出张量的值我一直在读here https www freecodecamp org news debugging tensorflow a starter e6668ce72617 an
TensorFlow Bazel 构建失败

我正在使用 Bazel 构建 TensorFlowbazel build c opt config cuda tensorflow cc tutorials example trainer按照 TensorFlow 的指示从源安装说明

随机推荐

mission planner飞行模式设置

我采用的富斯i6遥控器 xff0c 可以设置三种飞行模式飞行模式中有六种模式 xff0c 在哪三个通道设置会与遥控器对应呢 xff1f 首先在遥控器校准选项观察切换遥控器模式时输出的pwm值 xff1a 三个值分别为1000 1
ArduPilot Tutorial(PDF版)及ArduPilot飞行模式介绍

ArduPilot官方Tutorial PDF 2017 2 http download csdn net download xiaoshuai537 10262086 ArduPilot中有14种常用的模式 xff1a 依赖GPS的模式有
PX4飞行模式-多旋翼

手动模式 xff08 1 xff09 ARCO xff1a 特技模式遥控器输入被转换为横滚俯仰和偏航速度 xff0c 当摇杆回中时飞行器不会保持平衡 xff0c 可以用于翻滚等特技飞行 xff08 2 xff09 RATTITUDE x
《PID控制算法的C语言实现》学习笔记

1 PID算法原理如果偏差为0 xff0c 则比例环节不起作用 xff1b 积分环节主要是用来消除静差 xff0c 即系统稳定后输出值和设定值之间的差值 xff1b 微分环节则反映了偏差信号的变化规律 xff0c 根据偏差信号的变化趋势来
跟我一起写Makefile（整理版）

跟我一起写Makefile 陈皓 xff08 博客地址 xff1a http blog csdn net haoel article details 2886 xff09 整理的PDF文件 xff1a http download csdn
PX4 Makefile分析解读

参考文章 xff1a PX4源码的Makefile详细理解 http blog csdn net linkcian article details 79152724 感谢原文作者主要分析 make px4fmu v2 default编译流
CREO工程图学习笔记

CREO工程图技术手册学习笔记 1 小功能不同窗口切换操作 xff1a 视图激活材料设置 xff1a 文件准备模型属性 2 视图创建插入视图 xff1a 图纸上长按右键插入普通视图插入投影视图 xff1a 选择母视图 xff
操作系统清华向勇陈渝版笔记（七）进程与线程 PCB TCB 进程挂起用户线程内核线程轻量级进程僵尸队列

7 1 进程定义 OS系统从只能跑一个程序到能跑多个进程可以描述程序的执行过程进程 xff1a 一个具有一定独立功能的程序在一个数据集合上的一次动态执行过程只有当一个程序被OS加载到内存中 xff0c cpu对其执行时 xff0c 这
基于stm32F103HAL库+cubemx+freertos无感无刷电机BLDC控制程序开发

基于stm32F103HAL库 43 cubemx 43 freertos无感无刷电机BLDC控制程序开发最近在做一个舵机控制项目 xff0c 控制对象为大功率无感无刷电机 xff0c 网上搜遍了资源 xff0c 貌似这方面的资源真得十分
C++思路

1 统计英文单词在进行文章重复度检查时 xff0c 经常需要统计一段英文中的单词数量 xff0c 并找出长度最长的单词设有如下定义 xff1a char str 500 编写程序 xff0c 通过利用cin getline str 50
基于OpenCV构建停车场车位识别项目

OpenCV是一个基于 xff08 开源 xff09 发行的跨平台计算机视觉库 xff0c 能实现图像处理和计算机视觉方面的很多通用算法车位识别的图像处理过程如图所示在python中设置完所有内容后 xff0c 最重要的依赖关系将是Op
学生成绩管理系统-python

乱写的成绩管理系统派森 span class token comment 定义学生类型姓名学号科目 span span class token keyword class span span class token class na
11_3、Java集合之迭代器Iterator接口

一引入 Iterator对象称为迭代器设计模式的一种 xff0c 主要用于遍历 Collection 集合中的元素 GOF给迭代器模式的定义为 xff1a 提供一种方法访问一个容器 container 对象中各个元素 xff0c 而又
进程切换和进程调度的区别

进程切换和进程调度的区别调度是决定将系统资源分配给哪个进程 xff0c 进程切换是实际分配系统资源另外需要注意进程切换一定会产生中断 xff0c 进行处理器模式切换 xff0c 即从用户态进入内核态 xff0c 之后又回到用户态 xff
树莓派3b+安装ubuntu server，安装mysql

1 下载镜像 http cdimage ubuntu com ubuntu releases 18 04 5 release ubuntu 18 04 5 preinstalled server arm64 43 raspi3 img xz
【GVINS初体验】

在Ubuntu18 04下跑通GVINS GVINS介绍环境配置 1 C 11编译器 2 ROS 3 Eigen 4 Ceres 5 gnss comm Build GVINS 跑VINS啦 GVINS介绍 GVINS是一个基于非线性优化
【OpenCV】基于Adaboost和Haar-like特征人脸识别

毕设算是告一段落 xff0c 里面用了一点点人脸识别 xff0c 其实完全是OpenCV自带的 xff0c 源自两篇论文 xff1a P Viola and M Jones Rapid object detection using a bo
Jetson Tx2上跑MYNT_EYE的ORB SLAM示例

愁呀 xff0c 按照官网的说明文档 xff0c 好长时间郁闷在跑不起来每次都是在加载词袋时报bad malloc 打开MYNT EYE ORB SLAM2 Sample Vocabulary ORBvoc txt词袋看见1082073行
解决ST-LINK无法连接设备（解决不了你顺着网线来打我）

问题分析问题描述在mdk中 xff0c 点击下载按钮提示找不到目标设备 xff0c 无法自动下载程序原因猜想单片机只有在停止状态下才可以下载程序 xff1f 猜想验证如果让单片机处在停止状态 xff0c 是不是就能正常下载了呢 x
tensorflow 利用tfrecords文件制作数据集

TensorFlow之tfrecords文件详细教程制作数据集思路 xff1a 将训练数据和测试数据生成tfrecords文件为什么呢 xff1f 这种文件以二进制进行存储 xff0c 只占用一个内存块对于大数据能够提高cpu效率代

tensorflow 利用tfrecords文件制作数据集

TensorFlow之tfrecords文件详细教程

tensorflow 利用tfrecords文件制作数据集 的相关文章

随机推荐

热门标签

tensorflow 利用tfrecords文件制作数据集的相关文章