如何探索和修改从 tf.keras.preprocessing.image_dataset_from_directory() 创建的数据集？

2023-12-09

这是我使用该函数的方式：

dataset = tf.keras.preprocessing.image_dataset_from_directory(
    main_directory,
    labels='inferred',
    image_size=(299, 299),
    validation_split=0.1,
    subset='training',
    seed=123
)

我想探索创建的数据集，就像这样example，特别是它被转换为pandas数据框。但我的最低目标是检查标签和附加的文件数量，只是为了检查它是否确实按预期创建了数据集（子目录是其中图像的相应标签）。

需要明确的是，main_directory设置如下：

main_directory
- class_a
  - 000.jpg
  - ...
- class_b
  - 100.jpg
  - ...

我希望看到数据集显示其信息，如下所示：

label     number of images
class_a   100
class_b   100

此外，是否可以删除数据集中的标签和相应图像？我们的想法是，如果相应的图像数量小于一定数量或不同的指标，则丢弃它们。当然可以通过其他方式在此函数之外完成，但我想知道这是否确实可能，如果可以，如何实现。

编辑：对于其他上下文，所有这一切的最终目标是训练一个预训练模型，例如this本地图像分为以其类命名的文件夹。如果有更好的方法，包括不使用该功能并满足此最终目标，我们仍然欢迎。谢谢！

我认为使用起来会容易得多glob2获取所有文件名，根据需要处理它们，然后创建一个简单的加载函数来替换image_dataset_from_directory.

获取您的所有文件：

files = glob2.glob('class_*\\*.jpg')

然后根据需要操作该文件名列表。

然后，创建一个加载图像的函数：

def load(file_path):
    img = tf.io.read_file(file_path)
    img = tf.image.decode_jpeg(img, channels=3)
    img = tf.image.convert_image_dtype(img, tf.float32)
    img = tf.image.resize(img, size=(299, 299))
    label = tf.strings.split(file_path, os.sep)[0]
    label = tf.cast(tf.equal(label, 'class_a'), tf.int32)
    return img, label

然后创建用于训练的数据集：

train_ds = tf.data.Dataset.from_tensor_slices(files).map(load).batch(4)

然后训练：

model.fit(train_ds)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

machinelearning

Keras

deeplearning

如何探索和修改从 tf.keras.preprocessing.image_dataset_from_directory() 创建的数据集？的相关文章

没有名为 crypto.cipher 的模块

我现在正在尝试加密一段时间我最近得到了这个基于 python 的密码器名为PythonCrypter https github com jbertman PythonCrypter 我对 Python 相当陌生当我尝试通过终端打开 C
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
ubuntu 20.04 上无法获取卷积算法错误~tensorflow-gpu

我有一个 NVIDIA 2070 RTX GPU 我的操作系统是 Ubuntu20 04 我已经使用 conda 安装了tensorflow gpu 包我有not安装了 CUDA toolkit 我相信它还会安装 CUDA toolkit
Spark KMeans 无法处理大数据吗？

KMeans 有几个参数training http spark apache org docs latest api python pyspark mllib html highlight kmeans pyspark mllib clus
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
从 Flask 访问 Heroku 变量

我已经使用以下命令在 Heroku 配置中设置了数据库变量 heroku config add server xxx xxx xxx xxx heroku config add user userName heroku config add
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

嵌套跨度上未禁用 CSS 直通

CSS ol margin 0 30px li margin 15px 0 li done text decoration line through li done span text decoration none background
使用“$CI_JOB_TOKEN”“包含”私有项目文件

到目前为止我得到的是可以通过以下方式进行身份验证Personal Access Token and include外部 CI 脚本但更简洁的方法是使用 CI JOB TOKEN因为它更安全更受限制我正在研究是否可以通过这种方式完成
多个 dropzone.js - 单页

不是在单个 dropzone 元素上上传多个文件是否可以在单个页面上拥有多个 dropzone 元素当有多个元素时选择对话框后似乎 dropzone 甚至不会触发每个元素都初始化了自己的 dropzone 使用 dropzone 的
为什么 jest.spyOn() 有时不能在 Vue 组件的方法上工作？

我看到该方法作为事件处理程序所做的更改但是jest spyOn wrapper vm methodName 在主要情况下无法接听电话但在某些测试中它以某种方式起作用我怀疑可能会重新渲染也许是因为options论证中mount 调用
maven 和 jboss 模块

我是 Maven 和 jboss 的新手所以我试图从它们之间的合作中受益我在 Eclipse 中有一个 Maven 项目该项目有许多依赖项在运行时我想将它们作为 jboss 的模块提供否则我的 EAR 将非常大我还使用 Nexu
如何在 MVC 3 中关闭客户端验证？

我有一个客户端验证框架我更喜欢使用它而不是 ASP NET MVC 3 附带的现有框架有谁知道如何在 MVC 3 中禁用它我已经尝试过以下方法 HtmlHelper ClientValidationEnabled false Htm
如何根据用户区域设置 Dygraphs 图例中的日期和时间格式

我有一个图表显示设备随时间的功率输出我想格式化图例以便它以当前用户所在位置的样式显示时间戳例如在美国它会显示MM DD YY h m s am pm 并且在欧盟会显示DD MM YYYY HH MM SS ETC 目前它是默认
无法显示 HTML + SVG

我以前用过JEditorPane 但只能显示HTML 不能显示SVG 嵌套SVG HTML也不能完整显示然后我用JSVGCanvas 但只能显示SVG 不能显示HTML 有什么办法可以解决这个问题吗配置JEditorPane使用JSVG
我无法将 ComboBox 停靠在 TableLayoutPanel 单元格中

请看下图我想对接一个组合框我的 TableLayoutPanel 的单元格中的控件组合框Dock属性设置为Fill和Anchor财产给上下左右 TL DR 这是预期的行为对于ComboBox环境Dock to Fill没有填满容
Spring @RequestMapping“不包含”正则表达式

我有这个请求映射 RequestMapping value route to destination from departure html method RequestMethod GET RequestMethod HEAD 我想添加
C++ 中没有定义的类声明

我对 C 没有太多经验我对 Qt 文档中的以下几行有疑问 http qt project org doc qt 4 8 mainwindows application mainwindow h html 顶部注释后的第 4 6 行 cla
如何显示 HTTP 401 基本身份验证对话框

I am new to web development I have Android application that hosts some web pages using HTTPServer I am using Netty to de
python setup.py install 忽略 install_requires

我无法使用安装本地软件包setup py 这是项目结构 my project lib local1 local1 1 0 whl index html local2 local2 1 0 whl index html setup py se
如何使 HTML 有序列表的文本居中而不是数字标签居中

我正在为页面创建一个小部件以相反的顺序列出步骤我计划用一个ol并设置value个人的属性li标签强制编号ol被逆转到目前为止一切都很好然而我有一个设计难题我不确定可以用 css 解决有了这个标记是否可以将文本居中但保持标签
core-plot iOS 反转 Y 轴

我想使用 core plot 来显示水深图实时更新但我不知道如何反转 Y 轴以便 X 轴代表时域位于顶部我的 UIView 和 Y 轴以正值向底部增长 EDIT 如果我能像这样画轴那就更好了 X轴是时间 Y 轴从 0 到 X X
如何在 Javascript 中获取 pdf 中选定的文本？

我正在编写一个 Chrome 扩展来操作 pdf 文件所以我想获取 pdf 中选定的文本我怎样才能做到这一点像这样的东西您可以使用内部未记录的命令内置 PDF 查看器以下是内容脚本的示例 function getPdfSelect
如何判断两个向量之间的角度是外角还是内角？

我知道如何找出两个向量之间的角度但它总是给我内角但我希望它总是给我逆时针方向的角度即使它大于 180 度我正在使用 C 但这并不重要因为我需要了解理论 This is what I am using now 您正在寻找atan2
使用 Powershell 自动执行 IE 确认提示

我有一个很好的 powershell 脚本可以为我女儿自动创建一个特定的网站最近他们更改了网站并添加了一个不错的新功能可以将我的脚本速度提高 10 倍问题是他们用来激活此功能的输入类型会弹出一个确认对话框 HTML 看起来像这样
Swagger：<字符串，对象> 的映射

我需要使用 Swagger 记录一个 API 该 API 使用对象映射作为输入和输出并通过字符串键进行索引 Example a property foo property 1 a string 1 property 2 a string
如何探索和修改从 tf.keras.preprocessing.image_dataset_from_directory() 创建的数据集？

这是我使用该函数的方式 dataset tf keras preprocessing image dataset from directory main directory labels inferred image size 299 29

如何探索和修改从 tf.keras.preprocessing.image_dataset_from_directory() 创建的数据集？

如何探索和修改从 tf.keras.preprocessing.image_dataset_from_directory() 创建的数据集？ 的相关文章

随机推荐

热门标签

如何探索和修改从 tf.keras.preprocessing.image_dataset_from_directory() 创建的数据集？的相关文章