TensorFlow 2.0：在自定义训练循环中显示进度条

2024-05-23

我正在为音频分类任务训练 CNN，并且使用带有自定义训练循环的 TensorFlow 2.0 RC（如中所述本指南 https://www.tensorflow.org/beta/guide/keras/training_and_evaluation#part_ii_writing_your_own_training_evaluation_loops_from_scratch来自他们的官方网站）。我发现拥有一个漂亮的进度条真的很方便，类似于通常的 Kerasmodel.fit.

这是我的训练代码的概要（我使用 4 个 GPU，采用镜像分布策略）：

strategy = distribute.MirroredStrategy()

distr_train_dataset = strategy.experimental_distribute_dataset(train_dataset)

if valid_dataset:
    distr_valid_dataset = strategy.experimental_distribute_dataset(valid_dataset)

with strategy.scope():

    model = build_model() # build the model

    optimizer = # define optimizer
    train_loss = # define training loss
    train_metrics_1 = # AUC-ROC
    train_metrics_2 = # AUC-PR
    valid_metrics_1 = # AUC-ROC for validation
    valid_metrics_2 = # AUC-PR for validation

    # rescale loss
    def compute_loss(labels, predictions):
        per_example_loss = train_loss(labels, predictions)
        return per_example_loss/config.batch_size

    def train_step(batch):
        audio_batch, label_batch = batch
        with tf.GradientTape() as tape:
            logits = model(audio_batch)
            loss = compute_loss(label_batch, logits)
        variables = model.trainable_variables
        grads = tape.gradient(loss, variables)
        optimizer.apply_gradients(zip(grads, variables))

        train_metrics_1.update_state(label_batch, logits)
        train_metrics_2.update_state(label_batch, logits)
        train_mean_loss.update_state(loss)
        return loss

    def valid_step(batch):
        audio_batch, label_batch = batch
        logits = model(audio_batch, training=False)
        loss = compute_loss(label_batch, logits)

        val_metrics_1.update_state(label_batch, logits)
        val_metrics_2.update_state(label_batch, logits)
        val_loss.update_state(loss)
        return loss

    @tf.function 
    def distributed_train(batch):
        num_batches = 0
        for batch in distr_train_dataset:
            num_batches += 1
            strategy.experimental_run_v2(train_step, args=(batch, ))
            # print progress here
            tf.print('Step', num_batches, '; Loss', train_mean_loss.result(), '; ROC_AUC', train_metrics_1.result(), '; PR_AUC', train_metrics_2.result())
            gc.collect()

    @tf.function
    def distributed_valid(batch):
        for batch in distr_valid_dataset:
            strategy.experimental_run_v2(valid_step, args=(batch, ))
            gc.collect()

for epoch in range(epochs):
    distributed_train(distr_train_dataset)
    gc.collect()
    train_metrics_1.reset_states()
    train_metrics_2.reset_states()
    train_mean_loss.reset_states()

    if valid_dataset:
        distributed_valid(distr_valid_dataset)
        gc.collect()
        val_metrics_1.reset_states()
        val_metrics_2.reset_states()
        val_loss.reset_states()

Here train_dataset and valid_dataset是使用通常的 tf.data 输入管道生成的两个 tf.data.TFRecordDataset。

TensorFlow 提供了一个非常好的 tf.keras.utils.Progbar （这确实是您在使用model.fit）。我已经看了一下它的源代码 https://github.com/tensorflow/tensorflow/tree/r1.14/tensorflow/python/keras/utils/generic_utils.py#L313-L480，它依赖于 numpy，所以我不能用它来代替tf.print()语句（以图形模式执行）。

如何在自定义训练循环中实现类似的进度条（训练函数在图形模式下运行）？

如何model.fit首先显示进度条？

可以使用以下代码生成自定义训练循环的进度条：

from tensorflow.keras.utils import Progbar
import time 
import numpy as np

metrics_names = ['acc','pr'] 

num_epochs = 5
num_training_samples = 100
batch_size = 10

for i in range(num_epochs):
    print("\nepoch {}/{}".format(i+1,num_epochs))
    
    pb_i = Progbar(num_training_samples, stateful_metrics=metrics_names)
    
    for j in range(num_training_samples//batch_size):
        
        time.sleep(0.3)
        
        values=[('acc',np.random.random(1)), ('pr',np.random.random(1))]
        
        pb_i.add(batch_size, values=values)

Output :

epoch 1/5

100/100 [==============================] - 3s 30ms/step - acc: 0.2169 - pr: 0.9011

epoch 2/5

100/100 [==============================] - 3s 30ms/step - acc: 0.7815 - pr: 0.4900

epoch 3/5

100/100 [==============================] - 3s 30ms/step - acc: 0.8003 - pr: 0.9292

epoch 4/5

100/100 [==============================] - 3s 30ms/step - acc: 0.8280 - pr: 0.9113

epoch 5/5

100/100 [==============================] - 3s 30ms/step - acc: 0.8497 - pr: 0.1929

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow 2.0：在自定义训练循环中显示进度条的相关文章

如何计算 pandas datetime 对象的均值和方差？

如何计算 YYYY MM DD 形式的 python 日期时间对象的汇总统计数据均值和标准差我想对具有不同 ID 的不同日期时间对象组执行此操作数据如下 import datetime as dt df pd DataFrame Da
类的 IPython 表示

我正在使用我创建的模块尝试 IPython 但它没有显示类对象的实际表示相反它显示类似的内容 TheClass module TheClass name I heavily在这个模块中使用元类我有真正有意义的类表示应该向用户显示是
Pandas set_levels，如何避免标签排序？

我使用时遇到问题set levels多索引 from io import StringIO txt Name Height Age Metres A 1 25 B 95 1 df pd read csv StringIO txt heade
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
使用主题交换运行多个 Celery 任务

我正在用 Celery 替换一些自制代码但很难复制当前的行为我期望的行为如下创建新用户时应向tasks与交换user created路由键该消息应该触发两个 Celery 任务即send user activate email
向进度条添加百分比文本 C#

我有一个方法可以显示进程栏何时正在执行以及何时成功完成我工作得很好但我想添加一个百分比如果完成则显示 100 如果卡在某个地方则显示更少我在网上做了一些研究但我无法适应我正在寻找的解决方案这是我的代码 private voi
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
如何使用 Selenium 和 ChromeDriver 解决 TypeError: 'module' object is not callable 错误 [重复]

这个问题在这里已经有答案了代码试验 from selenium import webdriver from selenium webdriver chrome options import Options as Chromeoptions
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何使用 Boto3 启动具有 IAM 角色的 EC2 实例？

我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

如何用Classic asp解析xml？

你好我需要用 Classic asp 解析 xml 这是 XML
django import-export 是否可以自定义预览模板？

我的管理端将由非系统管理员人员使用因此我希望它尽可能清晰我不明白如何在确认导入之前自定义预览要添加具有外键引用的对象我只需查找匹配的 idbefore import函数并按照解释替换它here https stackoverflow
Magento：如何在 CMS 页面中包含 php 调用

按照此页面的说明进行操作 http www magento cc how to use php on a cms page html http www magento cc how to use php on a cms page html
PHP 的password_verify() 是否可以抵御极长的密码（DoS 攻击）？

一般攻击场景 2013 年 Django 存在一个普遍漏洞攻击者可以通过非常大的密码创建极其密集的 CPU 计算请参阅此处的安全通知 https www djangoproject com weblog 2013 sep 15 secu
SetInterval 函数不适用于 PHP 文件

我有这样的index html
循环引用导致 Automapper 堆栈溢出

我正在使用 Automapper 将 NHibernate 代理对象 DTO 映射到我的 CSLA 业务对象我正在使用 Fluent NHibernate 创建映射这工作正常我遇到的问题是Order有一个集合OrderLines其中每
TabControl 和边框视觉故障

我在每台电脑上都有这些视觉故障tabControls当我改变它的时候tabPages BackColor和BackColor的形式如下图所示在顶部tabPage 有一个内部单像素白色边框在左侧tabPage 有一个内部三像素白色边框
节点应用程序之间共享会话？

我目前有两个独立的节点应用程序在两个不同的端口上运行但共享相同的后端数据存储我需要在两个应用程序之间共享用户会话以便当用户通过一个应用程序登录时他们的会话可用并且他们似乎已登录到另一个应用程序在本例中它是一个面向公众的网站和一
自定义元素可以扩展输入元素吗？

使用Web组件规范是否可以扩展特定类型的
Google Cloud Build - firebase 部署错误：“公共目录‘dist/browser’不存在，无法将托管部署到站点 PROJECT-ID”

我正在尝试将我的 Angular Universal Web 应用程序同时部署到 Cloud Run 用于 SSR 和 Firebase Hosting 用于缓存 Cloud Run 的部署工作正常我遵循了本指南 https cloud
如何以编程方式在 C# 中使用“using”关键字？

我有一些 System Diagnostics Processes 要运行我想自动调用它们的 close 方法显然 using 关键字为我做到了这一点这是使用using关键字的方法吗 foreach string command in
如果 Grunt 任务的子任务之一失败，如何使其失败？

我在 grunt 中有一个构建任务如下所示 grunt registerTask build jshint uglify 问题是即使 jshint 任务失败 uglify 任务也会运行如果它的子任务之一失败如何使 build 任务终
是否可以使materialize.css模态更大并删除垂直滚动条？

我刚刚创建了按钮单击后会弹出一个模式每个按钮都有一个显示不同练习 gif 的模式然而模态框太小导致用户无法看到整个 gif 迫使他们向下滚动我想删除滚动条并使模态更大以便用户可以看到整个 gif 任何帮助都会很棒这是我的代码
Spring boot：从 bean 访问命令行参数

我使用单个参数文件名运行 spring boot 应用程序该文件包含我在运行时需要的一些属性当应用程序启动时它会检查是否args length 1 但我需要这个文件属性在一个点 Component带注释的 bean 这是一种从中
Draggable Boxview 不更新 Xamarin

我的第一个问题是框视图生成在左上角而不是我指定的设计网格第 10 行和网格第 3 列第二个问题在于可拖动视图在代码本地可拖动视图的第一部分中它正确地调用了触摸事件但也许它没有在GUI中更新
Firebase 回调 - 底层触发器是什么？

据我所知在 Firebase 中我可以使用 on 方法注册我的页面以进行回调根据他们的文档 on 用于监听特定位置的数据更改这是从 Firebase 读取数据的主要方式 firebaseRef on value function da
ListView onScroll 事件

我正在编写一个简单的 C 应用程序我需要 Listview 上的 onScroll 事件所以我创建了ListviewEx类继承原来的ListView 我找到了如何从 WinAPI 检测滚动消息并修改了 WndProc 方法现在我有这
如何关闭字母按钮？

下面的代码中有一堆字母按钮 table tr tr table
内连接 3 个表

我正在使用 PHP 和 PDO 我需要重新收集连接 3 个表的信息 photos albums 相册照片该表具有以下结构 photos photo id int path varchar nick varchar date timesta
TensorFlow 2.0：在自定义训练循环中显示进度条

我正在为音频分类任务训练 CNN 并且使用带有自定义训练循环的 TensorFlow 2 0 RC 如中所述本指南 https www tensorflow org beta guide keras training and evaluat

TensorFlow 2.0：在自定义训练循环中显示进度条

TensorFlow 2.0：在自定义训练循环中显示进度条 的相关文章

随机推荐

热门标签

TensorFlow 2.0：在自定义训练循环中显示进度条的相关文章