如何在 keras 中存储每个周期的操作结果（如 TOPK）

2024-04-08

我在keras中编写了一个自定义层。在这个自定义层的一部分中，可以说我有一个像这样的矩阵：

c = tf.cast(tf.nn.top_k(tf.nn.top_k(n, tf.shape(n)[1])[1][:, ::-1], tf.shape(n)[1])[1][:, ::-1], dtype=tf.float32)

我的问题是，如何跟踪每个时期的结果值？

例如，如果我有 20 个纪元，我需要将这个矩阵中的 20 个保存在csv file.

（我知道如何保存模型的权重，但这是中间层操作的结果，我需要跟踪这个矩阵）。

我做了什么：

这是我的层的结构：

class my_layer(Layer):
    def __init__(self, topk, ctype, **kwargs):
    self.x_prev = None
    self.topk_mat = None

   def call(self, x):
     'blah blah'

   def get_config(self):
      'blah blah'

   def k_comp_tanh(self,x, f=6):
     'blah blah'
      if self.topk_mat is None:
            self.topk_mat = self.add_weight(shape=(20, 25),
                                          initializer='zeros',
                                          trainable=False,
                                          # dtype=tf.float32,
                                          name='topk_mat')

     c = tf.cast(tf.nn.top_k(tf.nn.top_k(n, tf.shape(n)[1])[1][:, ::-1], tf.shape(n)[1])[1][:, ::-1], dtype=tf.float32)
     self.topk_mat.assign(c)

构建模型并拟合数据的代码：

class AutoEncoder(object):
def __init__(self, input_size, dim, comp_topk=None, ctype=None, save_model='best_model'):
    self.input_size = input_size
    self.dim = dim
    self.comp_topk = comp_topk
    self.ctype = ctype
    self.save_model = save_model
    self.build()

def build(self):
    input_layer = Input(shape=(self.input_size,))
    encoded_layer = Dense(self.dim, activation=act, kernel_initializer="glorot_normal", name="Encoded_Layer")
    encoded = encoded_layer(input_layer)
    encoder_model = Model(outputs=encoded, inputs=input_layer)
    encoder_model.save('pathto/encoder_model')

    self.encoded_instant = my_layer(self.comp_topk, self.ctype)
    encoded = self.encoded_instant(encoded)
    decoded = Dense_tied(self.input_size, activation='sigmoid',tied_to=encoded_layer, name='Decoded_Layer')(encoded)

    # this model maps an input to its reconstruction
    self.autoencoder = Model(outputs=decoded, inputs=input_layer)

    # this model maps an input to its encoded representation
    self.encoder = Model(outputs=encoded, inputs=input_layer)

    # create a placeholder for an encoded input
    encoded_input = Input(shape=(self.dim,))
    # retrieve the last layer of the autoencoder model
    decoder_layer = self.autoencoder.layers[-1]
    # create the decoder model
    self.decoder = Model(outputs=decoder_layer(encoded_input), inputs=encoded_input)

def fit(self, train_X, val_X, nb_epoch=50, batch_size=100, contractive=None):
    import tensorflow as tf
    optimizer = Adam(lr=0.0005)

    self.autoencoder.compile(optimizer=optimizer, loss='binary_crossentropy') # kld, binary_crossentropy, mse

    cbk = tf.keras.callbacks.LambdaCallback(
        on_epoch_begin=lambda epoch, logs: np.savetxt("foo.csv", tf.keras.backend.eval(self.encoded_instant.topk_mat), delimiter=","))
    self.autoencoder.fit(train_X[0], train_X[1],
                    epochs=nb_epoch,
                    batch_size=batch_size,
                    shuffle=True,
                    validation_data=(val_X[0], val_X[1]),
                    callbacks=[
                                ReduceLROnPlateau(monitor='val_loss', factor=0.2, patience=3, min_lr=0.01),
                                EarlyStopping(monitor='val_loss', min_delta=1e-5, patience=5, verbose=1, mode='auto'),
                                cbk,
                  save_best_only=True, mode='auto')
                                CustomModelCheckpoint(custom_model=self.encoder, filepath="pathtocheckpoint/{epoch}.hdf5",save_best_only=True,  monitor='val_loss', mode='auto')
                    ]
                    )

    return self


cbk = tf.keras.callbacks.LambdaCallback(
    on_epoch_begin=lambda epoch, logs: np.savetxt("mycsvtopk.csv", tf.keras.backend.eval(my_layer.topk_mat, delimiter=",")))
                                       )
self.autoencoder.fit(train_X[0], train_X[1],
                epochs=nb_epoch,
                batch_size=batch_size,
                shuffle=True,
                validation_data=(val_X[0], val_X[1]),
                callbacks=[cbk,CustomModelCheckpoint(custom_model=self.encoder, filepath="path_to_file/{epoch}.hdf5",save_best_only=True,  monitor='val_loss', mode='auto')
                    ]
                    )

这就是我所说的Autoencoder class

ae = AutoEncoder(n_vocab, args.n_dim, comp_topk=args.comp_topk, ctype=args.ctype, save_model=args.save_model)
ae.fit([X_train_noisy, X_train], [X_val_noisy, X_val], nb_epoch=args.n_epoch, \
        batch_size=args.batch_size, contractive=args.contractive)

它会引发错误：

tensorflow.python.framework.errors_impl.FailedPreconditionError: Attempting to use uninitialized value mylayer_1/topk_mat
     [[{{node _retval_mylayer_1/topk_mat_0_0}} = _Retval[T=DT_FLOAT, index=0, _device="/job:localhost/replica:0/task:0/device:CPU:0"](mylayer_1/topk_mat)]]
Exception TypeError: TypeError("'NoneType' object is not callable",) in <bound method Session.__del__ of <tensorflow.python.client.session.Session object at 0x7f56ae01bc50>> ignored

我在 CustomCallback 中看到的示例都与模型已经意识到的指标相关，例如损失、准确性…… 我上面基于@Jhadi想法所做的是将其结果保存在一个最初用 None 初始化的变量中，然后在拟合部分传递该变量以将其保存为 csv 格式。尽管我收到此错误并尝试了多种方法来修复它但没有成功，但这似乎必须有效。在我看来，这就像一个Keras library issue.

我认为你可以使用保存变量列表跟踪检查点 https://www.tensorflow.org/guide/checkpoint#list_and_dictionary_tracking.

您需要在训练中添加代码，因此您需要对训练循环进行编码并在每个时期结束时保存变量。

def fit_and_save_log(self, train_X, val_X, nb_epoch=50, batch_size=100, contractive=None):
    import tensorflow as tf
    optimizer = Adam(lr=0.0005)

    self.autoencoder.compile(optimizer=optimizer, loss='binary_crossentropy') # kld, binary_crossentropy, mse   
    
    save = tf.train.Checkpoint()
    save.listed = []
    
    # Prepare dataset
    X, y = train_X
    train_ds = tf.data.Dataset.from_tensor_slices((x, y))
    train_ds = train_ds.shuffle(10000)
    train_ds = train_ds.batch(batch_size)
    iterator = train_ds.make_initializable_iterator()
    next_batch = iterator.get_next()

    for epoch in range(nb_epoch):
        sess.run(iterator.initializer)           
        
        while True:
            try:
                self.autoencoder.train_on_batch(next_batch[0], next_batch[1])
            except tf.errors.OutOfRangeError:
                break
        
        save.listed.append(self.encoded_instant.topk_mat)

        # you can compute validation results here 

    save_path = save.save('./topk_mat_log', session=tf.keras.backend.get_session())
    return self

或者您可以使用model.fit功能，如果你喜欢的话。这样做会更容易，因为我们不需要关心创建批次。然而多次打电话model.fit可能会导致内存泄漏。您可以尝试一下并检查它的行为方式。[1] https://github.com/keras-team/keras/issues/13118

def fit_and_save_log(self, train_X, val_X, nb_epoch=50, batch_size=100, contractive=None):
    import tensorflow as tf
    optimizer = Adam(lr=0.0005)

    self.autoencoder.compile(optimizer=optimizer, loss='binary_crossentropy') # kld, binary_crossentropy, mse   
    
    save = tf.train.Checkpoint()
    save.listed = []
    
    for epoch in range(nb_epoch):
        self.autoencoder.fit(train_X[0], train_X[1],
                epochs=1,
                batch_size=batch_size,
                shuffle=True,
                validation_data=(val_X[0], val_X[1]))
        
        save.listed.append(self.encoded_instant.topk_mat)

        # you can compute validation results here 

    save_path = save.save('./topk_mat_log', session=tf.keras.backend.get_session())
    return self

然后你可以像这样恢复保存的变量

restore = tf.train.Checkpoint()
restore.restore(save_path)
restore.listed = []
v1 = tf.Variable(0.)
restore.listed.append(v1) # Now v1 corresponds with topk_mat in the first epoch

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 keras 中存储每个周期的操作结果（如 TOPK）的相关文章

Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用 matplotlib 绘制时间序列数据并仅在年初显示年份

rcParams date autoformatter month b n Y 我正在使用 matpltolib 来绘制时间序列如果我按上述方式设置 rcParams 则生成的图会在每个刻度处标记月份名称和年份我怎样才能将其设置为仅在每
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何从网页中嵌入的 Tableau 图表中抓取工具提示值

我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例我从要从中抓取的原始网页中获取了此网址 https covid19 colo
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
AWS EMR Spark Python 日志记录

我正在 AWS EMR 上运行一个非常简单的 Spark 作业但似乎无法从我的脚本中获取任何日志输出我尝试过打印到 stderr from pyspark import SparkContext import sys if name m
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
如何解释tf.map_fn的结果？

看代码 import tensorflow as tf import numpy as np elems tf ones 1 2 3 dtype tf int64 alternates tf map fn lambda x x x x el
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

如何使用 logit 函数编写 JAGS 二项式模型文件

我正在做一项作业使用 JAGS 对二项式分布进行建模p参数是另一个变量的函数d 这就是我正在尝试做的为两个参数 alpha beta 从后验生成 10000 个样本当 dist 25 进行 100 次尝试时根据后验预测成功次数生成样
如何使滑块离散？

如何在 Flutter 中使滑块离散如上图所示滑块离散 https i stack imgur com e2gp6 png Use the divisions的财产Slider https docs flutter io flutter
使用curl和php发送POST数据

Greets 因此我在 Amazon EC2 上运行 Fedora Core 8 我安装了 httpd php5 和 libcurl 以及一堆其他东西似乎工作得很好但后来我意识到 POST 数据不是由我的 php 脚本中的curl 发
get_data_yahoo(pandas_datareader) 中 1m 间隔的问题

I wrote from pandas datareader import data as pdr import yfinance as yf data pdr get data yahoo AAPL start 2020 04 12 en
(111)连接被拒绝 - Apache 反向代理和 Tomcat 8.5.51 - Docker Compose

这适用于 Tomcat8 5 50 但是使用 Tomcat8 5 51 Apache 无法通过 AJP 连接出现以下错误 Tue Mar 10 20 15 31 378937 2020 proxy error pid 42 tid 13
使用 Solver、EXCEL 时保存目标函数值

我在 Excel 中设置了一个优化问题当我优化使用 GUI 时我得到目标函数的最终最佳值我可以看到 Excel 计算了很多点的目标函数值并确定了最佳点有没有办法将所有目标函数值保存到 Excel 工作表中的某个范围如果我可以
我可以限制通过 JavaScript API 放入 S3 的对象的大小吗？

可以使用 JavaScript API 将对象上传到 S3 并且可以使用 IAM 策略进行细粒度授权例如请参阅此政策 Version 2012 10 17 Statement Action s3 PutObject s3 PutObje
当下游正在运行时阻止上游詹金斯作业

我知道构建阻止程序插件但似乎不起作用运行詹金斯 1 609 作业 A 触发作业 B 我将作业 A 配置为在作业 B 正在运行时阻止如果您触发 A 并且在 A 运行时再次触发 A 一旦第一个 A 完成它就会触发 B 然后您就会同时运行
仅允许特定 IP 地址访问 JSP 文件/文件夹

我使用 JSP 和 servlet 制作了一个 CMS 应用程序我没有使用任何类型的框架 CMS 有 2 个部分前端管理员后端如果我把它托管在www example com 例如那么我的所有前端站点都会向所有用户显示 But w
从具有相同列的两个表中选择数据

我有两个具有相同结构的表一种包含永久数据另一种是清除并定期重置的我需要对两个表使用相同的 select 语句就好像它们只是一张表一样这是我尝试过的选择从a b哪里 1 Where a and b具有相同的结构您可能正在考虑在
HtmlAgilityPack 可以处理 xsl 文件附带的 xml 文件来渲染 html 吗？

我想知道 HtmlAgilityPack 读取包含 xsl 文件的 xml 文件以呈现 html 的最佳方式 HtmlDocument 类上是否有任何设置可以帮助实现此目的或者我是否必须找到一种方法来执行转换然后再使用 HtmlAgil
如何删除或排除 Ansible 模板列表中的项目？

我正在编写一个 Ansible 模板需要生成主机组中的 IP 列表排除当前主机IP 我在网上和文档中进行了搜索但找不到任何允许您删除列表中项目的过滤器我在下面创建了 hacky for循环来执行此操作但想知道是否有人知道这样的过滤
time.time_ns() 在 macOS 上未正确返回纳秒？

从 Python 3 7 开始我们有了支持纳秒分辨率的新时间函数但是我不确定如何time time ns 应该可以工作看下面的例子 gt gt gt for n in range 10 time sleep random rando
防止安装具有特定包名的 Android 应用程序

我正在使用 android studio 开发两个 Android 应用程序出于某种原因我希望其中一个应用程序可以安装在设备上我想我应该检查第二个应用程序的包名称并阻止它安装有什么办法可以做到这一点吗谢谢您无法阻止任何应用程序的
分段色彩图的自定义色彩图边界

我有下图其中包含具有某些量化特征的多个向量的可用数据 import matplotlib pyplot as plt import numpy as np import matplotlib colors as colors fig pl
版本控制 SOAP 主体与整个服务？

尝试了解 SOAP 和 Web 服务的版本控制根据我的发现使用 URL 执行类似的操作似乎是可以接受的 www company com service 01 12 10 和 www company com service 03 08 1
'.' 之前应有 '='、','、';'、'asm' 或 '__attribute__'代币

Could not able to solve this I am implementing a queue After writing the complete code I had the error listed below expe
为什么 JBoss 5.1 中类路径默认为 WEB-INF/classes/ 而不是 WEB-INF/？

我有一段代码可以使用 spring 上下文 context new ClassPathXmlApplicationContext application context xml 该文件位于 WAR 的 WEB INF application
使用 Django Rest Framework 在 Pre_Save 中引发验证错误

我在使用 Django Rest 框架提出验证错误时遇到困难我有一个所有者字段所有者字段需要访问请求对象文档建议使用以下方法 http www django rest framework org tutorial 4 authenti
如何在 keras 中存储每个周期的操作结果（如 TOPK）

我在keras中编写了一个自定义层在这个自定义层的一部分中可以说我有一个像这样的矩阵 c tf cast tf nn top k tf nn top k n tf shape n 1 1 1 tf shape n 1 1 1 dtype

如何在 keras 中存储每个周期的操作结果（如 TOPK）

如何在 keras 中存储每个周期的操作结果（如 TOPK） 的相关文章

随机推荐

热门标签

如何在 keras 中存储每个周期的操作结果（如 TOPK）的相关文章