恢复 Tensorflow 中新模型子集的变量？

2024-01-18

我正在做一个通过 Tensorflow 增强（4 层 DNN 到 5 层 DNN）的示例。我在 TF 中使用保存会话和恢复来制作它，因为 TF 教程中有一个简短的段落： '例如，你可能已经训练了一个 4 层的神经网络，现在想要训练一个 5 层的新模型，将之前训练模型的 4 层的参数恢复到新模型的前 4 层。 '，tensorflow tute 的启发之处https://www.tensorflow.org/how_tos/variables/ https://www.tensorflow.org/how_tos/variables/.

然而，我发现没有人询问当检查点保存 4 层参数时如何使用“恢复”，但我们需要将其放入 5 层，从而引发危险信号。

我用真实的代码做了这个

with tf.name_scope('fcl1'):
    hidden_1 = fully_connected_layer(inputs, train_data.inputs.shape[1], num_hidden)            
with tf.name_scope('fcl2'):
    hidden_2 = fully_connected_layer(hidden_1, num_hidden, num_hidden)                
with tf.name_scope('fclf'):
    hidden_final = fully_connected_layer(hidden_2, num_hidden, num_hidden)    
with tf.name_scope('outputl'):
    outputs = fully_connected_layer(hidden_final, num_hidden, train_data.num_classes, tf.identity)
    outputs = tf.nn.softmax(outputs)
with tf.name_scope('boosting'):
    boosts = fully_connected_layer(outputs, train_data.num_classes, train_data.num_classes, tf.identity)

其中变量在“fcl1”内部（或从“fcl1”调用） - 这样我就可以使用“fcl1/Variable”和“fcl1/Variable_1”来表示权重和偏差 -“fcl2”、“fclf”和“outputl”由 saver.save 存储() 在没有“Boosting”层的脚本中。但是，由于我们现在有“增强”层，所以 saver.restore(sess, "saved_models/model_list.ckpt") 不起作用

NotFoundError: Key boosting/Variable_1 not found in checkpoint

我真的希望听到这个问题。谢谢。下面的代码是我遇到麻烦的代码的主要部分。

def fully_connected_layer(inputs, input_dim, output_dim, nonlinearity=tf.nn.relu):
    weights = tf.Variable(
        tf.truncated_normal(
            [input_dim, output_dim], stddev=2. / (input_dim + output_dim)**0.5), 
        'weights')
    biases = tf.Variable(tf.zeros([output_dim]), 'biases')
    outputs = nonlinearity(tf.matmul(inputs, weights) + biases)    

    return outputs

inputs = tf.placeholder(tf.float32, [None, train_data.inputs.shape[1]], 'inputs')
targets = tf.placeholder(tf.float32, [None, train_data.num_classes], 'targets')

with tf.name_scope('fcl1'):
    hidden_1 = fully_connected_layer(inputs, train_data.inputs.shape[1], num_hidden)            
with tf.name_scope('fcl2'):
    hidden_2 = fully_connected_layer(hidden_1, num_hidden, num_hidden)                
with tf.name_scope('fclf'):
    hidden_final = fully_connected_layer(hidden_2, num_hidden, num_hidden)    
with tf.name_scope('outputl'):
    outputs = fully_connected_layer(hidden_final, num_hidden, train_data.num_classes, tf.identity)

with tf.name_scope('error'):    
    error = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(outputs, targets))
with tf.name_scope('accuracy'):
    accuracy = tf.reduce_mean(tf.cast(
        tf.equal(tf.argmax(outputs, 1), tf.argmax(targets, 1)), 
        tf.float32))
with tf.name_scope('train'):
    train_step = tf.train.AdamOptimizer().minimize(error)

init = tf.global_variables_initializer()  
saver = tf.train.Saver()

with tf.Session() as sess:
    sess.run(init)
    saver.restore(sess, "saved_models/model.ckpt")
    print("Model restored")

    print("Optimization Starts!")
    for e in range(training_epochs):
        ...

   #Save model - save session        
    save_path = saver.save(sess, "saved_models/model.ckpt")
    ### I once saved the variables using var_list, but didn't work as well...
    print("Model saved in file: %s" % save_path)

为了清楚起见，检查点文件有

fcl1/Variable:0

fcl1/Variable_1:0

fcl2/Variable:0

fcl2/Variable_1:0

fclf/Variable:0

fclf/Variable_1:0

outputl/Variable:0

outputl/Variable_1:0

由于原始 4 层模型没有“Boosting”层。

在这种情况下，从检查点读取提升值看起来不正确，我认为这不是您想要做的。显然，您遇到了错误，因为在恢复变量时，您首先捕获模型中所有变量的列表，然后在检查点中查找相应的变量，而检查点中没有这些变量。

您可以通过定义模型变量的子集来仅恢复模型的一部分。例如，您可以使用 tf.slim 库来做到这一点。获取模型中的变量列表：

variables = slim.get_variables_to_restore()

现在，变量是张量列表，但对于每个元素，您都可以访问其名称属性。使用它，您可以指定您只想恢复除增强之外的层，例如：

variables_to_restore = [v for v in variables if v.name.split('/')[0]!='boosting'] 
model_path = 'your/model/path'

saver = tf.train.Saver(variables_to_restore)

with tf.Session() as sess:
    saver.restore(sess, model_path)

这样你的 4 层就恢复了。理论上，您可以尝试通过创建另一台服务器来尝试从检查点捕获其中一个变量的值，该服务器仅在变量列表中进行增强并从检查点重命名所选变量，但我真的不认为这是您在这里需要的。

由于这是模型的自定义层，并且您在任何地方都没有此变量，因此只需在工作流程中初始化它，而不是尝试导入它。例如，您可以通过在调用函数 full_connected 时传递此参数来执行此操作：

weights_initializer = slim.variance_scaling_initializer()

不过，您需要自己检查详细信息，因为我不确定您的导入是什么以及您在这里使用哪个函数。

一般来说，我建议您看一下 slim 库，这将使您更容易定义层的模型和范围（而不是通过 with 定义它，您可以在调用函数时传递范围参数）。它看起来像 slim：

boost = slim.fully_connected(input, number_of_outputs, activation_fn=None, scope='boosting', weights_initializer=slim.variance_scaling_initializer())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

恢复 Tensorflow 中新模型子集的变量？的相关文章

使用 openCV 对图像中的子图像进行通用检测

免责声明我是计算机视觉菜鸟我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子我的用例有点不同因为我不希望它是具体的而且我不确定如何做到这一点如果可能的话但我感觉应该如此我有大量图像数据集有时其中一些图像是数据集的
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

ActiveRecord：返回对象时隐藏列

是否有一种开箱即用的方法可以在返回 ActiveRecord 对象时始终隐藏删除列例如 User password 使用内置序列化您可以覆盖as json模型上的方法来传递其他默认选项 class User lt ActiveReco
如何在 Robolectric 中测试选项菜单项的可见性？

我想断言菜单项的可见性但是我的菜单项总是返回 true 我正在使用以下代码来扩充我的菜单 SherlockMenuInflater inflater new SherlockMenuInflater activity MenuBuild
simplecursoradapter textview 给出 nullpointerException

我有两个 xml 文件一个是列表视图另一个是列表视图和一些 texview 的布局我想更改第二个 xml 文件中文本视图的颜色这就是我到目前为止所做的 main1 xml
Laravel Eloquent `take` 和 `orderBy`

当我尝试使用每个 take 和 orderBy 查询时模型返回一些记录 this gt hasMany App User gt take 3 this gt hasMany App User gt orderBy id desc 但是当我
如何在CSS中制作具有透明度的径向渐变

我想在透明度变化的地方制作一个径向渐变我可以让它线性工作但不是径向工作 background webkit gradient linear left top left bottom from rgba 50 50 50 0 8 to r
具有高多边形网格的 OpenGL 3D 光线拾取

如何在包含高多边形网格的模型的 3D 场景中实现 3D 光线拾取迭代所有三角形来执行三角形线相交测试需要花费太多时间我知道存在八叉树等方法并且应该可以将这些方法用于场景中的模型但我不知道应该如何在网格级别使用这些概念但是如果您在
GWT - 如何编译移动排列

我知道如何使用延迟绑定为不同的用户代理编译 GWT 应用程序但这似乎没有提供区分桌面移动浏览器的方法除了制作基于 gwt mobile webkit 的新应用程序之外如何将现有的 GWT 应用程序转换为具有重新设计的移动界面如果您
如何使maven-compiler-plugin不隐藏错误源位置

也许有一个maven compiler plugin这个选项但我还没有找到 When javac直接运行并打印错误在消息的第一行之后它显示受影响的源行下一行上有一个插入符号指向错误位置它看起来像这样 com invariantpro
确保泛型类型在 Typescript 中仅具有原始属性

我有一个采用泛型类型的函数我需要确保该类型是 JSON 可序列化的也称为仅原始属性我的尝试是为 JSON 兼容类型定义一个接口并强制我的泛型扩展此类型 type JSONPrimitive string number boolean
如何通过按键终止 while 循环？

我正在读取串行数据并使用 while 循环写入 csv 文件我希望用户一旦觉得已经收集了足够的数据就能够终止 while 循环 while True do a bunch of serial stuff if the user press
swift 中 DispatchQueue 类型之间的区别

据我了解 Swift 中有 3 种类型的 DispatchQueue 主要连续剧主线全球并发后台线程并行工作自定义并发或串行每一个都可能有效异步或同步第一个问题主队列是否在工作仅 UI 线程并且不在另一个线程上工作如
为什么反应路由器在 vercel 上不起作用？

我正在尝试将无服务器网络发布到 vercel 我想使用react router 这在我的计算机上运行良好但是当我部署它时它不起作用有人可以帮助我吗我想在没有服务器的情况下完成 My main code import React fro
ServiceLocator 是一种反模式吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案最近我读过马克西曼的文章 http blog ploeh dk 2010 02 03 ServiceLocatorisanAnti Patte
如何在 Android 上设置 ImageView 的背景颜色？

我尝试了一些方法但没有任何效果我试图更改 Android 上 ImageView 上的背景颜色但没有任何反应这是我的 xml
CSS3“提升角”不透明度阴影

我一直在玩一些 CSS3 阴影效果我非常喜欢升角效果但在尝试向元素添加不透明度时遇到了问题我的问题是有没有办法在不透明的元素上创建升角效果 http jsfiddle net WAvZu http jsfiddle net
为什么我的 Android 应用程序在类开头使用 findViewById(R.id.******) 初始化变量时会崩溃并出现 NullPointerException？

此代码带有注释的顶部块成功运行 public class MainActivity extends AppCompatActivity EditText username EditText findViewById R id editT
多列索引还需要单列索引吗？

我陷入了一个设计不佳的系统中现在我正在他们的数据库上做DBA 我有很多像下面这样的情况伪代码 Table t1 c1 c2 c3 c4 key c1 key c2 key c1 c2 key c1 c2 c3 单列索引真的有必要吗因为
如何获取 Objective C（Foundation 框架）中命令行工具的可执行路径？

我正在尝试找出一种方法来识别 Objective C 中命令行工具的可执行路径因此如果可执行文件是 Applications Utils MyTool 则该方法将返回 Applications Utils 我正在使用基础框架称我为纯粹
Codeigniter 会话安全

如何提高会话的安全性 this gt session gt userdata userid 我一直在为我的 ajax 调用而抛弃这个小坏男孩有些情况我没有然后我就想使用 DOM 中的 id 真的安全吗如果 DOM 被更改以破解用户帐
恢复 Tensorflow 中新模型子集的变量？

我正在做一个通过 Tensorflow 增强 4 层 DNN 到 5 层 DNN 的示例我在 TF 中使用保存会话和恢复来制作它因为 TF 教程中有一个简短的段落例如你可能已经训练了一个 4 层的神经网络现在想要训练一个 5 层的

恢复 Tensorflow 中新模型子集的变量？

恢复 Tensorflow 中新模型子集的变量？ 的相关文章

随机推荐

热门标签

恢复 Tensorflow 中新模型子集的变量？的相关文章