如何在张量流中使用带有估计器的衰减学习率？

2024-05-26

我正在尝试将 LinearClassifier 与具有衰减学习率的 GradientDescentOptimizer 一起使用。

My code:

def main():
# load data
    features = np.load('data/feature_data.npz')
    tx = features['arr_0']
    y = features['arr_1']

## Prepare logistic regression
    n_point, n_feat = tx.shape

# Input functions
    def get_input_fn_from_numpy(tx, y, num_epochs=None, shuffle=True):
    # Preprocess data
        return tf.estimator.inputs.numpy_input_fn(
        x={"x":tx},
        y=y,
        num_epochs=num_epochs,
        shuffle=shuffle,
        batch_size=128
        )

    cols_label = "x"
    feature_cols = [tf.contrib.layers.real_valued_column(cols_label)]

    my_input_fn_train = get_input_fn_from_numpy(tx, y)

    model_dir = 'data/tmp/' + datetime.datetime.now().strftime("%m-%d_%H:%M:%S")
    global_step = tf.Variable(0, trainable=False)
    learning_rate=tf.train.exponential_decay(0.001*np.ones((20,1), dtype=np.float32), global_step, 10000, 0.95, staircase=False)
    regressor = tf.contrib.learn.LinearClassifier(feature_columns=feature_cols,
                                              model_dir=model_dir,
                                                  optimizer=tf.train.GradientDescentOptimizer(learning_rate=learning_rate))

    regressor.fit(input_fn=get_input_fn_from_numpy(tx_train, y_train), steps=100000)
    results = regressor.evaluate(input_fn=my_input_fn_test)

我收到错误：

  File "training.py", line 71, in <module>
main()
  File "training.py", line 63, in main
regressor.fit(input_fn=get_input_fn_from_numpy(tx_train, y_train), steps=100000)
  File "/lib/python3.6/site-packages/tensorflow/python/util/deprecation.py", line 296, in new_func
return func(*args, **kwargs)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/estimator.py", line 458, in fit
loss = self._train_model(input_fn=input_fn, hooks=hooks)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/estimator.py", line 958, in _train_model
model_fn_ops = self._get_train_ops(features, labels)
 File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/estimator.py", line 1165, in _get_train_ops
return self._call_model_fn(features, labels, model_fn_lib.ModeKeys.TRAIN)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/estimator.py", line 1136, in _call_model_fn
model_fn_results = self._model_fn(features, labels, **kwargs)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/linear.py", line 186, in _linear_model_fn
logits=logits)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/head.py", line 854, in create_model_fn_ops
enable_centered_bias=self._enable_centered_bias)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/head.py", line 649, in _create_model_fn_ops
batch_size, loss_fn, weight_tensor)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/head.py", line 1911, in _train_op
train_op = train_op_fn(loss)
  File "/lib/python3.6/site-packages/tensorflow/contrib/learn/python/learn/estimators/linear.py", line 179, in _train_op_fn
zip(grads, my_vars), global_step=global_step))
  File "/lib/python3.6/site-packages/tensorflow/python/training/optimizer.py", line 456, in apply_gradients
update_ops.append(processor.update_op(self, grad))
  File "/lib/python3.6/site-packages/tensorflow/python/training/optimizer.py", line 97, in update_op
return optimizer._apply_dense(g, self._v)  # pylint: disable=protected-access
  File "/lib/python3.6/site-packages/tensorflow/python/training/gradient_descent.py", line 50, in _apply_dense
use_locking=self._use_locking).op
  File "/lib/python3.6/site-packages/tensorflow/python/training/gen_training_ops.py", line 370, in apply_gradient_descent
name=name)
  File "/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py", line 330, in apply_op
g = ops._get_graph_from_inputs(_Flatten(keywords.values()))
  File "/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 4262, in _get_graph_from_inputs
_assert_same_graph(original_graph_element, graph_element)
  File "/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 4201, in _assert_same_graph
"%s must be from the same graph as %s." % (item, original_item))
ValueError: Tensor("ExponentialDecay:0", shape=(20, 1), dtype=float32) must be from the same graph as Tensor("linear/x/weight/part_0:0", shape=(20, 1), dtype=float32_ref).

我使用的是张量流1.3。如果我用一个常数（比如 0.01）替换学习率，它就会起作用。我过去曾将衰减学习率与最小化操作结合使用，但试图在 LinearClassifier 中使用它。我发现有些东西似乎不一致，因为我没有将全局步骤链接到拟合步骤，但我想知道这是如何工作的。我想我可以按照建议使用占位符here https://stackoverflow.com/questions/33919948/how-to-set-adaptive-learning-rate-for-gradientdescentoptimizer但我不明白为什么如果不需要的话我应该自己编写更新规则。

关于如何解决这个问题有什么建议吗？

您是否尝试过获得global_step通过致电tf.train.get_global_step()？这应该返回global_step由你使用LinearClassifier model.

代替

global_step = tf.Variable(0, trainable=False)

use

global_step = tf.train.get_global_step()

这对我有用，用我自己的Estimator类，我使用的地方tf.train.MomentumOptimizer以尽量减少tf.nn.sparse_softmax_cross_entropy_with_logits.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

如何在张量流中使用带有估计器的衰减学习率？的相关文章

如何在 keras 模型中使用张量流度量函数？

使用Python 3 5 2张量流RC 1 1 我正在尝试在 keras 中使用张量流度量函数所需的功能接口似乎是相同的但调用 import pandas import numpy import tensorflow contrib k
“Dense”对象没有属性“op”[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试使用tensorflow keras制作一个完全连接的模型这是我的代码 from tensorflow keras m
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
使用 Mac M1 在 Docker 容器内的 pip 安装中找不到 Tensorflow

我正在尝试使用新的 Mac M1 运行一些项目这些项目已经在英特尔处理器上运行并被使用英特尔的其他开发人员使用我无法构建这个简单的 Dockerfile FROM python 3 9 RUN python m pip install
Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
调用 tf.linalg.inv 时，TensorFlow 崩溃并显示无法创建 cuSolverDN 实例

我正在运行tensorflow tensoflow latest gpu码头集装箱我可以运行简单的向量运算例如矩阵乘法没有问题但是当我运行以下最小示例时 import tensorflow as tf tf linalg inv
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
跨多个 GPU/机器的 TF-Slim 的配置/标志

我很好奇是否有关于如何使用部署 model deploy py 在多台机器上的多个 GPU 上运行 TF Slim models slim 的示例该文档非常好但我缺少一些内容具体来说需要为worker device和ps devic
Keras：加载多个模型并在不同线程中进行预测

我正在使用带有张量流核心的 Keras 我想在构造函数中加载 2 个不同的模型然后在不同的线程中进行预测根据请求我尝试在张量流图上下文中加载这些模型但它不起作用我的代码 from keras models import load
如何在nodejs（tensorflow.js）中训练模型？

我想做一个图像分类器但我不会python Tensorflow js 使用我熟悉的 javascript 可以用它来训练模型吗训练步骤是什么坦白说我不知道从哪里开始我唯一想到的是如何加载 mobilenet 它显然是一组预先训练的
支持 Nvidia CUDA 工具包 9.2

Tensorflow gpu 绑定到 Nvidia CUDA Toolkit 的特定版本的原因是什么当前版本似乎专门寻找 9 0 并且不适用于任何更高版本例如我安装了最新的 Toolkit 9 2 并将其添加到路径中但 Tensor
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
在 Tensorflow 对象检测 API 中将图像裁剪到边界框

如何将图像裁剪到 Tensorflow 中的边界框我正在使用Python API 从文档来看 tf image crop to bounding box image offset height offset width target he
使用 Keras 时，验证集中未见的类别会出现错误

我有由数值变量和分类变量组成的数据分类变量有很多类别因此我使用嵌入来表示这些类别我的模型是一个简单的神经网络我知道当你定义嵌入层时你需要通过input dim number of categories 1为了解释训练中看不见的类别
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
使用 tf.keras.Models.Sequential 构建的架构是否比使用 Tensorflow 的功能 API 构建的架构运行得更慢、更准确？

我只是比较了 2 个我认为等效的 VGG ish 架构一个是使用构建的tf keras Models Sequential 另一个用了Tensorflow 的函数式 API 每个人都试图解决cats vs dogs 数据集经过 10
从字符串列表创建 TfRecords 并在解码后在张量流中提供图形

目的是创建 TfRecords 数据库给定我有 23 个文件夹每个文件夹包含 7500 个图像以及 23 个文本文件每个文件有 7500 行描述单独文件夹中 7500 个图像的特征我通过以下代码创建了数据库 import ten
如何将两个 keras 模型连接成一个模型？

假设我有一个 ResNet50 模型我希望将该模型的输出层连接到 VGG 模型的输入层这是 ResNet 模型和 ResNet50 的输出张量 img shape 164 164 3 resnet50 model ResNet50 in
有没有办法在bigquery中使用kmeans、tensorflow保存的模型？

我知道这有点愚蠢因为 BigQueryML 现在为 Kmeans 提供了良好的初始化尽管如此我还是需要在张量流中训练一个模型然后将其传递给 BigQuery 进行预测我保存了模型一切正常直到我尝试将其上传到 bigquery

随机推荐

从 PYCHARM 运行时使 PYTEST 更安静

更新下面显示的消息不受 pytest 各种 q 安静选项控制它们来自 TeamCity 插件请参阅下面我的回答原文我已经阅读了用于沉默 pytest 的现有堆栈溢出答案但没有人告诉我如何沉默我收到的大量冗余测试通过消息我有
如何在 Mongoose 中定义排序函数

我正在开发一个小型 NodeJS Web 应用程序使用 Mongoose 访问我的 MongoDB 数据库我的收藏的简化架构如下 var MySchema mongoose Schema content type String loca
ASP.Net 将 401 错误代码转换为 302 错误代码

我有一个自定义处理程序在某些情况下我想向用户代理表明他们未获得授权 Http 错误代码 401 if IsAuthorized context context Response StatusCode 401 context Respon
使用表达式树构造 LINQ GroupBy 查询

我已经在这个问题上坚持了一个星期了但没有找到解决方案我有一个像下面这样的 POCO public class Journal public int Id get set public string AuthorName get set
PHP/PDO 和 SQL Server 连接以及 i18n 问题

在我们的网络应用程序中我们使用 PHP5 2 6 PDO 连接到 SQL Server 2005 数据库并存储俄语文本数据库排序规则是Cyrillic General CI AS 表排序规则是Cyrillic General CI AS
VB6 ActiveX exe - 正确的注册顺序是什么？

我最近更新了一个 Visual Basic 6 应用程序它是一个 ActiveX exe 在 Windows XP 上运行我有几个此应用程序的测试人员他们已收到 exe 的副本并正在尝试运行它但是他们收到一条错误消息 Unexpe
从 Redux 状态删除一个项目

我想知道如果可能的话你是否能帮我解决这个问题我正在尝试从 Redux 状态中删除一个项目我已经传入了用户点击的项目的IDaction data进入减速机我想知道如何匹配action data使用 Redux 状态中的 ID 之一然后
从 UIScrollView 中删除所有子视图？

如何从 UIScrollview 中删除所有子视图 Let scrollView是一个实例UIScrollView 在 Objective C 中这非常简单只需致电makeObjectsPerformSelector 像这样 Objec
SQL Server 2005 中的计数(*) 与计数(Id)

我使用 SQLCOUNT函数获取表中的总数或行数以下两种说法有什么区别吗 SELECT COUNT FROM Table and SELECT COUNT TableId FROM Table 另外在性能和执行时间方面有什么区别吗 Th
设置 MySQL 触发器

我听说过有关触发器的事情我有几个问题什么是触发器我该如何设置它们除了典型的 SQL 内容之外是否还应该采取任何预防措施触发器允许您在发生某些事件例如插入表时在数据库中执行某个功能我无法具体评论mysql 注意事项触发器
在字符串数组中查找下一个可用日期

我一直在尝试找出如何根据当前日期获取下一个可用日期即如果今天是星期五则在数组中搜索下一个最近的日期例如数组值为 1 星期一 2 星期二 4 星期四 6 星期六那么我的第二天应该是星期六这是我尝试过的 Here i ll get
RecyclerView 上的删除按钮删除了错误的项目

我正在使用 Firestore 适配器RecyclerView我在使用删除按钮时遇到问题当我按下它时它会删除错误的项目而不是我想要的项目这是我的按钮内部的代码onBindViewHolder protected void onB
了解单目标迷宫的 A* 启发式

我有一个像下面这样的迷宫 P
传说在北卡罗来纳州地理地图上消失？

我正在使用 R 编程语言使用北卡罗来纳州的内置地图我生成了 3 个随机变量收入孩子数量体重然后为此数据创建了地图使用传单库通过循环 library sf library mapview library leaflet l
jQuery Mobile 1.4.0：动态更改页面的标题和标题

动态更改 jQuery Mobile 1 4 0 页面的标题 data role header 和 title 的正确方法是什么添加方法有很多种toolbars 页眉页脚动态此外 jQuery Mobile 1 4 提供intern
检测堆栈已满

在编写 C 代码时我了解到使用堆栈来存储内存是一个好主意但最近我遇到了一个问题我有一个实验其代码如下所示 void fun const unsigned int N float data 1 N N float data 2 N N
python：将base64编码的png图像转换为jpg

我想使用 python 将一些 base64 编码的 png 图像转换为 jpg 我知道如何从 Base64 解码回原始 import base64 pngraw base64 decodestring png b64text 但现在我怎样
土耳其语字符显示不正确[重复]

这个问题在这里已经有答案了 MySql 数据库使用 utf 8 编码数据存储正确我使用 set name utf8 查询来确保调用的数据是 utf 8 编码只要标头字符集是 utf 8 数据库中的所有变量都可以正常工作但静态html
无需发送消息即可获取 GCM 规范注册 ID

我在使用 GCM 的应用程序时遇到问题情况如下该应用程序已安装应用程序调用 GCM 注册方法获取注册 ID RID 1 该应用程序已卸载再次安装该应用程序应用程序再次调用 GCM 注册方法获取注册 ID RID 2 在第 5 步
如何在张量流中使用带有估计器的衰减学习率？

我正在尝试将 LinearClassifier 与具有衰减学习率的 GradientDescentOptimizer 一起使用 My code def main load data features np load data feature

如何在张量流中使用带有估计器的衰减学习率？

如何在张量流中使用带有估计器的衰减学习率？ 的相关文章

随机推荐

热门标签

如何在张量流中使用带有估计器的衰减学习率？的相关文章