TensorFlow 和 Keras 的相同实现之间的不同行为

2024-01-06

我的机器上有 TensorFlow 1.9 和 Keras 2.0.8。当使用一些玩具数据训练神经网络时，TensorFlow 和 Keras 之间产生的训练曲线非常不同，我不明白为什么。

对于 Keras 实现，网络学习得很好，损失持续减少，而对于 TensorFlow 实现，网络没有学到任何东西，损失也没有减少。我试图确保两种实现都使用相同的超参数。为什么行为如此不同？

网络本身有两个输入：图像和向量。然后，在连接之前，它们会通过自己的层。

这是我的实现。

张量流：

# Create the placeholders
input1 = tf.placeholder("float", [None, 64, 64, 3])
input2 = tf.placeholder("float", [None, 4])
label = tf.placeholder("float", [None, 4])

# Build the TensorFlow network
# Input 1
x1 = tf.layers.conv2d(inputs=input1, filters=30, kernel_size=[5, 5], strides=(2, 2), padding='valid', activation=tf.nn.relu)
x1 = tf.layers.conv2d(inputs=x1, filters=30, kernel_size=[5, 5], strides=(2, 2), padding='valid', activation=tf.nn.relu)
x1 = tf.layers.flatten(x1)
x1 = tf.layers.dense(inputs=x1, units=30)
# Input 2
x2 = tf.layers.dense(inputs=input2, units=30, activation=tf.nn.relu)
# Output
x3 = tf.concat(values=[x1, x2], axis=1)
x3 = tf.layers.dense(inputs=x3, units=30)
prediction = tf.layers.dense(inputs=x3, units=4)

# Define the optimisation
loss = tf.reduce_mean(tf.square(label - prediction))
train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

# Train the model
sess = tf.Session()
sess.run(tf.global_variables_initializer())
training_feed = {input1: training_input1_data, input2: training_input2_data, label: training_label_data}
validation_feed = {input1: validation_input1_data, input2: validation_input2_data, label: validation_label_data}
for epoch_num in range(30):
    train_loss, _ = sess.run([loss, train_op], feed_dict=training_feed)
    val_loss = sess.run(loss, feed_dict=validation_feed)

Keras:

# Build the keras network
# Input 1
input1 = Input(shape=(64, 64, 3), name='input1')
x1 = Conv2D(filters=30, kernel_size=5, strides=(2, 2), padding='valid', activation='relu')(input1)
x1 = Conv2D(filters=30, kernel_size=5, strides=(2, 2), padding='valid', activation='relu')(x1)
x1 = Flatten()(x1)
x1 = Dense(units=30, activation='relu')(x1)
# Input 2
input2 = Input(shape=(4,), name='input2')
x2 = Dense(units=30, activation='relu')(input2)
# Output
x3 = keras.layers.concatenate([x1, x2])
x3 = Dense(units=30, activation='relu')(x3)
prediction = Dense(units=4, activation='linear', name='output')(x3)

# Define the optimisation
model = Model(inputs=[input1, input2], outputs=[prediction])
adam = optimizers.Adam(lr=0.001)
model.compile(optimizer=adam, loss='mse')

# Train the model
training_inputs = {'input1': training_input1_data, 'input2': training_input2_data}
training_labels = {'output': training_label_data}
validation_inputs = {'input1': validation_images, 'input2': validation_state_diffs}
validation_labels = {'output': validation_label_data}
callback = PlotCallback()
model.fit(x=training_inputs, y=training_labels, validation_data=(validation_inputs, validation_labels), batch_size=len(training_label_data[0]), epochs=30)

这是训练曲线（每次实现两次运行）。

张量流：

Keras:

在仔细检查您的实现后，我发现除了批量大小之外，所有超参数都匹配。我不同意@Ultraviolet 的答案，因为默认kernel_initializer of tf.layers.conv2d也是 Xavier（参见 TF 实现conv2d https://github.com/tensorflow/tensorflow/blob/r1.9/tensorflow/python/layers/convolutional.py#L323).

由于以下两个原因，学习曲线不匹配：

Keras 实现（版本 2）中的参数比 TF 实现（版本 1）中的参数接收到更多的更新。在版本 1 中，您在每个时期将完整数据集同时输入到网络中。这导致只有 30 个 adam 更新。相比之下，版本 2 的性能30 * ceil(len(training_label_data)/batch_size)亚当更新，与batch_size=4.
版本 2 的更新比版本 1 的更新噪音更大，因为梯度是在更少的样本上平均的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

TensorFlow 和 Keras 的相同实现之间的不同行为的相关文章

如何在 Python 中使用 .format() 打印“for”循环中的列表？

我是 Python 新手我正在编写一段非常简单的代码使用 for 循环打印列表的内容 format 我想要如下的输出但我收到此错误 names David Peter Michael John Bob for i in names p
如何关闭python服务器

使用此代码来运行 python 服务器 import os from http server import SimpleHTTPRequestHandler HTTPServer os chdir c users owner desktop
如何在 python 中使用 libSVM 计算精度、召回率和 F 分数

我想计算precision recall and f score using libsvm在Python中但我不知道如何我已经发现这个网站 http www csie ntu edu tw cjlin libsvmtools eval
使用 pygtk3 将 GUI 窗口添加到 python opencv2 程序

我已经使用Python和Opencv2完成了一个程序现在我想向我的程序添加一个 GUI 窗口我对 PyGtk3 有一些经验因此我修改了代码以采用 PyGtk3 但是我遇到了错误因此我尝试了一个简单的程序来找出实际的错误我的
类型错误：只有长度为 1 的数组可以转换为 Python 标量

我是 openCV 的初学者正在尝试分析数独求解器的现有代码有这一段代码会引发错误 samples np float32 np loadtxt feature vector pixels data responses np float3
Python3如何安装.ttf字体文件？

我想使用 python3 更精确的 Python 3 6 代码在 Windows 10 上安装 ttf 字体文件我用谷歌搜索但我发现的唯一的就是这个使用python在windows上安装TTF字体 https stackoverflow
使用 Twisted Python 的 UDP 客户端和服务器

我想创建一个服务器和客户端使用 Twisted 从网络发送和接收 UDP 数据包我已经用 Python 中的套接字编写了此代码但想利用 Twisted 的回调和线程功能然而我需要 Twisted 设计方面的帮助我想接收多种类型的
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
使用 shell=True 将 PATH 设置为 bitbake 的“source”在 Python 中没有效果

下面是shell脚本中的代码 source proj common tools repo etc profile d repo sh repo project init branch repo project sync source pok
PyCharm 输出错误消息散布在控制台输出中。如何解决这个问题？

我正在运行 PyCharm 社区版 4 0 4 有谁知道为什么控制台输出后不显示错误消息 Thanks C Python27 python exe F Google Drive code python scripts leetcode lc
使用 python 写入 aws lambda 中的 /tmp 目录

Goal 我正在尝试将 zip 文件写入 python aws lambda 中的 tmp 文件夹因此我可以在压缩之前提取操作并将其放入 s3 存储桶中 Problem 操作系统 Errno30 只读文件系统这段代码在我的计算机上进行
将多个 isinstance 检查转换为结构模式匹配

我想转换此现有代码以使用模式匹配 if isinstance x int pass elif isinstance x str x int x elif isinstance x float Decimal x round x else r
pip-tools 的干净设置不会编译非常基本的 pyproject.toml

使用全新的pip tools设置总是会导致Backend subprocess exited error pyproject toml project dependencies openpyxl gt 3 0 9 lt 4 在仅包含上述 p
python 中的异步编程

python 中有异步编程的通用概念吗我可以为一个函数分配一个回调执行它并立即返回主程序流无论该函数的执行需要多长时间吗您所描述的主程序流程在另一个函数执行时立即恢复不是通常所说的异步又名事件驱动编程而是多任务又名
Python：如何使用生成器来避免 sql 内存问题

我有以下方法来访问 mysql 数据库并且查询在服务器中执行我无权更改有关增加内存的任何内容我对生成器很陌生并开始阅读更多有关它的内容并认为我可以将其转换为使用生成器 def getUNames self globalUserQu
使用多行选项和编码选项读取 CSV

在 azure Databricks 中当我使用以下命令读取 CSV 文件时multiline true and encoding SJIS 似乎编码选项被忽略了如果我使用multiline选项 Spark 使用默认值encoding那
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
使用 Tweepy 获取推文时出错

我有一个用于获取推文的 Python 脚本在脚本中我使用该库 Tweepy 我使用有效的身份验证参数运行此脚本后一些推文存储在我的 MongoDB 中有些则被 if 语句拒绝但我仍然收到错误 requests packages u
Scrapy - 持续从数据库中获取要爬取的url

我想不断地从数据库中获取要爬行的网址到目前为止我成功地从基地获取了 url 但我希望我的蜘蛛继续从该基地读取因为该表将由另一个线程填充我有一个管道一旦爬行工作就会从表中删除 url 换句话说我想使用我的数据库作为队列我尝试
Pymongo 批量插入

我正在尝试批量插入文档但批量插入时不会插入超过 84 个文档给我这个错误 in insert pymongo errors InvalidOperation cannot do an empty bulk insert 是否可以批量插入

随机推荐

连接到上游时 NodeJS connect() 失败（111：连接被拒绝）

我今天遇到一个问题我的 Elastic Beanstalk 应用程序突然将我发送到502 Bad Gateway页现在我过去遇到过这个问题发生这种情况的原因是 Node 命令无法启动我的服务器我通过输入解决了这个问题Node com
MySQL，错误 126：表的密钥文件不正确

我阅读了以下相关问题但答复并不令我满意 MySQL 126 表的密钥文件不正确 https stackoverflow com q 2011050 570796 问题运行查询时出现此错误错误 126 HY000 表的密钥文件不正确问
设备在 google Nexus 手机中没有 com.google.android.gsf 包

我正在 Google Nexus 手机中测试我的应用程序但它在启动过程中强制关闭并出现异常设备没有包 com google android gsf 有任何提示吗我已在三星 Galaxy S3 和三星 Galaxy Y 手机中成功测试
将新 Pod 添加到现有项目时“无法发出预编译标头”

我有一个使用 Obj C 的项目因为我面临的问题是在将新的 pod 添加到项目中后无法发出预编译标头在项目中我正在使用桥接标头来处理 obj C 和 swift 在 Pod 文件中我添加了SendBird 我的 Pod 文件是 Po
多态性不适用于相同数据类型（基类和继承类）的函数返回值

据我所知要重写继承类中的虚函数该函数的返回值数据类型应与基类函数相同但是如果您返回的指针或值属于从原始函数的返回值的类继承的类则编译器将接受更改返回值如下所示 include
如何使用基于键的 linq 更改字典的值？

我有一本字典其类型为 Dictionary
如何在 ASP.NET Webform 中应用单元测试

我正在开发一个 3 层的 asp net webforms 网站 UI BLL 和 DAL 该网站已经开发出来但我喜欢对每种形式的单元测试有更多的控制在特定输入处传递特定值以供我查看应用程序是否存活我已经研究了 NUnit 但是在
在 rxjs 中实现 fromSubscriber

我今天遇到一个有趣的问题我正在开发一个可以上传文件的应用程序并且我们想要实现一个进度栏该应用程序是使用 React Redux Redux Observable 编写的我想调度上传进度的操作这是我为实现它所做的事情 withPro
Django：使用对象作为字典键是否合理？

在 django 中使用对象作为字典的键是否合理我已经这样做了并且有效但我想知道这是否是最佳实践或者是否会造成我现在无法预见的困难我正在开展一个涉及教育标准的项目我的字典的结构类似于 Subject Standards 主题的模型
使用 python 的 Firestore 身份验证电话和电子邮件 OTP

我正在尝试在 python 中添加代码以将 OTP 发送到电子邮件和电话进行验证但我找不到该代码我找到了使用 reCAPTCHA verifier 的 JavaScript 代码但没有找到 python 的代码他们有像 JavaSc
TFS 2010工作项尚未准备好保存，但没有验证项

我试图以编程方式保存 TFS 工作项但总是遇到异常 TF237124 Work Item is not ready to save 现在我明白这告诉我什么了工作项缺少必填字段或类似字段并且我的代码通过调用来预测这一点 ArrayLi
android：即时反映 UI 语言更改，无需重新加载/重新启动应用程序

我的应用程序中有一个设置允许用户选择不同的本地化语言即Chinese German etc 我想做的是一旦用户做出选择立即使用当前所选语言的字符串更新布局当然我希望将语言更改传播到所有当前活动而无需重新加载应用程序我发现了
导入错误：找不到 IProgress。尽管已安装，但请更新 jupyter 和 ipywidgets

我正在使用 jupyter 笔记本并安装 ipywidgets 7 4 2 widgetsnbextension pandas profiling 0 0 我也跑了 jupyter nbextension enable py widgets
如何使用 mongodb 在内部数组中搜索字符串？

如何在多维数组中搜索值例如我想搜索examplemongodb中以下数据中的关键字我曾经从命令获取所有数据 gt db info find id ObjectId 4f74737cc3a51043d26f4b90 id 12345 in
在flutter中使用Mockito模拟第3方库的静态方法的最佳方法是什么

我现在遵循的方法是围绕提供静态方法的类创建一个包装器然后模拟这个包装器而不是模拟真正的类如下所示 class TestClass final ThirdPartyClassWrapper thirdPartyClassWrapper T
如果语句包含 UNION、INTERSECT 或 EXCEPT 运算符（变体），则 ORDER BY 项必须出现在选择列表中

我已经阅读了我能找到的与此错误相关的所有问题但它们并没有完全描述这种情况在其他情况下人们正在做一些事情例如按顺序仅引用一个别名表从联合的一侧我理解为什么 SQLS 在我读过的所有其他问题中抱怨这个特定的错误我不明白为什么 SQ
列计数与第 1 行 JAVA mysql 的值计数不匹配[重复]

这个问题在这里已经有答案了我遇到了一个错误 java sql SQLException Column count doesn t match value count at row 1 at com mysql jdbc SQLError
将引导模式滚动到底部时启用按钮

我想强制用户阅读模式内的所有协议这个想法很简单如果他们不滚动到文本的最后一行该按钮仍然禁用但该按钮未启用这是我的代码 JavaScript agreement scroll function if this scrollTop t
暂时修复后恢复随机种子的最佳方法是什么？

这是取消种子随机数生成器的唯一方法吗 np random seed int time time 如果您希望在循环中重复某些代码例如测试而其他代码希望每个循环都是随机的那么在设置种子后如何将种子重置为随机数生成器下面的代码说明
TensorFlow 和 Keras 的相同实现之间的不同行为

我的机器上有 TensorFlow 1 9 和 Keras 2 0 8 当使用一些玩具数据训练神经网络时 TensorFlow 和 Keras 之间产生的训练曲线非常不同我不明白为什么对于 Keras 实现网络学习得很好损失持续减少

TensorFlow 和 Keras 的相同实现之间的不同行为

TensorFlow 和 Keras 的相同实现之间的不同行为 的相关文章

随机推荐

热门标签

TensorFlow 和 Keras 的相同实现之间的不同行为的相关文章