如何比较不同 Keras 模型的权重？

2023-11-24

我已经以 .h5 格式保存了许多模型。我想比较他们的特征，例如重量。我不知道如何以表格和数字的形式适当地比较它们。提前致谢。

体重内省是一项相当高级的工作，需要针对特定模型的处理。可视化权重在很大程度上是一项技术挑战，但如何处理这些信息则是另一回事 - 我将主要讨论前者，但会涉及后者。

Update: 我也推荐See RNN用于权重、梯度和激活可视化。

可视化权重：一种方法如下：

检索感兴趣层的权重。Ex: model.layers[1].get_weights()
了解权重角色和维度。Ex：LSTM 有三组权重：kernel, recurrent, and bias，每个都有不同的目的。Within每个权重矩阵是gate权重 - 输入、单元格、忘记、输出。对于 Conv 层，区别在于过滤器 (dim0)、内核和步幅之间。
根据 (2) 以有意义的方式组织权重矩阵以进行可视化。Ex：对于 Conv 来说，与 LSTM 不同，特定特征的处理并不是真正必要的，我们可以简单地展平核权重和偏差权重，并在直方图中将它们可视化
选择可视化方法：直方图、热图、散点图等 - 对于扁平化数据，直方图是最佳选择

解释重量: 一些方法是：

Sparsity：如果权重范数（“平均”）较低，则模型是稀疏的。可能有好处，也可能没有好处。
Health：如果太多权重为零或接近于零，则表明有太多死亡神经元；这对于调试很有用，因为一旦某个层处于这种状态，它通常不会恢复 - 因此应该重新开始训练
稳定：如果权重变化很大且很快，或者有很多高值权重，则可能表明梯度性能受损，可以通过例如梯度裁剪或权重约束

型号对比：没有一种方法可以简单地并排查看来自不同模型的两个权重并决定“这是更好的一个”；分别分析每个模型，例如如上所述，然后决定哪个模型的优点大于缺点。

然而，最终的决胜局将是验证性能- 而且这也是更实用的一种。它是这样的：

训练多个超参数配置的模型
选择具有最佳验证性能的一个
微调该模型（例如通过进一步的超参数配置）

权重可视化应该主要作为一种调试或记录工具 - 简而言之，即使我们目前对神经网络有最好的理解，也无法仅通过查看权重来判断模型的泛化效果如何。

建议：也可视化层outputs - see 这个答案和底部的示例输出。

视觉示例:

from tensorflow.keras.layers import Input, Conv2D, Dense, Flatten
from tensorflow.keras.models import Model

ipt = Input(shape=(16, 16, 16))
x   = Conv2D(12, 8, 1)(ipt)
x   = Flatten()(x)
out = Dense(16)(x)

model = Model(ipt, out)
model.compile('adam', 'mse')

X = np.random.randn(10, 16, 16, 16)  # toy data
Y = np.random.randn(10, 16)  # toy labels
for _ in range(10):
    model.train_on_batch(X, Y)

def get_weights_print_stats(layer):
    W = layer.get_weights()
    print(len(W))
    for w in W:
        print(w.shape)
    return W

def hist_weights(weights, bins=500):
    for weight in weights:
        plt.hist(np.ndarray.flatten(weight), bins=bins)

W = get_weights_print_stats(model.layers[1])
# 2
# (8, 8, 16, 12)
# (12,)

hist_weights(W)

Conv1D 输出可视化: (source)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

如何比较不同 Keras 模型的权重？的相关文章

将字符串转换为带有毫秒和时区的日期时间 - Python

我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
DreamPie 不适用于 Python 3.2

我最喜欢的 Python shell 是DreamPie http dreampie sourceforge net 我想将它与 Python 3 2 一起使用我使用了添加解释器 DreamPie 应用程序并添加了 Python 3 2
如何打印没有类型的defaultdict变量？

在下面的代码中 from collections import defaultdict confusion proba dict defaultdict float for i in xrange 10 confusion proba di
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
需要 TensorFlow 依赖项。如何在 Windows 上运行 TensorFlow

我有兴趣让 TensorFlow 在 Windows 上运行但目前我意识到这是不可能的因为某些依赖项无法在 Windows 上使用例如巴泽尔之所以出现这种需求是因为据我目前了解从 TensorFlow 访问 GPU 的唯一方法是
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
如何将 PIL 图像转换为 NumPy 数组？

如何转换 PILImage来回转换为 NumPy 数组这样我就可以比 PIL 进行更快的像素级转换PixelAccess允许我可以通过以下方式将其转换为 NumPy 数组 pic Image open foo jpg pix numpy
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

HttpContext.Current.User！= HttpContext.User？

Is HttpContext Current User在全局 asax 中不一样HttpContext User在行动方法中我为用户分配了一些角色但他们似乎迷失了下面的代码显示了正在发生的情况当用户登录时两个断言都会被命中首先是
在组件编辑器中获取字段的_当前_值？（Tridion 2011 SP1）

我正在编写保存命令的扩展基本上我想验证某些字段并显示一个弹出窗口允许编辑器根据当前日期发布号和一些其他属性选择给定的关键字或其他值我以为我取得了很好的进步直到我最终发现 display getItem 返回存储在 CM 中的项
如何获取传递给函数的变量的名称？

让我用下面的例子来解释我的问题 public string ExampleFunction string Variable return something string WhatIsMyName Hello World string He
从 Jupyter 笔记本中删除空行

有没有一种简单的方法可以从 IPython 笔记本中删除空行我在网络开发中养成了留空行的习惯而且我的手指往往会自动按回车键这使得 IPython 笔记本变得更少因为占用了我的 14 英寸屏幕的太多空间并且在大多数情况下并不更具可读
仅当参数不是常量时，math.h 中的 sqrt 才会导致链接器错误“未定义对 sqrt 的引用”

我创建了一个小程序如下 include
android 以编程方式清除日志

我想在按下按钮来分析我们应用程序的某些部分计算一些内容后获取整个日志 Log d 我可以通过以下代码来做到这一点 HashMap
Google 容器引擎中的自动缩放

据我了解容器引擎目前处于 alpha 阶段尚未完成从文档中我假设 Pod 还没有自动缩放例如取决于 CPU 负载对吗我希望能够配置一个复制控制器以便在平均 CPU 负载达到定义的阈值时自动添加 Pod 和 VM 实例这是近
如何避免 ViewModel 中的命令混乱？

我正在构建一个使用相当多命令的应用程序它们使我的视图模型变得混乱 MVVM 对我来说是新的如果这个问题有点愚蠢我很抱歉有没有办法减少混乱例如在这里您可以看到杂乱的一部分 private void InitializeComman
获取推送通知的设备令牌

我正在研究推送通知我编写了以下代码来获取设备令牌 BOOL application UIApplication application didFinishLaunchingWithOptions NSDictionary launchOp
WebGL：尽管使用相同的代码，一切都很模糊

刚开始使用 WebGL 尝试绘制一些基本线条甚至不是多边形我找到了一些例子将它们复制粘贴到本地并在 Firefox 中运行它们它们看起来不错锐利清晰的边缘然后我创建自己的项目重构糟糕示例代码使用 RequireJS
HighCharts通过ajax加载数据

在过去的几天里我在使用 Highcharts 库填充来自 api 的一些示例 json 数据中的 ajax 时遇到了问题我尝试在我的ajax回调中使用chart series 0 data json和类似的东西但没有任何效果我的 j
getCompatedStyle 给出“透明”而不是实际的背景颜色

这是一个惊喜以下代码似乎没有给我屏幕上的实际颜色 h1 document querySelector h1 window getComputedStyle h1 color Gives rgb 0 0 0 我认为这是正确的然而 wind
如何在实体框架6中调用存储过程（代码优先）？

我对 Entity Framework 6 非常陌生我想在我的项目中实现存储过程我有一个存储过程如下 ALTER PROCEDURE dbo insert department Name varchar 100 AS BEGIN INS
git 如何确保相同操作/数据的提交 SHA 密钥仍然是唯一的？

如果我创建一个文件foo with touch foo然后运行shasum foo它会打印出来 da39a3ee5e6b4b0d3255bfef95601890afd80709 无论我跑多少次shasum foo或者如果我在另一台计算机上运
如何在java中的控制台输出中打印带下划线的字符串[重复]

这个问题在这里已经有答案了我想知道是否有任何方法可以使用 java String 类在控制台上打印带下划线的文本您只能依赖控制台如何解释字符串例如在bash 您可以执行一些操作例如在转义序列之间插入字符串 033 1m and 0
使用 FXML 将标签文本包装在 VBox 中

我正在编写一个 JavaFX 应用程序我想创建一个包含 2 段长文本的屏幕我事先不知道文本是什么它会在运行时由一些代码填充为此我想制作一个带有 2 个标签的 VBox 我假设如果不添加尺寸标签将跨越垂直框由于文字很长我想换行
如何按 MySQL 中日期时间字段的小时部分过滤查询？

我需要从表中选择行例如无论日期如何时间 gt 18 00 00 问题是该值是日期时间类型因此旁边还有日期例如2012 01 25 18 00 00 table1 row 1 id 1 datetime 2012 01 25 18 0
如何使用 JUnit4 以编程方式执行测试套件？

我正在尝试使用 API 调用 JUnit 测试套件我知道您可以使用以下方法来设置测试类 RunWith Suite class Suite SuiteClasses Test1 class Test2 class 但是有没有办法使用 J
cordova windows 错误：找不到“cordova/windows8/commandProxy”

我构建了一个基于 Cordova 的 Windows 应用程序一旦我添加任何插件应用程序就会开始崩溃但出现异常cordova windows8 commandProxy not found 科尔多瓦版本 4 3 0 看起来cordov
如何比较不同 Keras 模型的权重？

我已经以 h5 格式保存了许多模型我想比较他们的特征例如重量我不知道如何以表格和数字的形式适当地比较它们提前致谢体重内省是一项相当高级的工作需要针对特定模型的处理可视化权重在很大程度上是一项技术挑战但如何处理这些信息则是另

如何比较不同 Keras 模型的权重？

如何比较不同 Keras 模型的权重？ 的相关文章

随机推荐

热门标签

如何比较不同 Keras 模型的权重？的相关文章