如何将具有像 ResNet 这样的非序列架构的 Keras 模型拆分为子模型？

2024-02-01

我的模型是 resnet-152，我想将其切成两个子模型，问题是第二个子模型，我不知道如何构建从中间层到输出的模型

我尝试了这段代码这个回应 https://stackoverflow.com/questions/52800025/keras-give-input-to-intermediate-layer-and-get-final-output/56140169#56140169它对我不起作用，这是我的代码：

def getLayerIndexByName(model, layername):
    for idx, layer in enumerate(model.layers):
        if layer.name == layername:
            return idx

idx = getLayerIndexByName(resnet, 'res3a_branch2a')

input_shape = resnet.layers[idx].get_input_shape_at(0) # which is here in my case (None, 55, 55, 256)

layer_input = Input(shape=input_shape[1:]) # as keras will add the batch shape

# create the new nodes for each layer in the path
x = layer_input
for layer in resnet.layers[idx:]:
    x = layer(x)

# create the model
new_model = Model(layer_input, x)

我收到此错误：

ValueError: Input 0 is incompatible with layer res3a_branch1: expected axis -1 of input shape to have value 256 but got shape (None, 28, 28, 512).

我也尝试过这个功能：

def split(model, start, end):
    confs = model.get_config()
    kept_layers = set()
    for i, l in enumerate(confs['layers']):
        if i == 0:
            confs['layers'][0]['config']['batch_input_shape'] = model.layers[start].input_shape
            if i != start:
                confs['layers'][0]['name'] += str(random.randint(0, 100000000)) # rename the input layer to avoid conflicts on merge
                confs['layers'][0]['config']['name'] = confs['layers'][0]['name']
        elif i < start or i > end:
            continue
        kept_layers.add(l['name'])
    # filter layers
    layers = [l for l in confs['layers'] if l['name'] in kept_layers]
    layers[1]['inbound_nodes'][0][0][0] = layers[0]['name']
    # set conf
    confs['layers'] = layers
    confs['input_layers'][0][0] = layers[0]['name']
    confs['output_layers'][0][0] = layers[-1]['name']
    # create new model
    submodel = Model.from_config(confs)
    for l in submodel.layers:
        orig_l = model.get_layer(l.name)
        if orig_l is not None:
            l.set_weights(orig_l.get_weights())
    return submodel

我收到此错误：

ValueError: Unknown layer: Scale

因为我的 resnet152 包含一个 Scale 层。

这是一个工作版本：

import resnet   # pip install resnet
from keras.models import Model
from keras.layers import Input

def getLayerIndexByName(model, layername):
    for idx, layer in enumerate(model.layers):
        if layer.name == layername:
            return idx


resnet = resnet.ResNet152(weights='imagenet')

idx = getLayerIndexByName(resnet, 'res3a_branch2a')

model1 = Model(inputs=resnet.input, outputs=resnet.get_layer('res3a_branch2a').output)

input_shape = resnet.layers[idx].get_input_shape_at(0) # get the input shape of desired layer
print(input_shape[1:])
layer_input = Input(shape=input_shape[1:]) # a new input tensor to be able to feed the desired layer

# create the new nodes for each layer in the path
x = layer_input
for layer in resnet.layers[idx:]:
    x = layer(x)

# create the model
model2 = Model(layer_input, x)

model2.summary()

这是错误：

ValueError: Input 0 is incompatible with layer res3a_branch1: expected axis -1 of input shape to have value 256 but got shape (None, 28, 28, 512)

正如我在评论部分提到的，由于 ResNet 模型没有线性架构（即它具有跳过连接，并且一个层可能连接到多个层），因此您不能简单地逐层浏览模型的层一个循环，并在循环中前一层的输出上应用一个层（即与具有线性架构的模型不同，这个方法有效 https://stackoverflow.com/a/52814386/2099607).

因此，您需要找到各层的连通性并遍历该连通性图，以便能够构建原始模型的子模型。目前，我想到了这个解决方案：

指定子模型的最后一层。
从该层开始，找到与其连接的所有层。
获取这些连接层的输出。
将最后一层应用于收集的输出。

显然，步骤#3意味着递归：为了获得连接层（即X）的输出，我们首先需要找到它们的连接层（即Y），获取它们的输出（即Y的输出），然后将它们应用到这些输出上（即在 Y 的输出上应用 X）。此外，要找到连接层，您需要了解一些 Keras 的内部结构，这已在这个答案 https://stackoverflow.com/a/53944525/2099607。所以我们提出了这个解决方案：

from keras.applications.resnet50 import ResNet50
from keras import models
from keras import layers

resnet = ResNet50()

# this is the split point, i.e. the starting layer in our sub-model
starting_layer_name = 'activation_46'

# create a new input layer for our sub-model we want to construct
new_input = layers.Input(batch_shape=resnet.get_layer(starting_layer_name).get_input_shape_at(0))

layer_outputs = {}
def get_output_of_layer(layer):
    # if we have already applied this layer on its input(s) tensors,
    # just return its already computed output
    if layer.name in layer_outputs:
        return layer_outputs[layer.name]

    # if this is the starting layer, then apply it on the input tensor
    if layer.name == starting_layer_name:
        out = layer(new_input)
        layer_outputs[layer.name] = out
        return out

    # find all the connected layers which this layer
    # consumes their output
    prev_layers = []
    for node in layer._inbound_nodes:
        prev_layers.extend(node.inbound_layers)

    # get the output of connected layers
    pl_outs = []
    for pl in prev_layers:
        pl_outs.extend([get_output_of_layer(pl)])

    # apply this layer on the collected outputs
    out = layer(pl_outs[0] if len(pl_outs) == 1 else pl_outs)
    layer_outputs[layer.name] = out
    return out

# note that we start from the last layer of our desired sub-model.
# this layer could be any layer of the original model as long as it is
# reachable from the starting layer
new_output = get_output_of_layer(resnet.layers[-1])

# create the sub-model
model = models.Model(new_input, new_output)

重要笔记：

该解决方案假设原始模型中的每个层仅使用一次，即它不适用于暹罗网络，其中一个层可以共享，因此可能在不同的输入张量上应用多次。
如果您想将模型正确分割为多个子模型，那么仅使用这些层作为分割点是有意义的（例如由starting_layer_name在上面的代码中），它们不在分支中（例如，在 ResNet 中，合并层之后的激活层是一个不错的选择，但是res3a_branch2a您选择的不是一个好的选择，因为它位于分支中）。为了更好地了解模型的原始架构，您始终可以使用以下命令绘制其图表plot_model()实用功能：
```
from keras.applications.resnet50 import ResNet50
from keras.utils import plot_model

resnet = ResNet50()
plot_model(model, to_file='resnet_model.png')
```
由于在构建子模型后会创建新节点，因此不要尝试构建另一个子模型有重叠的（即，如果它没有重叠，那就可以了！）与之前的子模型在上面代码的同一运行中;否则，您可能会遇到错误。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将具有像 ResNet 这样的非序列架构的 Keras 模型拆分为子模型？的相关文章

如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
更改自动插入 tkinter 小部件的文本颜色

我有一个文本框小部件其中插入了三条消息一条是开始消息一条是结束消息一条是在单位被摧毁时发出警报的消息我希望开始和结束消息是黑色的但被毁坏的消息参见我在代码中评论的位置插入小部件时颜色为红色我不太确定如何去做这件事我看
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
交换keras中的张量轴

我想将图像批次的张量轴从 batch size row col ch 交换为批次大小通道行列在 numpy 中这可以通过以下方式完成 X batch np moveaxis X batch 3 1 我该如何在 Keras 中做到
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
Python：元类属性有时会覆盖类属性？

下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

IIS 7 启用的协议

我有一台 win 2008r2 服务器默认网站已启用协议设置为 http net tcp 当在默认网站下创建任何新应用程序时我希望默认具有相同的启用协议有人可以建议如何做到这一点吗目前当我添加应用程序时会创建一个仅启用 http
在 python 中使用 opencv 更改图像中某个区域的颜色

我有一张图片我想将所有白色像素更改为灰色但仅限于图像的特定区域示例图片我只想更改红色矩形之外的图片而不更改红色矩形内的图像我已经有了通用代码这是其他人的 Stackoverflow 问题的一部分它改变每个白色像素的颜色而不
如何将 Span 添加到散景中的图例？

因此我创建了一个带有一些线条和一个跨度或多个跨度的图形 f figure f line x y1 legend label 1st set f line x y2 legend label 2st set vl Span locati
如何将文本文件导入打字稿？

作为一个最小的例子我想将一个文本文件导入打字稿并将其打印到控制台而不使用读取它fs 像这样的东西 import text from foo txt console log text 我发现了很多解决方案的例子例如this one htt
带有 JWT 和基本身份验证的 HttpListener：如何发送 WWW-Authenticate？（自托管）

我有一个在 mono NET 上跨平台运行的自托管 REST 应用程序一个问题是 HttpListener 管理并阻止 WWW Authenticate 标头的手动设置如果您将自己限制为内置的 Basic NTLM 等身份验证或者不需
findFragmentByTag - 在 FragmentTabHost 中查找片段 - 始终为 null

我无法获取指向 Fragment 的指针该 Fragment 是 FragmentTabhost 中当前可见的片段我有一个SherlockFragmentActivity called SecondActivity从它加载 Tabhos
使用 SAP 的分步教程。 VS 2008 的网络连接器 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我在互联网上找到了很多例子但很多都是旧的 VS 2003 SAP Net Connector 2 0
将 Dapper 与 BLOB 和 SQL Server CE 结合使用

当使用数据超过8000字节的BLOB时需要专门设置Parameter SqlDbType SqlDbType Image使其发挥作用正如这里所解释的 http connect microsoft com SQLServer feedba
KeyVault ARM 模板在重新部署时会覆盖机密

我有一个 ARM 模板它部署资源组并包含密钥保管库和机密这是通过 CI CD 部署的除了一个例外之外一切都运行良好如果我第一次部署模板一切都会按预期进行但是如果通过添加新值手动更改机密则下次部署模板时模板中的机密将覆盖手
错误：无法为使用 PEP 517 且无法直接安装的 Kivy 构建轮子

我一直在尝试在 Windows 10 机器上安装 kivy 但没有得到预期的输出相反我收到了一系列奇怪的错误消息首先我运行以下命令 python m pip install upgrade pip wheel setuptools p
Wagtail 根据登录用户的权限过滤页面子元素

我正在使用 Wagtail 开发一个小型网站该网站由一个主页和几个子页面组成到目前为止一切都非常简单但是根据用户不是管理员所在的组应该显示正确的子页面请参阅以下设置最小化以了解我在说什么如果我在 ToolKi
从 webpack-cli 获取错误：webpack 配置中的“TypeError: merge is not a function”

我正在使用 webpack merge 将两个 webpack config 文件合并在一起但我不断收到错误 TypeError 当我运行命令 webpack config config webpack config prod js 时
如何将表单提交到 Bootstrap Modal（将 POST 方法发送到 Modal）Laravel

我已经尝试了 2 天但仍然没有成功我想要将表单从index php提交到result php 当index php打开时在Modal中显示result php 没有关闭index php 这是示例代码索引 php
如何使用 MinGW 在 Linux 上构建 Crypto++ 库？

我正在尝试将 c 项目从 Visual Studio 2013 移植到 ubuntu 上的 netbeans 目标是一个Windows可执行文件到目前为止我能够使用mingw作为编译器从netbeans编译Windows exe文件该项
在android热敏打印机中打印阿拉伯字符

打印机为GoojPRT便携式打印机PT 210 热敏打印机相同的代码在另一台热敏打印机 POS 上有效但在这台打印机上不适用于阿拉伯字符英文字符很好但阿拉伯字符显示为中文字符尝试添加编码为字符集 UTF 8 并且不适用于阿拉伯字符
如何使用 C++ 中的构造函数初始化 2d 向量？

我知道如何像这样初始化一维向量 int myints 16 2 77 29 std vector
Mysql，SUM 列和 GROUP BY HOUR

情况简化 tableA id date val 0 2018 02 19 00 01 00 10 1 2018 02 19 00 02 00 10 2 2018 02 19 00 03 00 10 2018 02 19 23 59 00
如何使用 Cef4Delphi 从 JavaScript 调用 Delphi 函数

我是德尔福的初学者目前使用Delphi Berlin 版本我正在尝试从 JavaScript 调用 Delphi 函数方法例如我想在单击带有附加数据属性的 html 按钮时打开一个新的 Delphi 表单 HTML代码
如何禁用选项卡栏中的特定选项卡才能单击？

有没有办法禁用选项卡栏中的特定选项卡这样除非再次启用否则无法单击它感谢任何帮助谢谢编辑吸收忽略指针的代码不起作用 class MyTabbedPage extends StatefulWidget const MyTabbed
如何将具有像 ResNet 这样的非序列架构的 Keras 模型拆分为子模型？

我的模型是 resnet 152 我想将其切成两个子模型问题是第二个子模型我不知道如何构建从中间层到输出的模型我尝试了这段代码这个回应 https stackoverflow com questions 52800025 keras

如何将具有像 ResNet 这样的非序列架构的 Keras 模型拆分为子模型？

如何将具有像 ResNet 这样的非序列架构的 Keras 模型拆分为子模型？ 的相关文章

随机推荐

热门标签

如何将具有像 ResNet 这样的非序列架构的 Keras 模型拆分为子模型？的相关文章