如果可以激活多个输出，那么 softmax 层的替代是什么？

2023-12-19

例如，我有 CNN，它尝试从 MNIST 数据集（使用 Keras 编写的代码）中预测数字。它有 10 个输出，形成 softmax 层。只有一个输出可以为真（对于从 0 到 9 的每一位数字都是独立的）：

Real: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
Predicted: [0.02, 0.9, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01]

由于 softmax 的定义，预测的总和等于 1.0。

假设我有一个任务，需要对一些可以分为几个类别的对象进行分类：

Real: [0, 1, 0, 1, 0, 1, 0, 0, 0, 1]

所以我需要以其他方式正常化。我需要一个在 [0, 1] 范围内给出值并且总和可以大于 1 的函数。

我需要这样的东西：

Predicted: [0.1, 0.9, 0.05, 0.9, 0.01, 0.8, 0.1, 0.01, 0.2, 0.9]

每个数字都是对象属于给定类别的概率。之后，我可以使用像 0.5 这样的阈值来区分给定对象所属的类别。

出现以下问题：

那么哪个激活函数可以用于此目的呢？
这个函数可能已经存在于 Keras 中了吗？
也许您可以提出其他方法来预测这种情况？

您的问题是多标签分类之一，在 Keras 的上下文中对此进行了讨论，例如，此处：https://github.com/fchollet/keras/issues/741 https://github.com/fchollet/keras/issues/741

简而言之，keras 中建议的解决方案是将 softmax 层替换为 sigmoid 层，并使用 binary_crossentropy 作为成本函数。

该线程的一个例子：

# Build a classifier optimized for maximizing f1_score (uses class_weights)

clf = Sequential()

clf.add(Dropout(0.3))
clf.add(Dense(xt.shape[1], 1600, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(1600, 1200, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(1200, 800, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(800, yt.shape[1], activation='sigmoid'))

clf.compile(optimizer=Adam(), loss='binary_crossentropy')

clf.fit(xt, yt, batch_size=64, nb_epoch=300, validation_data=(xs, ys), class_weight=W, verbose=0)

preds = clf.predict(xs)

preds[preds>=0.5] = 1
preds[preds<0.5] = 0

print f1_score(ys, preds, average='macro')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras

convneuralnetwork

MNIST

Softmax

如果可以激活多个输出，那么 softmax 层的替代是什么？的相关文章

卷积神经网络 (CNN) 输入形状

我是 CNN 的新手我有一个关于 CNN 的问题我对 CNN 特别是 Keras 的输入形状有点困惑我的数据是不同时隙的二维数据比方说10X10 因此我有 3D 数据我将把这些数据输入到我的模型中来预测即将到来的时间段所以我
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
按相似度对矩阵进行排序

我有 100 个矩阵其中每一行对应一个个体列对应站点我想通过相似性度量对行进行排序以便最相似的个体在矩阵中彼此相邻我使用 k 近邻按行对矩阵进行排序并将这些排序的矩阵提供给卷积神经网络我想知道是否还有其他措施可以完成手头的任务
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
model.predict() 返回类而不是概率

Hello 我是第一次使用 Keras 我训练并保存了一个模型作为 json 文件及其权重该模型旨在将图像分为 3 个类别我的编译方法 model compile loss categorical crossentropy optim
优化 Keras 以使用所有可用的 CPU 资源

好吧我真的不知道我在说什么所以请耐心听我说我正在使用 Theano 后端运行 Keras 以在 MNIST 图像上运行基本的神经网络目前只是一个教程过去我一直使用我的旧 HP 笔记本电脑因为我有 Windows 和 Ubunt
ValueError：在 R 中使用 keras 模型时在用户代码中

我正在尝试使用 R 在 R 中运行一维 CNNkeras包裹我正在使用以下代码 library MASS library keras Create some data data Boston data lt Boston create a
打印出网络架构中每一层的形状

在 Keras 中我们可以如下定义网络有什么办法可以输出每层之后的形状例如我想打印出以下形状inputs在定义行之后inputs 然后打印出形状conv1在定义行之后conv1 etc inputs Input 1 img rows
如何使用分布式 Dask 和预先训练的 Keras 模型进行模型预测？

我正在加载预训练的 keras 模型然后尝试使用 dask 并行化大量输入数据不幸的是我遇到了一些与我如何创建 dask 数组有关的问题任何指导将不胜感激 Setup 首先我从这个仓库克隆https github com sanch
如何在Keras模型中替换（或插入）中间层？

我有一个训练有素的 Keras 模型我想要 1 用相同但没有偏差的Con2D层替换Con2D层 2 在第一次激活之前添加 BatchNormalization 层我怎样才能做到这一点 def keras simple model fro
了解最大池层之后的全连接层的尺寸[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案在下图架构中 4096 个单元的全连接密集层是如何从最后一个最大池层右侧维度导出的256x13x13 而不是 4096 不应该
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
如何使用 Keras 中的 Conv2D 在 5D 张量的最后三个维度上应用卷积？

通常的输入张量Conv2DKeras 中是一个 4D 张量其维度为batch size n n channel size 现在我有一个 5D 张量其尺寸为batch size N n n channel size我想对中的每个 i 应用
Tensorboard 和 Dropout 层

我有一个非常基本的查询我制作了 4 个几乎相同差异在于输入形状的 CNN 并在连接到全连接层的前馈网络时合并了它们几乎相同的 CNN 的代码 model3 Sequential model3 add Convolution2D 32
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
使用 Keras 时，验证集中未见的类别会出现错误

我有由数值变量和分类变量组成的数据分类变量有很多类别因此我使用嵌入来表示这些类别我的模型是一个简单的神经网络我知道当你定义嵌入层时你需要通过input dim number of categories 1为了解释训练中看不见的类别
如何创建 MNIST 数据集之类的文件

所以我有一堆图像 PNG 它们的名称可以用作标签有没有一种工具或示例说明我如何拍摄这些图像并创建像 MNIST IDX 这样的数据集有很多关于如何阅读它们的示例但没有关于如何创建它们的示例任何帮助将不胜感激这会有所帮助 image
conv1D 中形状的尺寸

我尝试过构建一个只有一层的 CNN 但遇到了一些问题事实上编译器告诉我 ValueError 检查模型输入时出错预期的 conv1d 1 input 具有 3 个维度但得到形状为 569 30 的数组这是代码 import num
交换keras中的张量轴

我想将图像批次的张量轴从 batch size row col ch 交换为批次大小通道行列在 numpy 中这可以通过以下方式完成 X batch np moveaxis X batch 3 1 我该如何在 Keras 中做到

随机推荐

如何在 C++ CLR 中将 array 转换为 char*？

在我的项目中我将一个 byte 从 C 传递到 C CLR 函数 C CLR 代码 void TestByteArray array
从元胞数组中获取字符串作为 matlab 工作区中变量的名称

我的实验中有大量 csv 文件 200 多个之前我一直在单独读取它们对于数据处理的后续步骤来说这是一项乏味的工作 co 15 csvread CO 15K csv 5 0 co 25 csvread CO 25K csv 5 0 co
如何将 Node.js 模块与 Next.js 一起使用？

我需要将express与next js一起使用吗我尝试将此代码添加到 next js 应用程序中来自 npm 模块示例代码 pdf2json let fs require fs var PDFParser require pdf2jso
必须打开哪些端口才能与 Firebase 数据库通信（而不是 FCM 消息传递）？

我用 C 编写了一个 Windows 服务它连接到 Firebase 数据库并存储数据对于连接和数据库通信我使用名为 FirebaseAuthentification net 和 FirebaseDatabase net 的 NuGe
ant fileset dir 排除某些目录

关于这个主题有很多问题但没有一个答案能解决我的问题再次启动该线程以获得新的输入我尝试了两种不同的方法来排除 B dir 及其在 A dir subdir 下的所有内容但没有一个有效仅供参考 a dir 位于 dir src 下 1
将垂直滚动破解为水平滚动[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我知道这违反了书中的每条可用性规则
寻找一种从辅助函数调用 Perl XS C API 函数/宏的方法

我一直在尝试 Perl XS C API 但遇到了障碍我在下面简化了我的示例假设现有结构 MyObject 然后访问属性 a 或 b 并为其中之一创建哈希我可以使用以下代码 typedef struct const char prop
如何向 UITableViewCell 分隔线添加阴影？

我有一个像这样的 UITableView 我想为每个单元格的分隔线添加阴影结果应如下所示我试过这个 In cellForRowAtIndexPath 方法我添加了这段代码 cell layer shadowOpacity 1 0 ce
如何在 Ruby 脚本中运行 Rake 任务？

我有一个Rakefile我通常会从命令行调用 Rake 任务 rake blog post Title 我想编写一个 Ruby 脚本来多次调用该 Rake 任务但我看到的唯一解决方案是使用反引号或system 这样做的正确方法是什么
如何使用numpy在python中计算RMSPE

我正在使用以下方法进行多元预测罗斯曼数据集 https www kaggle com c rossmann store sales description我现在需要使用 RMSPE 指标来评估我的模型我看到了相关的公式here https
我们如何对数据框进行排名？

我有示例数据框如下 i p accountNumber assetValue A100 1000 A100 500 B100 600 B100 200 o p AccountNumber assetValue Rank A100 1000
Divs 与 Tables 的另一个问题：表单

元注我正在浏览问题页面真的厌倦了 DIVS vs Tables 何时使用表 vs DIVS Divs 比 Tables 更好 Tables vs CSS 以及所有提出的问题同样的事情天哪人们但我想看看人们处理为什么你应该放弃并使用
如何更改Python中现有第三方库中的函数

这是向我提出的面试问题如果没有意义请不要惩罚我她问我在 python 中有一个现有的第 3 方库其中有一个函数 foo 在导入现有模块后如何修改该函数这称为猴子修补简而言之您可以直接分配给保存该函数的变量 import ex
Windows 7 PowerShell 在每个字符之间插入 ^@ - 如何防止？

希望对您来说回答这个问题很简单我在Win7上有gvim和vim 任何时候我将命令结果重定向到文件并使用 Vim 或 Gvim 相同效果打开它我都会在每个字符之间插入二进制 0 符号所以而不是 r96130 I have r 9
`add_route'：无效的路由名称，已在使用中：'root'（ArgumentError）

我使用 Rails 4 1 1 和 ruby 2 1 1 并且我遇到了设计问题即我的路线我之前已经使用过很多次了 devise for users get pages index Route to Devise Login Page d
防止服务器端脚本、XSS

是否有任何预制脚本可用于 PHP MySQL 来防止服务器端脚本和 JS 注入我知道一些典型的函数例如 htmlentities 特殊字符字符串替换等但是是否有一些简单的代码或函数可以万无一失任何想法都会很棒非常感谢 EDIT
将单个数字转换为单个数字Python [重复]

这个问题在这里已经有答案了我想将一个数字例如 43365644 转换为单个数字 4 3 3 4 4 并将其附加到列表中如果您满足以下条件这可以很容易地完成 Use str http docs python org 2 7 libra
itext 5 是否有可能在段落末尾证明剩余空间被脚本填充？

我正在 android studio 上制作一个应用程序并使用 itext pdf 5 我希望每次完成一个段落时缺少的空间都会填充脚本即第1段 text text text text end 第2段 text text text te
Bootstrap 4使用行和列类的正确方法[重复]

这个问题在这里已经有答案了 In my div我想要放置的元素two rows The 第一排包含两个input出于这个原因我可以将这两个输入元素放入两个单独的列中但在我的第二排只有一个按钮元素我不能放置两个单独的列这是我现在的代码
如果可以激活多个输出，那么 softmax 层的替代是什么？

例如我有 CNN 它尝试从 MNIST 数据集使用 Keras 编写的代码中预测数字它有 10 个输出形成 softmax 层只有一个输出可以为真对于从 0 到 9 的每一位数字都是独立的 Real 0 1 0 0 0 0 0

如果可以激活多个输出，那么 softmax 层的替代是什么？

如果可以激活多个输出，那么 softmax 层的替代是什么？ 的相关文章

随机推荐

热门标签

如果可以激活多个输出，那么 softmax 层的替代是什么？的相关文章