非常基本的神经网络不学习

2023-12-19

我已经阅读了一些 CNTK Python 教程，并且正在尝试编写一个非常基本的单层神经网络，可以计算逻辑 AND。我有正常运行的代码，但网络没有学习 - 事实上，随着每个小批量训练，损失变得越来越严重。

import numpy as np
from cntk import Trainer
from cntk.learner import sgd
from cntk import ops
from cntk.utils import get_train_eval_criterion, get_train_loss

input_dimensions = 2
# Define the training set
input_data = np.array([
    [0, 0], 
    [0, 1],
    [1, 0],
    [1, 1]], dtype=np.float32)

# Each index matches with an index in input data
correct_answers = np.array([[0], [0], [0], [1]])

# Create the input layer
net_input = ops.input_variable(2, np.float32)
weights = ops.parameter(shape=(2, 1))
bias = ops.parameter(shape=(1))

network_output = ops.times(net_input, weights) + bias

# Set up training
expected_output = ops.input_variable((1), np.float32)
loss_function = ops.cross_entropy_with_softmax(network_output, expected_output)
eval_error = ops.classification_error(network_output, expected_output)

learner = sgd(network_output.parameters, lr=0.02)
trainer = Trainer(network_output, loss_function, eval_error, [learner])

minibatch_size = 4
num_samples_to_train = 1000
num_minibatches_to_train = int(num_samples_to_train/minibatch_size)
training_progress_output_freq = 20

def print_training_progress(trainer, mb, frequency, verbose=1):
    training_loss, eval_error = "NA", "NA"

    if mb % frequency == 0:
        training_loss = get_train_loss(trainer)
        eval_error = get_train_eval_criterion(trainer)
        if verbose:
            print("Minibatch: {0}, Loss: {1:.4f}, Error: {2:.2f}".format(
            mb, training_loss, eval_error))

    return mb, training_loss, eval_error


for i in range(0, num_minibatches_to_train):
    trainer.train_minibatch({net_input: input_data, expected_output: correct_answers})
    batchsize, loss, error = print_training_progress(trainer, i, training_progress_output_freq, verbose=1)

训练输出样本

Minibatch: 0, Loss: -164.9998, Error: 0.75
Minibatch: 20, Loss: -166.0998, Error: 0.75
Minibatch: 40, Loss: -167.1997, Error: 0.75
Minibatch: 60, Loss: -168.2997, Error: 0.75
Minibatch: 80, Loss: -169.3997, Error: 0.75
Minibatch: 100, Loss: -170.4996, Error: 0.75
Minibatch: 120, Loss: -171.5996, Error: 0.75
Minibatch: 140, Loss: -172.6996, Error: 0.75
Minibatch: 160, Loss: -173.7995, Error: 0.75
Minibatch: 180, Loss: -174.8995, Error: 0.75
Minibatch: 200, Loss: -175.9995, Error: 0.75
Minibatch: 220, Loss: -177.0994, Error: 0.75
Minibatch: 240, Loss: -178.1993, Error: 0.75

我不太确定这里发生了什么。误差停留在 0.75，我认为这意味着网络的性能与偶然情况相同。我不确定我是否误解了 ANN 架构的要求，或者我是否误用了该库。

任何帮助，将不胜感激。

您正在尝试使用 softmax 作为最后一层来解决二元分类问题。 softmax 层在这里不是正确的层，它仅对多类（类 >= 3）问题有效。

对于二元分类问题，您应该进行以下两项修改：

在你的输出中添加一个 sigmoid 层（这会让你的输出看起来像一个概率）
Use 二进制交叉熵 https://www.cntk.ai/pythondocs/cntk.ops.html#cntk.ops.binary_cross_entropy作为您的标准（您必须至少这个版本 https://github.com/Microsoft/CNTK/releases/tag/v2.0.beta3.0)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

neuralnetwork

cntk

非常基本的神经网络不学习的相关文章

使用 openCV 对图像中的子图像进行通用检测

免责声明我是计算机视觉菜鸟我看过很多关于如何在较大图像中查找特定子图像的堆栈溢出帖子我的用例有点不同因为我不希望它是具体的而且我不确定如何做到这一点如果可能的话但我感觉应该如此我有大量图像数据集有时其中一些图像是数据集的
如何使用固定的 pandas 数据框进行动态 matplotlib 绘图？

我有一个名为的数据框benchmark returns and strategy returns 两者具有相同的时间跨度我想找到一种方法以漂亮的动画风格绘制数据点以便它显示逐渐加载的所有点我知道有一个matplotlib animat
如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
当玩家触摸屏幕一侧时，如何让 pygame 发出警告？

我使用 pygame 创建了一个游戏当玩家触摸屏幕一侧时我想让 pygame 给出类似你不能触摸屏幕两侧的错误我尝试在互联网上搜索但没有找到任何好的结果我想过在屏幕外添加一个方块当玩家触摸该方块时它会发出警告但这花了很长
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar

随机推荐

postgresql 无法将 INSERT 查询作为游标打开

我正在尝试生成动态查询以将动态选择的结果插入表中我的代码如下 CREATE OR REPLACE FUNCTION public report get result datekey integer RETURNS setof public
在 JSON 模式中使用对象属性键作为枚举

我正在尝试使用 JSON 架构验证 JSON 文件以便找到损坏的引用的情况本质上我的文件由项目和组组成每个项目都属于 groups 属性键引用的单个组如下所示 items banana name Banana group fr
尝试将构建上传到 iTunes Connect 时出错

这篇文章涉及一个快速变化的事件我在尝试将构建上传到 iTunes Connect 时遇到错误这是我第一次看到这个错误我无法解决它我尝试遵循其他帖子的建议但事实证明这并不成功我尝试在 Xcode 中删除并重新添加我的帐户让客户端
如何递归删除目录？

RemoveDirectory https learn microsoft com en us windows win32 api fileapi nf fileapi removedirectorya仅删除空目录如何删除其中包含文件的目
PLSQL生成随机整数

在 Oracle Sql Developer 11g 中如何生成随机整数并将其分配给变量这是我到目前为止所尝试过的 S TB SELECT dbms random value 1 10 num FROM dual 使用这段代码我得到了错
我可以使用 RVM 为所有用户维护单一版本的 Ruby 吗？

我喜欢RVM 我意识到它的主要用例是让不同的用户在不同版本的 Ruby 之间切换但假设我正在将 Rails 应用程序部署到服务器并且我只想运行单个版本的 Ruby 我特别想要 1 9 2 使用 RVM 安装它很轻松但不使用它就很痛苦
laravel 非法偏移类型错误

我有一个页面显示单个测试用例的详细信息由于某种原因我无法克服这个错误甚至无法发送 id 这是我的控制器 public function show id data DB table TestCase gt where TestCaseI
IE10 websocketallowInsecureFromHttps

我正在尝试实现一个 websocket 实现跨浏览器工作在某些时候我们将迁移到 wss 即加密的 websockets 但现在都是 ws 当我们从 https 提供重定向到 ws 主机的页面时我们会看到以下内容铬还可以如果将al
if 检查中的方法调用是否已“测试”然后“恢复”？

我突然忘记了 if checks 中的方法调用是如何工作的 Example if list next instanceof AClass AClass thing list next 还是在这个例子中如果next 迭代到列表中的下一个对象
在动画集中运行多个动画时出现问题

我正在尝试多次实现包含多个动画平移旋转和 Alpha 的动画集这意味着动画完成并到达某个点后它将使用不同的动画参数再次运行我通过使用参数完成了这个setStartOffset 为了在动画中计时但是我遇到了一个问题动画不是从其
有代码风格强制执行者吗？

我与许多其他程序员一起使用 PHP 编写的网站有时我必须处理非常糟糕的代码缩进完全混乱花括号放在错误的位置糟糕的空白使用这真的伤害了我的眼睛实际上让我的工作更加困难并且花费了更长的时间是否有一个工具可以让您指定编码风格然后将
Spring Test DBUnit 和表模式名称

使用时是否可以设置表模式名称 DatabaseSetupSpring Test DBUnit 的注释目前我正在这样使用它 DatabaseSetup user data xml public class UserMapperTest us
Swift iOS -UIImagePicker 的照片库在模拟器上显示，但在运行 Xcode 时在实际设备上崩溃（不会显示）

我使用的是 Swift 3 iOS 10 3 和 Xcode 8 3 3 当我访问模拟器上的照片库时 UIImagePicker 没有出现任何问题我可以选择照片一旦我尝试访问实际设备 iPhone 7 上的照片库应用程序就会崩溃因为
为什么 PHP 不打印 0 值？

我一直在制作华氏温度到摄氏度反之亦然计算器所有这些都工作得很好但是当我尝试计算 32 华氏度到摄氏度时它应该是 0 但却什么也不显示我不明白为什么它不会回显 0 值这是一些代码
计算复杂 numpy ndarray 的 abs()**2 的最节省内存的方法

我正在寻找最节省内存的方法来计算复杂 numpy ndarray 的绝对平方值 arr np empty 250000 150 dtype complex128 common size 我还没有找到一个 ufunc 可以完全做到这一点np
Android L - SwipeRefreshLayout 配色方案的材质设计

我开始在我的最新项目中实施 Material 主题为新 L 版本的发布做好准备我一直在阅读材料设计指南并发现了这一点 UI色彩应用选择你的调色板通过选择三种色调来限制您对颜色的选择辅助调色板中的主要颜色和一种强调颜色口音颜色可
如何在 IE Windows Mobile 5 中向

非常基本的神经网络不学习

训练输出样本

非常基本的神经网络不学习 的相关文章

随机推荐

非常基本的神经网络不学习的相关文章