使用 mxnet 的简单梯度下降

2024-01-04

我正在尝试使用 MXNet 的梯度下降优化器来最小化函数。 Tensorflow 中的等效示例是：

import tensorflow as tf

x = tf.Variable(2, name='x', dtype=tf.float32)
log_x = tf.log(x)
log_x_squared = tf.square(log_x)

optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(log_x_squared)

init = tf.initialize_all_variables()

def optimize():
  with tf.Session() as session:
    session.run(init)
    print("starting at", "x:", session.run(x), "log(x)^2:", session.run(log_x_squared))
    for step in range(10):  
      session.run(train)
      print("step", step, "x:", session.run(x), "log(x)^2:", session.run(log_x_squared))

我不知道如何在 MXNet 中完成同样的任务。优化器 API文档 http://mxnet.io/api/python/optimization.html#the-mxnet-optimizer-package似乎没有等效的方法。这是我到目前为止所尝试过的。主要的困惑在于传递训练数据的需要：

import mxnet as mx

x = mx.sym.Variable('data')
log_x = mx.sym.log(x)
log_x_squared = mx.sym.square(log_x)

mod = mx.mod.Module(log_x_squared)  # Create a module where the loss function
                                    # is the one we want to optimize
mod.bind(data_shapes=[('data', (1,1))])  # ?? not sure if this is correct - we
                                         # are saying our input is a scalar
mod.init_params()
mod.init_optimizer()  # SGD is default

mod.fit()  # ?? must pass data_iter to fit

似乎是x变量应该以某种方式反馈为data_iter但我不知道如何做到这一点。

Update:谢谢凯文泰森 https://stackoverflow.com/a/44810723/3363678感谢他们的出色回答！这是一个构建在单个隐藏层神经网络之上的工作最小化例程：

import mxnet as mx
import numpy as np


def minimize(objective_function,
             initial_params,
             max_iters=1000,
             optimizer='sgd',
             optimizer_params=(('learning_rate', 0.1),),
             tol=1e-8):

    class InitialParam(mx.init.Initializer):

        def __init__(self, vals):
            super(InitialParam, self).__init__()
            self._vals = vals

        def _init_weight(self, _, arr):
            arr[:] = self._vals.asnumpy()[:, np.newaxis]


    x = mx.sym.Variable('data')
    params_len = initial_params.shape[0]
    fc = mx.sym.FullyConnected(data=x, name='fc1',
                               num_hidden=params_len,
                               no_bias=True)

    # Passing the FullyConnected layer into the objective function
    # is difficult to manipulate. If the fully connected layer represents
    # [x, y] for optimizing a 2 dimensional function f(x, y) it is easier
    # to work with x, and y. So we split the fully connected layer into a
    # number of symbols for each parameter:
    param_syms = []
    for i in range(params_len):
        ps = mx.sym.slice(fc, begin=(0, i), end=(1, i + 1))
        param_syms.append(ps)

    # The loss function for the network is our objective function.
    loss = mx.sym.MakeLoss(objective_function(param_syms))
    mod = mx.mod.Module(loss)

    mod.bind(data_shapes=[('data', (1,))])
    mod.init_params(InitialParam(initial_params))
    mod.init_optimizer(optimizer=optimizer,
                       optimizer_params=optimizer_params)

    (o_name, o_shape), = mod.output_shapes

    i = 0
    params = initial_params
    old_val = np.full(o_shape, np.nan)
    while i < max_iters:
        mod.forward_backward(mx.io.DataBatch(
            data=[mx.nd.ones((1,))])) 
        mod.update()
        params = mod.get_params()[0]['fc1_weight']
        val = mod.get_outputs()[0].asnumpy()
        if np.allclose(old_val, val, atol=tol):
            print 'Function value: {}'.format(val)
            print 'Iterations: {}'.format(i)
            return params

        old_val = val
        i += 1

    return params

并使用它：

def my_func(x):
    return (x[0] + 1) ** 2

p = minimize(my_func, mx.nd.array([1.0]))
p.asnumpy()

>>> array([[-0.99999988]], dtype=float32)

另一个：

def my_func(x):
    return (x[0] + 1) ** 2 + (x[1] - 2) ** 2 + (x[2] + 3) ** 2

p = minimize(my_func, mx.nd.array([1.0, 1.5, 2.0]))
p.asnumpy()

>>> array([[-0.99996436],
           [ 1.99999106],
           [-2.99991083]], dtype=float32)

目前，由于缺乏前端支持，使用 MXNet 优化简单函数并不像 Tensorflow 那样容易。

首先，您需要一个损失函数作为网络的最后一层。这里是 log_x_squared。使用 MakeLoss 创建损失函数。

其次是输入和权重。由于目前在 MXNet 中变量不计为可训练权重，因此您需要将 x 设置为权重。这里有一个解决方法：设置一个“假”输入变量，该变量始终为 1。之后添加一个具有 1 个隐藏单元且无偏差的全连接层。这给了我们“1 * x”。现在我们的 x 是一个权重。

第三，如果您想对单个数据样本进行多次优化，则 module.fit 可能不是最佳选择。初始化优化器后。您只需要多次调用 module.forward_backward() 和 module.update() 即可。对于forward_backward函数，您需要传递一个databatch，与dataiter相比，这是一个更简单的接口。这里我们只需要每次传递一个常量 ndarray 1 即可。

实际上我们构造了一个 log(1 * x) ^ 2 的计算图，x 变成了一个权重而不是变量。

不管怎样，我们应该考虑提供一个类似tensorflow的接口来优化变量。

希望这是有用的信息！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 mxnet 的简单梯度下降的相关文章

如何在python中读取多个文件中的文本

我的文件夹中有许多文本文件大约有 3000 个文件每个文件中第 193 行是唯一包含重要信息的行我如何使用 python 将所有这些文件读入 1 个文本文件 os 模块中有一个名为 list dir 的函数该函数返回给定目录中所有文
Python、Tkinter、更改标签颜色

有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容是否存在类似的颜色变化 button color red Use the foreground设置按钮
将字符串转换为带有毫秒和时区的日期时间 - Python

我有以下 python 片段 from datetime import datetime timestamp 05 Jan 2015 17 47 59 000 0800 datetime object datetime strptime t
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
您可以在 Python 类型注释中指定方差吗？

你能发现下面代码中的错误吗米皮不能 from typing import Dict Any def add items d Dict str Any gt None d foo 5 d Dict str str add items d f

随机推荐

Java动态数组大小？

我有一个类 XClass 我想将其加载到 XClass 数组中 XClass myClass new XClass 10 myclass 0 new XClass myclass 9 new XClass 然而我不知道我是否需要 10 8
HASP 供应商代码是否应该加密/混淆？

这与 SafeNet Aladdin Sentinel HASP 密钥有关我已经发布到他们的网站但以防万一其他人知道答案或发现答案有用我也在这里发布根据 SafeNet 在软件保护和许可指南 pdf 中提供的文档我们应该对我们的
如何在 C 语言中解压已加载到内存中的 zip 文件？

我正在编写一个服务器它从客户端接收 zip 文件并解压缩该文件当我收到 zip 文件时我将其存储到内存中我找到并尝试一些库来解压缩 zip 文件例如 zlib 和 minizip 但它们都解压缩文件存在于磁盘上而不是来自内存
Android：调用 Context.startService() 后未启动嵌套意图服务

我的嵌套意图服务定义如下 package com my package Bunch of imports public class MyNotifier Bunch of variables public class MissedCallI
根据子哈希值获取数组索引

假设我有这个 id gt 34 votes count gt 3 id gt 2 votes count gt 0 我如何获得基于的索引id 我想做的是回归0当我寻找id 34 and 1当我寻找id 2 最有效的方法是什么你可以将一个块
如何使用 Three.js 在两种颜色之间进行补间？

我有一个 Three js 对象它是给定的颜色我想将其平滑地设置为另一种颜色在动画过程中它应该只显示开始和结束之间的直接渐变也就是说它不应该在 RGB 颜色空间中线性执行补间我什至不确定 HSV 空间内的线性补间是否会看起来不
为变量赋值(nameOfVariable)

是否可以使用类似的东西variable nameOfVariable myValue 我在做什么在我的XLA Add In宏使用了大量的模块级变量许多存在Public256 是Const 部分公共的有一些伪常量偶尔从网络可访问的 co
如何使用方法引用调用参数化方法

考虑下面的代码 interface TestInter public void abc class DemoStatic public static void testStatic String abc System out println
如何使用UIScrollView在UIView之间切换

我将如何构建多个UIViews具有多个子视图并使用UIScrollView 我将不胜感激任何可以上传一些代码的人我对 iPhone 完全是个菜鸟我会在 UIScrollView 中平铺 UIView 然后实现某种分页或对齐机制监
Vowpal Wabbit - 如何从测试样本的上下文强盗模型中获取预测概率

给定训练有素的上下文强盗模型如何检索测试样本的预测向量例如假设我有一个名为 train dat 的火车集其中包含格式如下的行 1 1 0 3 a b c
如何在不使用 Visual Studio 的情况下浏览和查看存储在 Team Foundation Server 中的文件

我正在寻找一种工具来浏览和查看存储在 Team Foundation Server 中的文件而无需使用 Visual Studio 由于我在虚拟机上进行大部分开发因此唤醒虚拟机只是为了查看某个文件这非常烦人那么有没有一种方法可以在不
Xcode 说我安装了 4.2，但只能打开 4.1

我对此很困惑当我去市场或尝试下载 4 2 来获取 ios5 时它说它已安装我在关于部分检查了 Xcode 它显示正在运行 4 1 我尝试了在我的应用程序文件夹中安装 Xcode 假设它可能是为了更新但它仍然显示 4 1 如何更新
MongoDB 文本搜索按多个字段过滤

我有以下文档结构 content cat dog bird uid
python 删除
如何使用 python 2 6 删除所有内容包括 div class comment remove all div 我尝试了使用 re sub 的各种方法但没有成功谢谢这可以使用 HTML 解析器轻松可靠地完成例如美丽汤 http

如何将 __LINE__ 中的行号插入到 Perl 中的测试名称中？

当我尝试这个测试用例时 sel gt is text present ok foo testname line LINE 我想在日志中得到这个 ok 1 is text present foo Testcase 881 line 54 但我
查找 Xcode 项目的 ${PROJECT_DIR}

我如何找出我的绝对值 PROJECT DIR 路径是我的 Xcode 项目的吗有没有办法在终端中打印这个如何构建设置 gt 预处理宏 PROJECT DIR PROJECT DIR BUILD ROOT BUILD ROOT 然后就可
为什么贪婪的硬币找零算法对某些硬币组不起作用？

我了解硬币找零问题的贪婪算法用尽可能少的硬币支付特定金额的工作原理它总是选择最大面额不超过剩余金额的硬币并且它总是找到正确的解决方案特定的硬币套装但对于某些硬币组贪心算法会失败例如对于集合 1 15 25 和为 30 贪心算
Spring安全身份验证：获取不带SPRING_SECURITY_LAST_USERNAME的用户名

我是 spring 框架的新手我正在为我的网络应用程序创建一个登录页面我希望用户在对应用程序执行任何操作之前登录如果用户输入良好的凭据一切都可以正常工作但如果输入错误的凭据我想显示一条消息并将用户名保留在输入元素上显示消息不是
更新灯泡中边缘的正确方法（neo4j 或 titan）

我正在尝试Bulbs与图形数据库交互生产将使用 Titan 本地 Neo4j 似乎最适合试验我无法理解这个概念灯泡展示了如何创建新的顶点 gt gt gt james g vertices create name James gt g
使用 mxnet 的简单梯度下降

我正在尝试使用 MXNet 的梯度下降优化器来最小化函数 Tensorflow 中的等效示例是 import tensorflow as tf x tf Variable 2 name x dtype tf float32 log x tf

使用 mxnet 的简单梯度下降

使用 mxnet 的简单梯度下降 的相关文章

随机推荐

热门标签

使用 mxnet 的简单梯度下降的相关文章