Pytorch 中缺乏 L1 正则化的稀疏解决方案

2023-12-22

我正在尝试在简单神经网络的第一层（1 个隐藏层）上实现 L1 正则化。我查看了 StackOverflow 上的其他一些帖子，这些帖子使用 Pytorch 应用 l1 正则化来弄清楚应该如何完成（参考文献：在 PyTorch 中添加 L1/L2 正则化？ https://stackoverflow.com/questions/42704283/adding-l1-l2-regularization-in-pytorch, 在 Pytorch 中，如何将 L1 正则化器添加到激活中？ https://stackoverflow.com/questions/44641976/in-pytorch-how-to-add-l1-regularizer-to-activations）。无论我将 lambda（l1 正则化强度参数）增加到多高，我都不会在第一个权重矩阵中得到真正的零。为什么会这样呢？（代码如下）

import torch
import torch.nn as nn
import torch.nn.functional as F
import numpy as np

class Network(nn.Module):
    def __init__(self,nf,nh,nc):
        super(Network,self).__init__()
        self.lin1=nn.Linear(nf,nh)
        self.lin2=nn.Linear(nh,nc)

    def forward(self,x):
        l1out=F.relu(self.lin1(x))
        out=F.softmax(self.lin2(l1out))
        return out, l1out

def l1loss(layer):
    return torch.norm(layer.weight.data, p=1)

nf=10
nc=2
nh=6
learningrate=0.02
lmbda=10.
batchsize=50

net=Network(nf,nh,nc)

crit=nn.MSELoss()
optimizer=torch.optim.Adagrad(net.parameters(),lr=learningrate)


xtr=torch.Tensor(xtr)
ytr=torch.Tensor(ytr)
#ytr=torch.LongTensor(ytr)
xte=torch.Tensor(xte)
yte=torch.LongTensor(yte)
#cyte=torch.Tensor(yte)

it=200
for epoch in range(it):
    per=torch.randperm(len(xtr))
    for i in range(0,len(xtr),batchsize):
        ind=per[i:i+batchsize]
        bx,by=xtr[ind],ytr[ind]            
        optimizer.zero_grad()
        output, l1out=net(bx)
#        l1reg=l1loss(net.lin1)    
        loss=crit(output,by)+lmbda*l1loss(net.lin1)
        loss.backward()
        optimizer.step()
    print('Epoch [%i/%i], Loss: %.4f' %(epoch+1,it, np.float32(loss.data.numpy())))

corr=0
tot=0
for x,y in list(zip(xte,yte)):
    output,_=net(x)
    _,pred=torch.max(output,-1)
    tot+=1 #y.size(0)
    corr+=(pred==y).sum()
print(corr)

注意：数据有 10 个特征（2 个类别和 800 个训练样本），并且只有前 2 个是相关的（根据设计），因此人们会假设真正的零应该很容易学习。

您的使用情况layer.weight.data从其自动微分上下文中删除参数（这是一个 PyTorch 变量），使其在优化器获取梯度时成为常量。这会导致梯度为零并且不会计算 L1 损失。

如果您删除.data，范数是由 PyTorch 变量计算的，并且梯度应该是正确的。

有关 PyTorch 自动微分机制的更多信息，请参阅此文档文章 http://pytorch.org/docs/stable/autograd.html或这个tutorial http://pytorch.org/tutorials/beginner/blitz/autograd_tutorial.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch 中缺乏 L1 正则化的稀疏解决方案的相关文章

Python 3 中的相对导入

我想从同一目录中的另一个文件导入函数通常以下其中一项有效 from mymodule import myfunction from mymodule import myfunction 但另一个给了我以下错误之一 ImportError
Python 3 如何知道如何 pickle 扩展类型，尤其是 Numpy 数组？

Numpy 数组是扩展类型也称为使用 C API 扩展定义的声明了 Python 解释器范围之外的附加字段例如data属性这是一个Buffer Structure 如 Numpy 中所述阵列接口 https docs scipy o
FastAPI/Pydantic 接受任意 post 请求正文吗？

我想创建一个 FastAPI 端点它只接受任意的 post 请求正文并返回它如果我发送 foo bar 我想得到 foo bar 后退但我也希望能够发送 foo1 bar1 foo2 bar2 并把它拿回来我试过 from fast
PyTorch：运行时错误：函数 MulBackward0 在索引 0 处返回无效梯度 - 预期类型 torch.cuda.FloatTensor 但得到 torch.FloatTensor

我不明白这个错误告诉我什么在另一个帖子 https github com NVIDIA flownet2 pytorch issues 139也解决了同样的问题但没有有效的解决方案 Traceback most recent call
现在与出生日期之间的年、月、日、分钟差异

import datetime birthday datetime datetime 1996 8 15 differnce datetime datetime now birthday This returns a timedelta o
如何将 AWS Kinesis Video Stream GetMedia API 输出解码为 mp3/wav？

我现在使用 GetMedia API 通过 AWS Connect 服务将数据提取到 Kinesis Video Stream KVS 我能够提取Payload但如何将此输出转换为 mp3 wav 我想将此输出提取到 AWS Transcr
Python 类型提示：typing.Mapping 与typing.Dict

我正在开发一个 python 项目我们使用typing整个模块类型提示看来我们用的是typing Dict and typing Mapping几乎可以互换有理由选择其中一种而不是另一种吗我自己设法回答了这个问题 typing Di
PyTorch 中的后向函数

我对 pytorch 的后向功能有一些疑问我认为我没有得到正确的输出 import numpy as np import torch from torch autograd import Variable a Variable torch
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
类型错误：只能使用标量值执行操作

如果您能让我知道如何为所提供的表格绘制一些信息丰富的图表我将不胜感激here https www iasplus com en resources ifrs topics use of ifrs 例如我需要一个名为国内非上市公司非上
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
neo4j - python 驱动程序，服务不可用

我对 neo4j 非常陌生我正在尝试建立从 python3 6 到 neo4j 的连接我已经安装了驱动程序并且刚刚开始执行第一步导入请求导入操作系统导入时间导入urllib 从 neo4j v1 导入 GraphDatabas
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2
python 从字典中获取唯一值

我想从我的字典中获取唯一的值 Input 320 167 316 0 319 167 401 167 319 168 380 167 265 166 期望的输出 167 0 168 166 我的代码 unique values sorted
Keras CNN 回归模型损失低，准确度为 0

我在 keras 中遇到这个 NN 回归模型的问题我正在研究一个汽车数据集以根据 13 个维度预测价格简而言之我已将其读取为 pandas 数据帧将数值转换为浮点数缩放值然后对分类值使用 one hot 编码这创建了很多新列
如何使用 PyTorch 沿特定维度进行热编码？

我有一个大小的张量 3 15 136 where 3 is batch size 15 sequence length and 136 is tokens 我想使用中的概率来单热我的张量tokens维度 136 为此我想提取序列长度中每个
GitPython 检查 git pull 是否更改了本地文件

使用 GitPython 我只想在拉取后本地文件发生更改时才调用函数例如如果我在一台单独的计算机上进行推送然后拉第一台计算机它按预期工作但不提供任何输出理想的输出是已更改的文件列表或者只是告诉我拉动是否有错误没有拉动因为分
占据花车的地板

我发现了两种在 Python 中占据发言权的方法 3 1415 1 and import math math floor 3 1415 第一种方法的问题是它返回一个浮点数即3 0 第二种方法感觉很笨拙而且太长在 Python 中是否有替
如何使用Python3、Selenium Chrome WebDriver在第一次请求之前预加载cookie？

是否可以使用添加cookieadd cookie 对于一个域比如说stackoverflow com在使用 Selenium Chrome WebDriver 进行实际请求之前get 到域上的页面stackoverflow com 尝试时
Spacy 实体规则不适用于基数（社会安全号码）

我已使用实体规则为社会保障号添加新标签即使设置了 overwrite ents true 但它仍然无法识别我验证了正则表达式是正确的不知道我还需要做什么我之前尝试过 ner 但结果相同 text My name is yuyyvb

随机推荐

我们如何在 React Native 应用程序中设置 .env？

我们如何设置 env在反应本机应用程序中如何在react native中进行环境设置我使用 react native dotenv 包安装它并将 react native dotenv 预设添加到项目根目录下的 babelrc 文件中
XBAP 与 FireFox 和 Windows 7

Firefox 依赖 NET 3 5 安装程序安装的扩展和插件来运行 XBAP 不幸的是在 Windows 7 中已经安装了 NET 3 5 运行时有谁知道如何获取这些插件扩展以便您可以实际将 XBAP 部署到 Windows 7
Flex：当文本太长时换行

我在想是否可以使用css来实现以下功能flexbox 在布局中原来有2个div彼此相邻左侧包含一组图标并具有固定宽度右侧包含文本可能会很长有没有办法如何使用只有CSS 尤其是Flexbox 当文本太长时 div 会换行在第一个
别名可变原始指针 (*mut T) 是否会导致未定义的行为？

mut T and mut T导致编译错误这太棒了两次可变借用在客观上是错误的 Is mut T and mut T未定义的行为还是这是完全有效的事情也就是说可变指针别名有效吗更糟糕的是 mut T and mut T实际上编译并
使计算属性依赖于 emberjs 中另一个对象的所有属性

是否可以使一个属性依赖于另一个对象的所有属性例如也在jsfiddle中 http jsfiddle net xgZ94 2 html javascript App Em
Doctrine - 存储 ArrayCollection 键

每当我将 ArrayCollection 与 Doctrine ORM 2 3 PHP gt 5 4 一起使用并将对象值与集合中的键相关联时例如当使用set方法值被正确存储在数据库中但是当我想从实体检索集合时不会检索键而是使用数
如何使用 .NET Core 使用 UTC 时间验证 JWT

目前我正在使用 JWT Bearer Authentication 编写 ASP NET Core WebApi 为了使 API 可以从不同时区访问我使用以下模式来设置字段nbf 不是之前和exp 过期在我的 JWT 内到 UTC 时
如何从 WPF 自动化 Microsoft Word 2003？

我有一个 WPF 窗口使用 C 作为后面的代码其中有一些文本字段我想要的是当用户按下打印按钮时我想获取这些字段上的信息并使用 Microsoft Word 2003 模板该模板有一些空白字段需要使用来自 WPF 窗口的这些信息
Spring拦截器中如何使用@ExceptionHandler？

我正在使用 spring mvc 为客户端创建restful api 我有一个用于检查访问令牌的拦截器 public class AccessTokenInterceptor extends HandlerInterceptorAdapte
如何检查矩阵中的每个值是否在R中其他两个矩阵中的对应值之间？

我有一个矩阵我想将其与其他两个矩阵进行比较以查看矩阵中的每个条目是否包含在其他两个矩阵的值内或值之外例如如果我的矩阵是 gt M 1 2 3 1 0 1278982 0 4600544 1 3271033 2 0 1079272 1
使用 Spring 在 Swagger UI 上收到 404 错误

我正在将 swagger UI 与 Spring boot 应用程序集成当我点击 swagger ui html 时我收到 404 错误我的配置类如下 Configuration EnableSwagger2 Import Swagg
有条件地从列表中获取总和

我有一个类属性详细信息 public class PropertyDetails public int Sequence get set public int Length get set public string Type get se
NightwatchJS 和 WebdriverIO 有什么区别？

正如标题所述 Nightwatch js 和 Webdriver io 有什么区别看起来它们具有相同的语法并且做几乎相同的事情它们有何不同我需要在他们之间做出选择我已经多次使用这些工具编写了测试套件 Webdriver io 允许您
出现错误 - 运行本机反应时无法识别的命令“run-android”，

当尝试在我的模拟器上运行本机反应时我收到此错误 react native run android 错误无法识别的命令 run android 我的模拟器已连接并且正在运行有什么想法吗包 json name iaapp version
全屏意图不启动 Activity，但在 Android 10 上显示通知

我尝试使用下一个代码启动广播接收器的活动 Intent i new Intent context AlarmNotification class i setFlags Intent FLAG ACTIVITY NEW TASK Intent
如何调整轴以从 r 图中的零原点开始

为了绘制三个变量 x1 x2 和 x3 的经验累积密度我在 r 中使用了以下内容 plot ecdf x1 col blue main Distribution XYZ xlab x i ylab Prob x i lt y lines
匹配点的正则表达式

想知道最好的匹配方式是什么 test this from blah blah blah email protected cdn cgi l email protection blah blah 是使用Python 我试过了re split
如何获取Android系统颜色？

我正在寻找获取 Android 系统颜色设备中使用的颜色主题的方法 Using android color 我没有得到正确的颜色例如我的设备中的背景颜色是BLACK 菜单背景颜色为DARKGREY 值来自android color 在
如何在代码中处理游标上的 IllegalStateException？

当我调试我的应用程序时突然弹出此错误我该如何处理这种错误我不知道是在哪里以及如何引起的 Daemon System Thread lt 5 gt HeapWorker Suspended exception IllegalStateEx
Pytorch 中缺乏 L1 正则化的稀疏解决方案

我正在尝试在简单神经网络的第一层 1 个隐藏层上实现 L1 正则化我查看了 StackOverflow 上的其他一些帖子这些帖子使用 Pytorch 应用 l1 正则化来弄清楚应该如何完成参考文献在 PyTorch 中添加 L1

Pytorch 中缺乏 L1 正则化的稀疏解决方案

Pytorch 中缺乏 L1 正则化的稀疏解决方案 的相关文章

随机推荐

热门标签

Pytorch 中缺乏 L1 正则化的稀疏解决方案的相关文章