tf.losses.softmax_cross_entropy()及相邻函数中weights参数的设置

2023-11-12

最近在修改deeplab v3+的代码训练自己的数据进行分割任务, 因为我的数据中label为0的像素点特别多, 数据不平衡, 所以考虑对label为0的sample设置权重为0.1, 其他class权重为1.
查看tensorflow文档(需要科学上网), 该函数的参数为:

tf.losses.softmax_cross_entropy(
    onehot_labels,
    logits,
    weights=1.0,
    label_smoothing=0,
    scope=None,
    loss_collection=tf.GraphKeys.LOSSES,
    reduction=Reduction.SUM_BY_NONZERO_WEIGHTS
)

其中

onehot_labels是one_hot编码的label, shape为[batch_size, num_classes]
logits是神经网络的输出, 注意要求是softmax处理之前的logits, 因为tf.losses.softmax_cross_entropy()方法内部会对logits做softmax处理, shape为[batch_size, num_classes]
weights
可以是一个标量或矩阵. 如果是标量, 就是对算出来的cross_entropy做缩放; 如果是矩阵, 要求shape为[batch_size, ].
可以发现, weights实际上是给batch中每个sample设置一个权重, 而不是给label的不同class设置权重. 因此, 输入的weights需要先做处理:

	weights = [0.1] + 49 * [1.0]    #label为0的class权重设为0.1, 其余49个class设为1, 输出一个list
	weights = tf.convert_to_tensor(weights)     #将list转成tensor, shape为[50, ]
	weights = tf.reduce_sum(tf.multiply(onehot_labels, weights), -1)    #根据labels,将weights转成对每个sample的权重

注意, onehot_labels的shape为[batch_size, 50], weights的shape为[50, ], tf.multiply()进行element对应相乘, 自动将weights进行broadcast, tf.multiply()的结果shape为[batch_size, 50], 再进行tf.reduce_sum(), 最终weights的shape是[batch_size, ] \newline

tf.losses下其他cross_entropy函数中weights的设置同理

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

tf.losses.softmax_cross_entropy()及相邻函数中weights参数的设置的相关文章

使用 Mac M1 在 Docker 容器内的 pip 安装中找不到 Tensorflow

我正在尝试使用新的 Mac M1 运行一些项目这些项目已经在英特尔处理器上运行并被使用英特尔的其他开发人员使用我无法构建这个简单的 Dockerfile FROM python 3 9 RUN python m pip install
在 GPU 上训练时如何处理非确定性？

在调整超参数以使模型性能更好时我注意到每次运行代码时获得的分数以及创建的模型都是不同的尽管修复了随机操作的所有种子如果我在CPU上运行就不会出现这个问题我搜索了一下发现这是使用 GPU 训练时的常见问题这是一个非常好的详细
如何访问 tf.layers.conv2d 中的内核变量？

我想可视化卷积层中的权重以观察它们如何变化但我找不到一种方法来访问卷积层中的权重tf layers conv2d 谢谢您可以通过名称访问该变量 weights sess run
支持 Nvidia CUDA 工具包 9.2

Tensorflow gpu 绑定到 Nvidia CUDA Toolkit 的特定版本的原因是什么当前版本似乎专门寻找 9 0 并且不适用于任何更高版本例如我安装了最新的 Toolkit 9 2 并将其添加到路径中但 Tensor
在 Tensorflow 对象检测 API 中将图像裁剪到边界框

如何将图像裁剪到 Tensorflow 中的边界框我正在使用Python API 从文档来看 tf image crop to bounding box image offset height offset width target he
使用 Keras 时，验证集中未见的类别会出现错误

我有由数值变量和分类变量组成的数据分类变量有很多类别因此我使用嵌入来表示这些类别我的模型是一个简单的神经网络我知道当你定义嵌入层时你需要通过input dim number of categories 1为了解释训练中看不见的类别
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
Tensorflow中的Tensor和Variable有什么区别

有什么区别Tensor and Variable在张量流中我注意到在这个 stackoverflow 答案 https stackoverflow com questions 38556078 in tensorflow what is
conv1D 中形状的尺寸

我尝试过构建一个只有一层的 CNN 但遇到了一些问题事实上编译器告诉我 ValueError 检查模型输入时出错预期的 conv1d 1 input 具有 3 个维度但得到形状为 569 30 的数组这是代码 import num
Tensorflow新Op CUDA内核内存管理

我已经使用 GPU CUDA 内核在 Tensorflow 中实现了一个相当复杂的新 Op 该操作需要大量动态内存分配这些变量不是张量并且在操作完成后被释放更具体地说它涉及使用哈希表现在我正在使用cudaMalloc and cu
从字符串列表创建 TfRecords 并在解码后在张量流中提供图形

目的是创建 TfRecords 数据库给定我有 23 个文件夹每个文件夹包含 7500 个图像以及 23 个文本文件每个文件有 7500 行描述单独文件夹中 7500 个图像的特征我通过以下代码创建了数据库 import ten
Keras：binary_crossentropy 和 categorical_crossentropy 混淆

使用 TensorFlow 一段时间后我阅读了一些 Keras 教程并实现了一些示例我找到了几个使用卷积自动编码器的教程keras losses binary crossentropy作为损失函数我想binary crossentro
需要 TensorFlow 依赖项。如何在 Windows 上运行 TensorFlow

我有兴趣让 TensorFlow 在 Windows 上运行但目前我意识到这是不可能的因为某些依赖项无法在 Windows 上使用例如巴泽尔之所以出现这种需求是因为据我目前了解从 TensorFlow 访问 GPU 的唯一方法是
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
ubuntu 20.04 上无法获取卷积算法错误~tensorflow-gpu

我有一个 NVIDIA 2070 RTX GPU 我的操作系统是 Ubuntu20 04 我已经使用 conda 安装了tensorflow gpu 包我有not安装了 CUDA toolkit 我相信它还会安装 CUDA toolkit
如何解释tf.map_fn的结果？

看代码 import tensorflow as tf import numpy as np elems tf ones 1 2 3 dtype tf int64 alternates tf map fn lambda x x x x el
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
GPU 上的张量流：尽管 cuda 的 deviceQuery 返回“PASS”结果，但没有已知设备

注这个问题最初是在github上问的 https github com tensorflow tensorflow issues 7648 issuecomment 280866214 但被要求改为在这里我在 GPU 上运行 Tenso
Tensorflow 导入错误：没有名为“tensorflow”的模块

我在 Windows Python 3 5 Anaconda 环境中安装了 TensorFlow 验证成功有警告 tensorflow C gt python Python 3 5 3 英特尔公司默认 2017 年 4 月 27 日 1
TensorFlow Bazel 构建失败

我正在使用 Bazel 构建 TensorFlowbazel build c opt config cuda tensorflow cc tutorials example trainer按照 TensorFlow 的指示从源安装说明

随机推荐

关于错误：编码GBK 的不可映射字符问题的解决

Created by winston on September 25 2019 关于错误编码GBK 的不可映射字符问题的解决 1 问题说明现需要将 java文件转 class文件直接使用如下命令 javac d xxx java
EPM连接显示服务器不可用,EPM问题汇总之-SmartView无法连接Essbase

版权声明本文为博主原创文章遵循 CC 4 0 BY SA 版权协议转载请附上原文出处链接和本声明本文链接 https blog csdn net ye1142262478 article details 78064637 问题使用
字符串类算法题

1 字符处理 1 字符过滤只保留大小字母和数字 StringBuffer sgood new StringBuffer int length s length for int i 0 i lt length i char ch s cha
基于Transformer的大模型是如何运行的？Meta揭秘内部机制！

点击下方卡片关注 CVer 公众号 AI CV重磅干货第一时间送达点击进入 gt 目标检测和Transformer 交流群转载自机器之心编辑马梓文本文旨在更好地理解基于 Transformer 的大型语言模型 LLM 的内部
数学04--丑数

数学04 丑数 jz33 题目概述解析参考答案注意事项说明题目概述算法说明把只包含质因子2 3和5的数称作丑数 Ugly Number 例如6 8都是丑数但14不是因为它包含质因子7 习惯上我们把1当做是第一个丑数求按从
Pytorch基础学习（第二章-Pytorch数据处理）

课程一览表目录一人民币二分类与DataSet与DataLoader 0 人民币二分类模型任务 1 DataLoader
视频聚合软件何处去

转自 http www ithome com html it 192291 htm 视频聚合软件何处去乐视开启全面合作共赢模式 2015 12 3 12 04 57来源互联网作者互联网责编小智评论 0 2015无疑是乐视网的维权年
BCD详细测试说明

BCD详细测试说明一 BCD简介 BCD全称Boot Configuration Data 引导配置数据了解BCD之前需要先大体了解一下windows系统启动过程 BIOS gt MBR gt DPT gt DBR gt BootMg
【（项目）Web服务器的实现】——自主实现一个Web服务器项目，通过该服务器搭建个人网站（保姆级教程），可写在简历上

个人主页努力学习的少年版权本文由努力学习的少年原创在CSDN首发需要转载请联系博主如果文章对你有帮助欢迎关注点赞收藏一键三连和订阅专栏哦目录前言一项目介绍 1 什么是Web服务器 2 项目展示二认识ht
【全球首发】书生·浦语200亿参数模型InternLM-20B开源了！

9月20日上海人工智能实验室上海AI实验室与商汤科技联合香港中文大学和复旦大学正式推出书生浦语大模型 InternLM 200亿参数版本InternLM 20B 并在阿里云魔搭社区 ModelScope 开源首发同时书生浦语面
睿智的目标检测61——Pytorch搭建YoloV7目标检测平台

睿智的目标检测61 Pytorch搭建YoloV7目标检测平台学习前言源码下载 YoloV7改进的部分不完全 YoloV7实现思路一整体结构解析二网络结构解析 1 主干网络Backbone介绍 2 构建FPN特征金字塔进行加强
cocos2d-x 读取tmx文件报错 TMXTiledMap: Map not found. Please check the filename

cocos2d x 读取tmx文件报错 Cocos2d Assert failed TMXTiledMap Map not found Please check the filename Assertion failed mapInfo g
eslint-plugin-vue 对于vue文件没有起格式检查作用

背景自己用webpack 搭建了一个类似 vue cli 的脚手架就在配置 eslintrc文件时使用了 eslint plugin vue module exports root true env browser true es6
SolidJS是什么？SolidJS框架简介

最近刚刚整明白点Svelte感觉整个世界都清净了但是昨天有人给我介绍了SolidJS 上篇 Svelte原理和进阶看这篇就够了当时我心想这又是啥玩意啊经过一番深入交流才知道居然又是个前端框架还有完没完了一个接一个的框架啥时候
2020流水账

今天这边过小年离农历新年也没几天了没心思复习考研也不太想敲代码不如写写年度总结吧这一年算是很舒服的了上半年因为疫情在家待了大半年网上上课和在学校一样大部分时间还是坐在电脑前面玩手机要说繁琐的话就是几个大作业课上没咋听
利用 Dlib 实现人脸 68个特征点的标定（人脸表情识别）

利用 Dlib 实现人脸 68个特征点的标定利用 Dlib 官方训练好的模型 shape predictor 68 face landmarks dat 进行 68 个点标定利用 OpenCv 进行图像化处理在人脸上画出 68 个特
为何越来越多的职场人不喜欢“试用期六个月”的公司？网友：不靠谱

黑马程序员视频库播妞微信号 boniu236 传智播客旗下互联网资讯学习资源免费分享平台众所周知任何一份工作都有试用期一般是三月左右但如果你遇到试用期达到半年的公司你会不会进入近日就有人遇到了此类公司并对是否要进入该公司
LeetCode 101Pro

LeetCode 101 本文档是对LeetCode101中题目的详细解释和扩展文章目录 LeetCode 101 第一章题目分类第二章最易懂的贪心算法 2 1 算法解释 2 2 分配问题 455 分发饼干 135 分发糖果 2 3
Google Collections使用笔记-Multimap

Multimap 往里面put元素代码如下 com google common collect Multimap
tf.losses.softmax_cross_entropy()及相邻函数中weights参数的设置

最近在修改deeplab v3 的代码训练自己的数据进行分割任务因为我的数据中label为0的像素点特别多数据不平衡所以考虑对label为0的sample设置权重为0 1 其他class权重为1 查看tensorflow文档需要科学

tf.losses.softmax_cross_entropy()及相邻函数中weights参数的设置

tf.losses.softmax_cross_entropy()及相邻函数中weights参数的设置 的相关文章

随机推荐

热门标签

tf.losses.softmax_cross_entropy()及相邻函数中weights参数的设置的相关文章