张量流如何处理无法存储在一个盒子中的大变量

2024-05-16

我想通过训练超过十亿特征维度的数据来训练 DNN 模型。因此第一层权重矩阵的形状将为(1,000,000,000, 512)。这个权重矩阵太大，无法存储在一个盒子中。

目前有没有什么解决方案来处理这么大的变量，例如将大的权重矩阵划分为多个框。

Update:

谢谢奥利维尔和凯维曼。让我添加有关我的问题的更多详细信息。该示例非常稀疏，所有特征都是二进制值：0 或 1。参数权重看起来像 tf.Variable(tf.truncated_normal([1 000 000 000, 512],stddev=0.1))

kaveman给出的解决方案看起来很合理，我会在尝试后更新结果。

这个问题的答案很大程度上取决于您想要对权重矩阵执行什么操作。

处理如此大量特征的典型方法是处理512每个特征的向量作为嵌入。如果数据集中的每个示例仅具有 10 亿个特征中的一个，那么您可以使用tf.nn.embedding_lookup https://www.tensorflow.org/api_docs/python/tf/nn/embedding_lookup函数来查找小批量示例中存在的特征的嵌入。如果每个示例都有多个功能，但可能只有少数几个，那么您可以使用tf.nn.embedding_lookup_sparse https://www.tensorflow.org/api_docs/python/tf/nn/embedding_lookup_sparse查找嵌入。

在这两种情况下，您的权重矩阵可以分布在许多机器上。那就是params这两个函数的参数都是张量列表。您可以对大型权重矩阵进行分片并将分片放置在不同的机器中。请看tf.device https://www.tensorflow.org/api_docs/python/tf/device和primer https://www.tensorflow.org/deploy/distributed分布式执行，以了解数据和计算如何分布在许多机器上。

如果你确实想对权重矩阵进行一些密集运算，例如将矩阵与另一个矩阵相乘，这仍然是可以想象的，尽管 TensorFlow 中没有现成的方法来处理这个问题。您仍然需要在机器之间分割权重矩阵。但是，您必须在权重矩阵的分布式块上手动构建矩阵乘法序列，并将结果组合起来。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

张量流如何处理无法存储在一个盒子中的大变量的相关文章

尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
如何在Keras模型中替换（或插入）中间层？

我有一个训练有素的 Keras 模型我想要 1 用相同但没有偏差的Con2D层替换Con2D层 2 在第一次激活之前添加 BatchNormalization 层我怎样才能做到这一点 def keras simple model fro
使用 Mac M1 在 Docker 容器内的 pip 安装中找不到 Tensorflow

我正在尝试使用新的 Mac M1 运行一些项目这些项目已经在英特尔处理器上运行并被使用英特尔的其他开发人员使用我无法构建这个简单的 Dockerfile FROM python 3 9 RUN python m pip install
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
在 Android 上保持 TensorFlow 模型加密

我搜索了解是否有一种技术可以在 Android 应用程序中保持经过训练的张量流模型 pb 文件的安全但没有找到任何有用的东西我正在发布一个包含我在训练集上构建的张量流模型的应用程序当我发布该应用程序时任何人都可以访问该模型并将其用
如何在带有 LSTM 层的 TensorFlow Hub 中使用嵌入模型？

我正在学习 TensorFlow 2 通过 TF Hub 教程进行文本分类它使用了 TF hub 的嵌入模块我想知道是否可以修改模型以包含 LSTM 层这是我尝试过的 train data validation data test d
Tensorflow推荐的系统规格？

我开始在我的 RHEL 6 5 机器上安装 Tensorflow 但事实证明 Tensorflow 需要 glibc gt 2 17 而 rhel 6 5 上默认的 glibc 是 2 12 我想知道是否有人可以帮助我了解张量流的最低推荐
Tensorflow GPU 设置：PyCharm 上的 CUDA 错误

我在 Python3 MacOSX El Capitan 上安装了 TF 0 8 当为 TF 运行简单的测试代码时我收到以下消息 ImportError dlopen Library Frameworks Python framework
您必须使用 dtype float(Tensorflow) 为占位符张量“Placeholder”提供值

import tensorflow as tf import os import sklearn preprocessing import pandas as pd import numpy as np print os getcwd os
Tensorflow：为什么 tf.case 给我错误的结果？

我正在尝试使用tf case https www tensorflow org api docs python tf case https www tensorflow org api docs python tf case 有条件地更新张
如何使用 Tensorflow 中的 Hugging Face Transformers 库对自定义数据进行文本分类？

我正在尝试使用 Hugging Face Transformers 库提供的不同变压器架构对自定义数据 csv 格式进行二进制文本分类我正在用这个张量流博客文章 https blog tensorflow org 2019 11 hug
tf.gfile 在 TensorFlow 中起什么作用？

我见过人们使用以下几个函数tf gfile例如tf gfile GFile or tf gfile Exists 我有一个想法tf gfile处理文件但是我无法找到官方文档来了解它还提供了什么如果你能帮我的话那就太好了对于登陆这里的
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
如何在 Tensorflow 中使用预训练的 Word2Vec 模型

我有一个Word2Vec训练过的模型Gensim 我如何使用它Tensorflow for Word Embeddings 我不想在 Tensorflow 中从头开始训练嵌入有人可以告诉我如何用一些示例代码来做到这一点吗假设您有一个字典
Tensorflow：尽管数据中没有字符串，但使用 tflearn 时不支持将字符串转换为浮点数错误

我似乎无法在我的代码中找到错误其中有任何字符串被错误地转换为浮点数但它却给了我这个错误 W tensorflow core framework op kernel cc 958 Unimplemented Cast string to
如何将两个 keras 模型连接成一个模型？

假设我有一个 ResNet50 模型我希望将该模型的输出层连接到 VGG 模型的输入层这是 ResNet 模型和 ResNet50 的输出张量 img shape 164 164 3 resnet50 model ResNet50 in
无需安装 Tensorflow 即可服务 Tensorflow 模型

我有一个经过训练的模型想在 python 应用程序中使用但我看不到任何在不安装 TensorFlow 或创建 gRPC 服务的情况下部署到生产环境的示例有可能吗在这种情况下正确的做法是什么如果不使用 TensorFlow 本身或
需要 TensorFlow 依赖项。如何在 Windows 上运行 TensorFlow

我有兴趣让 TensorFlow 在 Windows 上运行但目前我意识到这是不可能的因为某些依赖项无法在 Windows 上使用例如巴泽尔之所以出现这种需求是因为据我目前了解从 TensorFlow 访问 GPU 的唯一方法是
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
使用tensorflow获取真阳性、假阳性、假阴性和真阴性列表

这是我的工作我注释了活细胞的图像约 8 000 和死细胞的图像约 2 000 800 和 200 用于测试集我正在使用 CNN 带有张量流和 keras 将图像分类为活或死我训练了我的模型验证损失 0 35 召回率

随机推荐

如何使用 htaccess 将所有请求重定向到反应或角度索引？

我正在使用react router 在react 中创建一个应用程序早些时候我对 Angular 做了同样的事情但在这两种情况下如果用户为 URL 添加书签并直接加载它它将显示 404 错误我们可以在 htaccess 中创建这
内联函数以及类和头文件

头文件中定义的任何函数都会自动内联吗如果我在类中声明一个函数并使用关键字 inline 在外部给出定义那么这个函数会是内联的吗如果是为什么这不违反内联函数应在声明时赋予主体的法律类定义中定义的任何函数都是内联的任何标记的功能in
从包含带边框的表格的图像中提取表格结构

我正在尝试提取下表中的单元格位置应用自适应阈值处理后我能够获得细胞位置周围的轮廓并且 HoughLines 获得垂直和水平结构元素这是我的代码 img cv2 imread os path join img path file im
ML 中高阶函数中的 curry 和 uncurry 是什么

fun curry f x y f x y fun uncurry f x y f x y fun compose f g x f g x 我了解 compose 函数但不太了解 ML 中的 curry 和 uncurry 谁能解释一下这
将图像列保存到 SQL Server 2000 中的文件

我在 SQL Server 2000 中有一个包含图像列的表我需要将图像数据保存到文件系统上的文件中在 SQL Server 2005 中我可以使用 ADODB Stream 对象进行文件 I O 但这在 SQL Server 200
如何在我的 Android 应用程序中实现应用内购买？

如何在我的 Android 应用程序中实现应用内购买我提到 http developer android com guide market billing billing integrate html billing service ht
toUpperCase() 方法什么时候创建一个新对象？

public class Child public static void main String args String x new String ABC String y x toUpperCase System out println
在情节提要中将 Segue 拖至自身

我想将一个 Segue 从我的视图控制器拖到其自身所以我可以推送该特定视图控制器的无限实例我知道如何在代码中执行此操作即以编程方式实例化视图控制器但是我想尽可能使用 segues 我发现了一些在故事板中进行自我延续的技巧但
创建可重用的 LINQ to SQL 块

我正在尝试分解 linq to sql 查询以使它们更具可读性假设我想退回上一年订单超过 100 个的产品的所有订单我有这样的疑问 from o in context Orders where from o1 in context Or
复制一张工作表上的静态范围，然后根据单元格中的单个值粘贴到另一张工作表中的动态范围

我对这个问题分为三个部分我在 Sheet1 A1 中有一个带有周数的单元格我在 Sheet1 B1 F1 中有一个需要复制的静态范围然后我需要将该值粘贴到 Sheet2 中的动态范围中偏移量为行的周数这是我正在为我经常使用的工作
@TableGenerator 的初始值属性在 Hibernate 中显示问题，但在 JPA 中则不然

package com sb firstjpaexample pojo import javax persistence Column import javax persistence Entity import javax persist
是否有一个单行代码可以将元组/对解压到引用中？

我经常写这样的片段 int x y z tie x y z g 19 例如其中g较早宣布 vector
在 onclick 事件上请求麦克风

有一天我偶然发现了这个 Javascript 录音机的例子 http webaudiodemos appspot com AudioRecorder index html http webaudiodemos appspot com Au
CSS 选择器：Active 不适用于 IE8 中的子元素单击

我有以下 HTML 结构 div class wrapper div class control clickable img src logo png div div 以及以下 CSS control border 1px solid 00
SPNEGO 密码身份验证问题

我已将我的应用程序配置为通过 SPNEGO 与 Websphere 使用 Kerberos 身份验证这是详细信息 krb5 conf libdefaults default realm ABC MYCOMPANY COM default
使用 LINQ 洗牌

我正在尝试编写一个简单的纸牌游戏为了想出一个好的洗牌算法我遇到了 Jeff Atwood 的post http www codinghorror com blog 2007 12 shuffling html关于恐怖编码但是当我在调
new/delete操作符不匹配错误有多严重？

我在我们的代码库中发现了经典的 new delete 不匹配错误如下所示 char foo new char 10 do something delete foo instead of delete foo 这到底有多严重它会导致内存泄
Rails 3 在 Ruby 1.9.2 上初始化非常慢

我使用 RVM 来管理环境安装了 Ruby 1 9 2 p136 我认为是最新版本和 Rails 3 创建了 gemset 并运行捆绑器到目前为止一切正常但 Rails 在运行命令即生成销毁 rake 等时初始化速度非常慢完
何时使用 pthread 条件变量？

线程问题看来只有在其他线程调用 pthread cond notify 之前调用 pthread cond wait 时条件变量才起作用如果在等待之前发生通知那么等待将被卡住我的问题是什么时候应该使用条件变量调度程序可以抢占
张量流如何处理无法存储在一个盒子中的大变量

我想通过训练超过十亿特征维度的数据来训练 DNN 模型因此第一层权重矩阵的形状将为 1 000 000 000 512 这个权重矩阵太大无法存储在一个盒子中目前有没有什么解决方案来处理这么大的变量例如将大的权重矩阵划分为多个框 Up

张量流如何处理无法存储在一个盒子中的大变量

Update:

张量流如何处理无法存储在一个盒子中的大变量 的相关文章

随机推荐

热门标签

张量流如何处理无法存储在一个盒子中的大变量的相关文章