高效实现一系列矩阵向量乘积/特定“张量”矩阵乘积

2023-12-29

我有一个特殊的算法，作为最后的步骤之一，我需要执行 3-D 数组与 2-D 数组的乘法，以便 3-D 数组的每个矩阵切片与 3-D 数组的每一列相乘。二维数组。换句话说，如果说A is an N x N x N矩阵和B is an N x N矩阵，我需要计算一个矩阵C尺寸的N x N where C(:,i) = A(:,:,i)*B(:,i);.

实现这一点的简单方法是循环，即

C = zeros(N,N);
for i = 1:N
    C(:,i) = A(:,:,i)*B(:,i);
end

然而，循环并不是 Matlab 中最快的，应该避免。我正在寻找更快的方法来做到这一点。现在，我所做的就是利用以下事实（现在 Mathjax 会很棒！）：

[A1 b1, A2 b2, ..., AN bN] = [A1, A2, ..., AN]*blkdiag(b1,b2,...,bN)

这允许摆脱循环，但是，我们必须创建一个大小为的块对角矩阵N^2 x N。我正在通过sparse为了高效，即像这样：

A_long = reshape(A,N,N^2);
b_cell = mat2cell(B,N,ones(1,N)); % convert matrix to cell array of vectors
b_cell{1} = sparse(b_cell{1});    % make first element sparse, this is enough to trigger blkdiag into sparse mode
B_blk = blkdiag(b_cell{:});
C = A_long*B_blk;

根据我的基准测试，尽管进行了必要的准备（仅乘法就比循环快 3 到 4 倍），但这种方法比循环快两倍左右（对于大 N）。

这是我所做的一个快速基准测试，改变了问题的大小N并测量循环和替代方法的时间（有或没有准备步骤）。对于大型N加速比约为 2...2.5。

不过，这对我来说看起来非常复杂。有没有更简单或更好的方法来实现这一目标？这看起来像是一个非常通用/标准的问题，所以我可以想象解决方案就在身边，我只是不知道真正要搜索什么。

P.S.: blkdiag(A1,...,AN)*B是一个明显的替代方案，但这里块对角线已经是N^2 x N^2所以我认为它不会比我所做的更好。

edit: 谢谢大家的评论！我在 Matlab R2016b 上进行了新的基准测试。不幸的是，我在同一台计算机上没有这两个版本，因此我们无法比较绝对数字，但相对比较仍然很有趣，因为它发生了一些变化。这里是：

这是高 N 区域的放大图：

一些观察结果：

SumRepDot是Divakar提出的解决方案，即使用squeeze(sum(bsxfun(@times,A,permute(B,[3,1,2])),2))在 R2016b 上简化为squeeze(sum(A.*permute(B,[3,1,2]),2))。它比高循环更快N大约为 1.2...1.4 倍。
从某种意义上说，循环仍然“慢”，因为与稀疏块对角矩阵的乘法要快得多。
对于后者，准备开销似乎可以忽略不计N这使得它总体上比循环快 3...4 倍。这是一个很好的结果。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

高效实现一系列矩阵向量乘积/特定“张量”矩阵乘积的相关文章

GCC：分段错误和调试程序仅在优化时崩溃

这是线程的后续内容 C 分段错误也许 GDB 在骗我 https stackoverflow com questions 22828609 c segmentation fault and maybe gdb is lying to me
matlab中的排列函数是如何工作的

这是一个有点愚蠢的问题但我似乎无法弄清楚排列在 matlab 中是如何工作的以文档为例 A 1 2 3 4 permute A 2 1 ans 1 3 2 4 到底是怎么回事这如何告诉 matlab 3 和 2 需要交换哇这是我迄
matlab中的正则逻辑回归代码

我正在尝试正则化 LR 在 matlab 中使用以下公式很简单成本函数 J theta 1 m sum y i log h x i 1 y i log 1 h x i lambda 2 m sum theta j 梯度 J theta t
计算 [1..N] 中前导 1 下面有 K 个零位的整数？（没有 HW POPCNT 的连续范围的 popcount）

I have following task Count how many numbers between 1 and N will have exactly K zero non leading bits e g 710 1112 will
如何使用 MATLAB 的 substruct 函数创建表示使用“end”的引用的结构？

我想使用substruct http www mathworks com help matlab ref substruct html函数创建一个结构体以供使用subsref 目的是使用索引字符串subsref而不是通常的符号因为我正在
如何使用 MPI_Scatterv 将矩阵的行发送到所有进程？

我正在使用 MPI 接口我想分割一个矩阵按行并将各个部分分配给每个进程例如我有这个7x7的方阵M M 0 00 1 00 2 00 3 00 4 00 5 00 6 00 7 00 8 00 9 00 10 00 11 00 12
使用实际值检查 cvxpy 中的约束是否正确

在 cvxpy 中解决优化问题时是否有一种好方法可以通过用实际值替换优化变量来检查约束是否有效我有一个复杂的优化问题 100 多个约束但我知道最佳解决方案应该是什么但是 cvxpy 失败并显示错误消息ValueError Rank
gcc 没有小字符串优化吗？

Most std string实现包括 GCC 使用小字符串优化例如有一个answer https stackoverflow com a 21710033 2640636讨论这个今天我决定检查我编译的代码中的字符串在什么时候被移
访问图像的 Windows“标签”元数据字段

我正在尝试进行一些图像处理所以现在我正在尝试读取图像 exif 数据有 2 个内置函数可用于读取图像的 exif 数据问题是我想读取图像标签 exifread and imfinfo这两个函数都不显示图像标签 Is there any
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
“Desort”向量（撤消排序）

在Matlab中 sort返回排序后的向量和索引向量显示哪个向量元素已移动到以下位置 v ix sort u Here v是一个包含所有元素的向量u 但已排序 ix是一个向量显示每个元素的原始位置v in u 使用 Matlab 的语法
在matlab中绘制给定区域内（两个圆之间）的向量场

我想在 Matlab 中绘制下面的向量场 u cos x x 0 y y 0 v sin x x 0 y y 0 我可以在网格中轻松完成例如 x 和 y 方向从 2 到 2 x 0 2 y 0 1 x y meshgrid 2 0 2 2
给定协方差矩阵，在Matlab中生成高斯随机变量

Given a M x M期望的协方差 R 以及所需数量的样本向量 N计算一个N x M高斯随机向量 X在普通 MATLAB 中即不能使用r mvnrnd MU SIGMA cases 不太确定如何解决这个问题通常你需要一个协方差并且意
@(t)在Matlab中是什么意思？ [复制]

这个问题在这里已经有答案了正如标题所示考虑到下面的上下文 t 在 Matlab 中到底意味着什么 computeNumericalGradient 是一个函数 cofiCostFunc 也是一个接受一堆参数的函数问题是 t 对 cof
如何在MATLAB中显示由三个矩阵表示的图像？

我有 3 个相同大小的 2D 矩阵假设 200 行和 300 列每个矩阵代表三种基本颜色红色绿色和蓝色之一的值矩阵的值可以在 0 到 255 之间现在我想组合这些矩阵以将它们显示为彩色图像 200 x 300 像素我怎样
MATLAB 类的 Description 和DetailedDescription 属性

内置 MATLAB 类具有 Description 和 DetailedDescription 属性的值 gt gt handle ans meta class handle Package meta Properties Name han
如何在 MATLAB 中绘制纹理映射三角形？

我有一个三角形 u v 图像中的坐标我想在 3D 坐标处绘制这个三角形 X Y Z 与图像中的三角形进行纹理映射 Here u v X Y Z都是具有三个元素的向量代表三角形的三个角我有一个非常丑陋缓慢且令人不满意的解决方案其中我
MATLAB 列含义的内存分析

我正在使用 MATLAB 配置文件来使用命令观察内存 profile memory on profile clear my code profile report and i got this table 1 我想问一下什么意思已分配内存
将 Matlab 的 datenum 格式转换为 Python

我刚刚开始从 Matlab 迁移到 Python 2 7 在读取 mat 文件时遇到一些问题时间信息以 Matlab 的日期数字格式存储对于那些不熟悉它的人日期序列号将日历日期表示为自固定基准日期以来已经过去的天数在 MATLAB
如何使用SIFT算法计算两幅图像的相似度？

我已经用过SIFT http en wikipedia org wiki Scale invariant feature transform实施安德里亚维达尔迪 http www vlfeat org overview sift html

随机推荐

如何将数据存储到数据库(sqlite)

在 iOS 上我想使用 sqlite 将用户数据存储在数据库中对于该设计 Xib 文件用户名密码出生日期作为文本字段并采用按钮填写所有文本字段后单击按钮时所有数据都存储在数据库中我假设您已经了解 Outlet 的工作原理以及如
如何将额外的属性字段添加到 asp.net 下拉列表中

下面我可以设置值和文本 dropListUserImages DataValueField Value dropListUserImages DataTextField Text dropListUserImages Items Add n
JavaScript 匿名构造函数：!function(){}();

我见过在 JavaScript 中创建匿名构造函数的语法 var Application Application function window Application Application property Application me
在 Access 中对链接的 Excel 表执行 SQL 更新

使用 Access 2010 我将多个 Excel 表导入到 Access 中并构建了允许用户更新信息并向表添加信息的表单这些表单的工作方式是在 VBA 中动态生成 SQL alter 和 update 语句然后运行DoCmd Run
Python C API：如何使用 Py_eval_input 获取 PyRun_String 以使用导入的模块？

PyRun String random randint 1 10 Py eval input globals globals 返回错误 Traceback most recent call last File
当自动高度已设置时，Ext js 动态设置网格高度的问题

当初始设置的自动高度为 true 时我试图切换网格的高度我希望能够在网格变得大于浏览器视图时切换高度网格位于没有外部视口的普通页面上如果我尝试设置这样的高度那么我就会松开滚动条我可以在 firebug 中看到溢出设置为可见而不是
无法使用 std=c++11 设置 Eclipse Juno C++

我有 Eclipse Juno C 构建 ID 20120614 1722 我尝试使用指令 std c 11 或 std c 0x 设置编译器调用参数但在编译下面的代码时 Eclipse Juno 中没有工具设置至少对于 Mac 因此
致命错误：Python.h：没有这样的文件或目录 - 未使用 python-devel 解决[重复]

这个问题在这里已经有答案了此问题与之前的问题类似但无法使用相同的建议来解决我正在使用 Centos 7 在运行 Python 3 5 最新稳定版本的虚拟环境中我尝试安装psycopg2通过使用 pip3 pip easy inst
如何在OpenGL/GLUT中计算用鼠标移动相机的观察点？

这对我来说解释起来会很混乱所以请耐心等待我已经在我的相机类中实现了大多数类型的移动和旋转一切都可以通过键盘进行现在我想实现鼠标我像这样捕获鼠标移动 define SENSITIVITY 25 0f void main void g
使用覆盖 new[] 运算符创建字符串数组

我们和我的朋友一起制作了一个带有覆盖 new 和 new 运算符的程序我发现当我尝试使用以下代码创建字符串数组时 string Test1 new string 10 函数返回无效指针通常它的值向前移动 8 位我正在将程序编译到 x6
使用摘要异步签署 pdf

我正在尝试执行以下设置来签名 pdf 分为客户端和服务器之间的异步步骤服务器接收 pdf 并计算其摘要服务器将摘要发送给客户端客户端稍后签署哈希值客户端将签名发送给服务器服务器将签名嵌入到 pdf 中我主要立足于PDF 签名摘要
在组件构造函数上使用“@Lazy”是否等于注释每个参数？

在春天考虑 Service类具有以下自动装配构造函数 public DogService Lazy CatService catService Lazy MouseService mouseService this catService
如何使我的剑道下拉列表只读？

我有一个下拉列表我需要使其仅在用户打开页面时只读但需要在单击编辑图标后启用它您可以执行以下操作 var dataSource dropdownElement data kendoDropDownList 使kendo下拉列表只读 da
当我们单击带有打印窗口的屏幕中的任意位置时，引导模式背景不会消失

我在引导模式上使用打印按钮问题是一旦我单击屏幕的任何其他区域模态背景就不会消失当打印窗口打开时当我们关闭打印窗口然后单击屏幕的任何其他区域为了更好地理解你可以看到这张图片这是我的代码
将键添加到空 hstore 列

根据 postgres 文档您可以向 hstore 列添加一个键如下所示 UPDATE tab SET h h c gt 3 但它似乎只有在 hstore 字段不为空时才有效例如 postgres create table htest
引脚内带有用户图像的自定义标记

I am trying to display users on a map I have already implemented the map in the app but now I am trying to make custom m
MediaPlayer.start() 也应该是一个新线程吗？

这里的教程解释了服务实际上使用主线程所以它使用prepareAsync为避免阻塞UIS http developer android com guide topics media mediaplayer html asyncprepare
ASP.NET MVC 5身份应用程序用户作为外键

我知道 Visual Studio 2013 明天将正式发布希望会有更多随附文档特别是有关 ASP NET Identity 的文档我希望与此同时有人可以帮助我我想做的就是获取当前登录用户的 UserID 作为我称为 Retaile
jQuery：复选框不会失去焦点（模糊）[IE]

我有一个脚本可以让表格行在单击复选框后移动到顶部在这里查看我的问题 jQuery 将表格行移动到第一个位置然后返回 https stackoverflow com questions 9699081 jquery move table
高效实现一系列矩阵向量乘积/特定“张量”矩阵乘积

我有一个特殊的算法作为最后的步骤之一我需要执行 3 D 数组与 2 D 数组的乘法以便 3 D 数组的每个矩阵切片与 3 D 数组的每一列相乘二维数组换句话说如果说A is an N x N x N矩阵和B is an N x

高效实现一系列矩阵向量乘积/特定“张量”矩阵乘积

高效实现一系列矩阵向量乘积/特定“张量”矩阵乘积 的相关文章

随机推荐

热门标签

高效实现一系列矩阵向量乘积/特定“张量”矩阵乘积的相关文章