为什么 Python 和 CUDA 不支持半精度复杂浮点运算？

2024-02-12

NumPY 有复杂64 https://docs.scipy.org/doc/numpy/user/basics.types.html对应于两个float32。

但它也有 float16，但没有 complex32。

怎么会？我有涉及 FFT 的信号处理计算，我认为我可以使用complex32，但我不知道如何到达那里。我特别希望 NVidia GPU 能够加速cupy https://cupy.chainer.org/.

然而 float16 似乎是slower https://devtalk.nvidia.com/default/topic/974803/gpu-accelerated-libraries/half-precision-cufft-transforms/在 GPU 上而不是更快。

为什么半精度不受支持和/或被忽视？

同样相关的是为什么我们没有复整数 https://stackoverflow.com/questions/13863523/is-it-possible-to-create-a-numpy-ndarray-that-holds-complex-integers，因为这也可能会出现加速的机会 https://pdfs.semanticscholar.org/8347/9a33b8f1e1c86eb0e3731a1757cd20dd1381.pdf.

这个问题已经在 CuPy 存储库中提出了一段时间：

https://github.com/cupy/cupy/issues/3370 https://github.com/cupy/cupy/issues/3370

但目前还没有具体的工作计划；大多数事情仍然是探索性的。

锻炼起来并不简单的原因之一是没有numpy.complex32我们可以直接导入的数据类型（请注意，所有 CuPy 的数据类型只是 NumPy 的别名），因此当请求设备-主机传输时会出现问题。另一件事是，没有在 CPU 或 GPU 上编写的原生数学函数complex32，所以我们需要自己编写它们来进行转换、ufunc 等等。在链接的问题中，有一个 NumPy 讨论的链接，我的印象是目前尚未考虑它......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？的相关文章

NumPy“记录数组”或“结构化数组”或“recarray”

NumPy 结构化数组记录数组和记录数组之间有什么区别如果有的话 The NumPy 文档 http docs scipy org doc numpy user basics rec html暗示前两个是相同的如果是那么该对象
如何在迭代时使用 .delete() 删除 numpy 中的特定数组？

首先我读过这个问题 https stackoverflow com questions 1642730 how to delete columns in numpy array 我有一个 np array 来自图片 255 255 255
python：浮点数的最大公约数（gcd），最好在numpy中

我正在寻找一种有效的方法来用 python 确定两个浮点数的最大公约数例程应具有以下布局 gcd a b rtol 1e 05 atol 1e 08 Returns the greatest common divisor of a and
如何将图像从 np.uint16 转换为 np.uint8？

我正在创建一个图像 image np empty shape height width 1 dtype np uint16 之后我将图像转换为 BGR 模型 image cv2 cvtColor image cv2 COLOR GRAY2B
python np.round() 带有大于 2 的小数选项

Python 有默认的 round 函数但我正在使用 cython 进行编程并希望用 numpy 函数替换 pythonic 代码然而我在终端中进行实验时得到了以下结果 gt gt gt np around 1 23456789 1
将 3 维 numpy 数组传递给 C

为了提高速度我正在为我的 Python 程序编写一个 C 扩展并在尝试传入 3 维 numpy 数组时遇到一些非常奇怪的行为它适用于二维数组但我确信我用指针搞砸了一些东西试图让它适用于第三维但这是奇怪的部分如果我只传入一个 3
PIL/scipy.misc 中的 imresize 仅适用于 uint8 图像？有什么替代方案吗？

看来imresize实施于PIL scipy misc仅适用于 uint8 图像 gt gt gt import scipy misc gt gt gt im np random rand 100 200 gt gt gt print im
Python 多元简单线性回归

注意这是not关于多元回归的问题这是一个关于在 Python NumPy 2 7 中多次进行简单单变量回归的问题我有两个m x n arrays x and y 这些行彼此对应每对都是用于测量的 x y 点的集合那是 plt p
使用自定义颜色渐变填充两条线之间的区域

我正在做一项几乎已经完成的作业但我想对其添加一些小改动尝试使用基于温度的颜色图而不是简单的颜色来填充两条线之间的区域绘制线条的方式本质上使它们成为独立的实体所以我知道我可能需要两个彼此相遇或重叠的颜色图来完成此任务但我不太确定如何
使用 python 中的硬件 rng

是否有任何现成的库以便 numpy 程序可以使用 intel 硬件 prng rdrand 来填充随机数缓冲区如果做不到这一点有人可以为我指明一些我可以改编或使用的 C 代码的正确方向我将 CPython 和 Cython 与 nu
如何将样条拟合转换为分段函数？

假设我有 import numpy as np from scipy interpolate import UnivariateSpline true data I don t know this function x np linspac
如何在 ndarray 内创建一个球体？ [复制]

这个问题在这里已经有答案了我有一个 ndarray 大小32x32x32 我想在数组内创建一个球体其中心位于 x y 半径为 4 像素球体的值为 1 而数组的值为 0 这如何在 python 中完成这是生成数组的代码 import
使用 to_categorical 转换 np.array 时出现内存问题

我有一个像这样的 numpy 数组 0 1 1 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 1 我这样改造它以减少内存需求 x val x val asty
如何使用 Python Gekko 求解绝对值 abs() 目标？

使用 Python Gekko 中的 IPOPT 成功解决了具有平方目标的优化问题 from gekko import GEKKO import numpy as np m GEKKO x m Var y m Param 3 2 m Obj
NumPy 中按列增长矩阵

在纯Python中你可以很容易地逐列增长矩阵 data for i in something newColumn getColumnDataAsList i data append newColumn NumPy http en wiki
绘制到图像对象

我可以保存一个图imshow 因为它返回一个图像对象如下所示 image plt imshow list interpolation None 后来我想创建其中许多图像的动画将其保存在列表中并将其渲染为视频如果这种方法很愚蠢请告诉我
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模

随机推荐

绘制自定义组件

这是两个问题 1 是最重要的paint的成员Component使用代号为 1 的简单 2D 图形游戏的最佳方法是什么或者我什至不应该尝试它 2 为什么下面的代码会画出我的Component只是立即删除它我像这样初始化我的组件 prote
实体框架 ORA-00932：不一致的数据类型：“'预期 CLOB 为 CHAR”

Oracle ManagedDataAccess EntityFramework 6 122 1 0 库用于从 MVC ASP Net 应用程序访问 Oracle 数据库这是截至 2017 年 11 月 14 日来自 NuGet 的最新库
在C程序中，是否可以将所有全局变量重置为默认值？

我有一个旧版 C Linux 应用程序需要重用该应用程序使用了很多全局变量我想重用该应用程序的主要方法并在循环中调用它我发现当我在循环中调用 main 方法重命名为 callableMain 时应用程序行为不一致因为先前迭代中设
从 HTML 创建自动化、严格设计的多页 PDF 报告 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有哪些基于 Python 的优秀选项可以从 HTML 创建严格设计的 PDF 报告我附上了 PDF
将base64图像发布到android中的php服务器

我正在开发一个模块用户可以在其中将图像上传到服务器为此我必须将所选图像更改为 Base64 转换后我必须使用 Json POST 方法上传图像但每次应用程序崩溃并且 Logcat 都会出现此错误 Error converting
如何设置 ReSharper 默认公司和版权？

我刚刚安装了 Stylecop 4 5RC 和 ReSharper 当我创建一个新类时我发现我现在是合规的耶但我希望该公司是我的公司而不是 Microsoft 我还有太多事情要做不必担心更新版权文本默认情况下如何填写这些
Gradle 扩展：对于具有简单值的属性，可以使用普通 Kotlin 类型代替 Property 吗？

The Gradle 文档用于惰性配置 https docs gradle org current userguide lazy configuration html指出在扩展 DSL 类中诸如var someProperty defau
无法在android中连接websocket和wss

我正在尝试使用 org java websocket client WebSocketClient API 在 android 中连接安全 websocket 连接 wss 但无法与 https 连接然而它与 ws 这是我的代码 priv
如何旋转 pyplot.table 中的列标题？

我正在 matplotlib 中创建一个表但表头是长字符串表值是只有几位数字的数字这给我留下了两个不好的选择要么我的表格比必要的宽得多要么我的标题重叠为了解决这个问题我想旋转表格标题可能最多 90 度换句话说我想做thi
使用存储过程作为业务逻辑层

我工作的公司目前正在使用存储过程在 MsSQL 服务器后端作为其业务逻辑层实际的业务逻辑 DLL 仅调用 sProcs 并基本上管理 UI 事件数据绑定等我认为设置有问题尽管我不确定如何向同事解释顺便说一句该系统有效我工作
Laravel 8 错误类“App\User”未找到

我的 auth php 文件 providers gt users gt driver gt eloquent model gt App Models User class 用户控制器文件
使用 python 带有自签名证书的 ssl

我正在尝试使用我的自签名证书在 python 中构建一个简单的服务器我使用 makecert 创建了 cer pfx pvk 文件 context ssl create default context ssl Purpose CLIENT
C++ 中的彩色输出

有没有办法使用打印彩色输出iostream和Xcode 例如我希望能够打印Hello World with Hello red World蓝色和黄色的我怎样才能做到这一点您需要终端颜色代码对于 Linux 如下您的系统可能有所不
使用 iTextSharp 阅读 PDF 时出现奇怪的字符

我正在使用 iTextSharp 来阅读 PDF 文件我尝试使用以下简单的代码阅读第一页中的全文 var pdfReader new PdfReader
如何实现递归依赖于自身的反应式香蕉行为？

我有一个行为我想根据事件的发生和行为的当前值来更改其值在下面的示例中我有两个计数器它们根据布尔行为是 True 还是 False 进行更新事实上这段代码崩溃了 lt
什么是非法反射访问？

Java 9 中存在很多关于非法反射访问的问题我发现了很多关于解决错误消息的讨论但我很想知道非法反射访问实际上是什么所以我的问题是什么定义了非法反射访问以及什么情况会触发警告我认为它与 Java 9 中引入的封装原则有关但我找不
GCM PhoneGap 插件消息错误

我正在使用phonegap在android上实现GCM 在我向设备发送消息之前该过程运行良好当我的设备收到该消息时它会关闭并显示我的应用程序出现内部错误的消息该错误消息来自 dalvik VM 我仍在使用插件附带的演示应用程序进行
使用 Python 删除文件中的括号和文本

我有一个文本文件其中包含如下内容 Cl1 Cl 0 21988 6 0 2500 0 15016 5 0 01587 14 Uani 1 2 d S T P O1 O 1 05820 17 0 2500 0 48327 16 0 0206
C# [匿名\通用] 对象到 byte[] 没有 BinaryFormatter [在 .NET 4.5 中]？

BinaryFormatter效果很好但不存在于 NET 4 5 的可移植类库中我读到它是在 NET 4 6 Portable 中我还没有证实这一点因为当我在项目设置中更改为 4 6 时我收到警告消息 4 5 将自动成为目标除
为什么 Python 和 CUDA 不支持半精度复杂浮点运算？

NumPY 有复杂64 https docs scipy org doc numpy user basics types html对应于两个float32 但它也有 float16 但没有 complex32 怎么会我有涉及 FFT 的信

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？ 的相关文章

随机推荐

热门标签

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？的相关文章