使用GPU加速BigInteger计算

2024-01-22

我几乎完成了处理一些非常大的整数（大约 2 的 100,000,000 次方）的算法。由于该算法不是内存密集型的，因此需要在内存充足的 16 核服务器上编写几个小时的高度并行代码。我使用 .NET 4 中的 BigInteger 类。

算法的细节并不重要，但就上下文而言，以下是对这些整数执行的操作的相当详尽的列表以及算法的一些显着特征：

加法/减法。
大数乘以小数。
大数除以小数（例如 2）。
基数 2 日志。
基础 2 电源。
比较两个或多个大数（最小/最大）。
没有任何质数的参与。
该算法经过专门设计，不占用内存，因为内存访问对性能的影响大于某些智能即时计算的性能影响。然而，如果内存访问得到改善，该算法可以合理地受益。

我已经尽可能地优化了代码，现在分析仅显示两个瓶颈：

计算如此大的数字以 2 为底的 Log。
检查这些数字中二进制数字的预定义模式。这是因为访问 BigInteger 基础数据的唯一方法是首先使用 ToByteArray 而不是就地操作。此外，对字节大小的块进行操作对性能没有帮助。

考虑到内存访问和日志操作，我开始考虑 GPU 以及是否可以有效地卸载一些工作。我对 GPU 知之甚少，只知道它们针对浮点运算进行了优化。

我的问题是，使用 GPU .NET 这样的库，如何在 GPU 上处理如此大的数字？我可以以某种方式利用浮点优化来计算如此大的数字的 Log 吗？

寻找制定策略的起点。

我正在寻找 C# 中的 GPU 工作，并正在考虑 Tidepowerd.com GPU.NET 和 CUDAfy.NET。当我上次检查时，Nvidia 特定的和 CUDAfy 都不支持单声道。但它们都允许在 GPU 上运行的 C# 中看起来相当正常的代码。

另外，您是否考虑过使用 3d 方库？有几个非常好的 BigInteger 库，也是开源的。 GMP很好而且免费；http://gmplib.org/ http://gmplib.org/，至少有一个 C# 包装器（我对此没有经验）http://www.emilstefanov.net/Projects/GnuMpDotNet/ http://www.emilstefanov.net/Projects/GnuMpDotNet/

.NET 中的 BigInteger 类是不可变的，根据我的经验，这并不方便。如果您有 2 个大小相同的整数（大约 100MB），则添加操作会生成第三个 100MB BigInt。例如，如果修改两个原始文件之一，则可以更快地完成。

C = A + B means allocating 100MB for C (this is what BigInt does)
A = A + B means you no longer have the original A, but a much faster calculation

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用GPU加速BigInteger计算的相关文章

机器Epsilon精度差异

我正在尝试计算 C 中双精度数和浮点数的机器 epsilon 值作为学校作业的一部分我在 Windows 7 64 位中使用 Cygwin 代码如下 include
如何从 Visual Studio 将视图导航到其控制器？

问题是解决方案资源管理器上有 29 个项目而且项目同时具有 ASP NET MVC 和 ASP NET Web 表单结构在MVC部分中 Controller文件夹中有大约100个子文件夹每个文件夹至少有3 4个控制器视图完全位于不同
free 和 malloc 在 C 中如何工作？

我试图弄清楚如果我尝试从中间释放指针会发生什么例如看下面的代码 char ptr char malloc 10 sizeof char for char i 0 i lt 10 i ptr i i 10 ptr ptr ptr pt
如何从本机 C(++) DLL 调用 .NET (C#) 代码？

我有一个 C app exe 和一个 C my dll my dll NET 项目链接到本机 C DLL mynat dll 外部 C DLL 接口并且从 C 调用 C DLL 可以正常工作通过使用 DllImport mynat dl
如何使从 C# 调用的 C（P/invoke）代码“线程安全”

我有一些简单的 C 代码它使用单个全局变量显然这不是线程安全的所以当我使用 P invoke 从 C 中的多个线程调用它时事情就搞砸了如何为每个线程单独导入此函数或使其线程安全我尝试声明变量 declspec thread 但
需要帮助优化算法 - 两百万以下所有素数的总和

我正在尝试做一个欧拉计划 http projecteuler net问题我正在寻找 2 000 000 以下所有素数的总和这就是我所拥有的 int main int argc char argv unsigned long int su
人脸 API DetectAsync 错误

我想创建一个简单的程序来使用 Microsoft Azure Face API 和 Visual Studio 2015 检测人脸遵循 https social technet microsoft com wiki contents ar
如何定义一个可结构化绑定的对象的概念？

我想定义一个concept可以检测类型是否T can be 结构化绑定 or not template
两个类可以使用 C++ 互相查看吗？

所以我有一个 A 类我想在其中调用一些 B 类函数所以我包括 b h 但是在 B 类中我想调用 A 类函数如果我包含 a h 它最终会陷入无限循环对吗我能做什么呢仅将成员函数声明放在头文件 h 中并将成员函数定义放在实现文
如何在 Linq to SQL 中使用distinct 和 group by

我正在尝试将以下 sql 转换为 Linq 2 SQL select groupId count distinct userId from processroundissueinstance group by groupId 这是我的代码
C 函数 time() 如何处理秒的小数部分？

The time 函数将返回自 1970 年以来的秒数我想知道它如何对返回的秒数进行舍入例如对于100 4s 它会返回100还是101 有明确的定义吗 ISO C标准没有说太多它只说time 回报该实现对当前日历时间的最佳近似结
有没有办法让 doxygen 自动处理未记录的 C 代码？

通常它会忽略未记录的 C 文件但我想测试 Callgraph 功能例如您知道在不更改 C 文件的情况下解决此问题的方法吗设置变量EXTRACT ALL YES在你的 Doxyfile 中
C# 中的 IPC 机制 - 用法和最佳实践

不久前我在 Win32 代码中使用了 IPC 临界区事件和信号量 NET环境下场景如何是否有任何教程解释所有可用选项以及何时使用以及为什么微软最近在IPC方面的东西是Windows 通信基础 http en wikipedia org
对于某些 PDF 文件，LoadIFilter() 返回 -2147467259

我正在尝试使用 Adob e IFilter 搜索 PDF 文件我的代码是用 C 编写的我使用 p invoke 来获取 IFilter 的实例 DllImport query dll SetLastError true CharSet
当文件流没有新数据时如何防止fgets阻塞

我有一个popen 执行的函数tail f sometextfile 只要文件流中有数据显然我就可以通过fgets 现在如果没有新数据来自尾部 fgets 挂起我试过ferror and feof 无济于事我怎样才能确定fgets 当
为什么 std::uint32_t 与 uint32_t 不同？

我对 C 有点陌生我有一个编码作业很多文件已经完成但我注意到 VS2012 似乎有以下语句的问题 typedef std uint32 t identifier 不过似乎将其更改为 typedef uint32 t identifi
在OpenGL中，我可以在坐标(5, 5)处精确地绘制一个像素吗？

我所说的 5 5 正是指第五行第五列我发现使用屏幕坐标来绘制东西非常困难 OpenGL 中的所有坐标都是相对的通常范围从 1 0 到 1 0 为什么阻止程序员使用屏幕坐标窗口坐标如此严重最简单的方法可能是通过以下方式设置投影以匹配渲
指针和内存范围

我已经用 C 语言编程有一段时间了但对 C 语言还是很陌生有时我对 C 处理内存的方式感到困惑考虑以下有效的 C 代码片段 const char string void where is this pointer variable l
现代编译器是否优化乘以 1 和 -1

如果我写 template
从 mvc 控制器使用 Web api 控制器操作

我有两个控制器一个mvc控制器和一个api控制器它们都在同一个项目中 HomeController Controller DataController ApiController 如果我想从 HomeController 中使用 Dat

随机推荐

Android - 用 @IntDef 替换参数化枚举

如何避免参数化枚举与 IntDef 我想保留一些与每个枚举类型关联的静态详细信息例如关联的 URl 关联的可绘制对象等 TYPE ONE R string res Urls URL1 TYPE TWO R string res Urls
如何防止Xcode每次都重建项目

我有一个 Mac OS X 应用程序由一个主要目标和一个依赖框架组成自从在我的 Mac OS X 应用程序上启用代码签名后我注意到每次运行 Xcode 时都会重建主要目标即使我没有触及任何代码行这是一个问题因为依赖框架需要知道主
如何更改多处理模块使用的序列化方法？

如何更改Python使用的序列化方法multiprocessing图书馆特别是默认的序列化方法使用pickle具有该版本 Python 的默认 pickle 协议版本的库默认的pickle协议在Python 2 7中是版本2 在Pyt
为什么是24位寄存器？

在我的工作中我处理不同的微控制器微处理器和 DSP 处理器其中许多都有 24 位寄存器和计数器我知道如何使用它们这不是我的问题我的问题是为什么他们有 24 位寄存器为什么不把它做成32位的呢据我所知这不是大小的问题因为寄
根据另一个参考数组从一个数组中选择密切匹配

我有一个数组A和一个参考数组B 尺寸为A至少和B e g A 2 100 300 793 1300 1500 1810 2400 B 4 305 789 1234 1890 B实际上是指定时间信号中峰值的位置并且A包含稍后时间的峰值位置
序列化代码示例中的无限循环

看看下面的代码here https web archive org web 20151025040111 http blogs msdn com 80 b sowmy archive 2006 03 26 561188 aspx 它是关于在
如何使用 Jest 运行单个测试？

我在文件 fix order test js 中有一个适用于嵌套子项的测试运行以下命令会运行文件中的所有测试 jest fix order test 如何只运行一个测试下面的代码不起作用因为它搜索指定的正则表达式的文件 jest
Windows：检测右 alt 是否在当前布局中生成 Ctrl+Alt (AltGr)

Windows 中的某些键盘布局例如 US QWERTY 将右 Alt 视为常规 Alt 键而其他键盘布局例如 US International 将其视为 AltGr 并在按下时同时生成 Ctrl 和 Alt 键 Microsoft
通过身份验证从 https 下载文件

我有一个 Python 2 6 脚本可以从 Web 服务器下载文件我希望这个脚本传递用户名和密码用于在获取文件之前进行身份验证并且我将它们作为 url 的一部分传递如下所示 import urllib2 response urll
android 中如何导航到另一个页面？

我是安卓新手请告诉我如何在 android 中导航到新页面提前致谢编辑如何从现有活动开始新活动在 Android 中导航到另一个页面意味着您必须启动另一个 Activity 要开始新活动请使用此 Intent intent n
使用 postgres 表序列而不是共享 hibernate_sequence

当我对表执行任何操作时它总是显示错误 Hibernate select nextval hibernate sequence 2019 07 20 16 15 44 877 WARN 58376 nio 9000 exec 1 o h e
按修改日期而不是发布日期对 Jekyll 帖子进行排序？

对于经常更新帖子的人来说有必要根据帖子从新到旧进行排序最后修改日期而不是 Jekyll 默认按发布日期排序似乎没有简单的方法可以实现这一点我已经阅读并测试了几乎所有的方法这是有效的部分符合预期用过这个宝石https github
在linux中安装jdk 1.7时出错[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案当我使用以下命令在 Oracle Linux 中安装 jdk 1 7 时 rpm ivh jdk 7u9 linux i586 rpm 但是我收到以下
使用正则表达式捕获两个单词之间的文本

我正在尝试使用 CSharp 中的正则表达式获取两个关键字之间的文本虽然我已经找到了一个具有相同标题的主题但该主题是关于查找方括号之间的文本这相当容易因为您可以使用
为什么 SQLAlchemy count() 比原始查询慢得多？

我正在使用 SQLAlchemy 和 MySQL 数据库我想计算表中的行数大约 300k SQL炼金术count http docs sqlalchemy org ru latest orm query html sqlalchemy
警告：在此函数中使用未初始化的“”[-Wuninitialized]

以下程序编译时没有警告 O0 include
GitHub Action：如何从表达式求值中获取值并将其分配给环境变量

环境表达式通常直接赋值如下例所示 name set up env var env TAG v1 2 3 run echo TAG 但是如何从 shell 脚本评估中获取值呢例如在我的终端中我可以通过以下方式获取当前标签git des
CMake rpm 在 /etc/init.d 中安装文件

我想安装一个文件 etc init d 目录我已经写了代码 INSTALL FILES CMAKE SOURCE DIR app script appd DESTINATION etc init d appd 但是当我使用 cmake 运
Facebook SDK 4.5 iOS 9

我遇到了新 FBSDK 的问题每当我尝试调用登录方法 logInWithReadPermissions 时我都会收到以下错误消息错误 canOpenUrl url fbauth2 失败错误 null 我的配置 plist 文件遵循 i
使用GPU加速BigInteger计算

我几乎完成了处理一些非常大的整数大约 2 的 100 000 000 次方的算法由于该算法不是内存密集型的因此需要在内存充足的 16 核服务器上编写几个小时的高度并行代码我使用 NET 4 中的 BigInteger 类算法的细

使用GPU加速BigInteger计算

使用GPU加速BigInteger计算 的相关文章

随机推荐

热门标签

使用GPU加速BigInteger计算的相关文章