英特尔编译器 (C++) 在 std::vector 上减少 OpenMP 问题

2023-11-25

从OpenMP 4.0开始,支持用户定义的缩减。所以我在 C++ 中准确地定义了 std::vector 的减少here。它在 GNU/5.4.0 和 GNU/6.4.0 上运行良好,但在 intel/2018.1.163 上它会返回随机值以进行减少。

这是例子:

#include <iostream>
#include <vector>
#include <algorithm>
#include "omp.h"

#pragma omp declare reduction(vec_double_plus : std::vector<double> : \
                              std::transform(omp_out.begin(), omp_out.end(), omp_in.begin(), omp_out.begin(), std::plus<double>())) \
                    initializer(omp_priv = omp_orig)

int main() {

    omp_set_num_threads(4);
    int size = 100;
    std::vector<double> w(size,0);

#pragma omp parallel for reduction(vec_double_plus:w)
    for (int i = 0; i < 4; ++i)
        for (int j = 0; j < w.size(); ++j)
            w[j] += 1;

    for(auto i:w)
        if(i != 4)
            std::cout << i << std::endl;

    return 0;
}

每个线程将所有 w 条目(其本地 w)加 1,最后将所有条目加到一起(归约)。所有 w 条目的结果在 GNU 中都是 4,但在 intel 编译器中是随机的。有谁知道这里发生了什么吗?


这似乎是 Intel 编译器中的一个错误,我可以使用不涉及向量的 C 示例可靠地重现它:

#include <stdio.h>

void my_sum_fun(int* outp, int* inp) {
    printf("%d @ %p += %d @ %p\n", *outp, outp, *inp, inp);
    *outp = *outp + *inp;
}

int my_init(int* orig) {
    printf("orig: %d @ %p\n", *orig, orig);
    return *orig;
}

#pragma omp declare reduction(my_sum : int : my_sum_fun(&omp_out, &omp_in) initializer(omp_priv = my_init(&omp_orig))

int main()
{   
    int s = 0;
    #pragma omp parallel for reduction(my_sum : s)
    for (int i = 0; i < 2; i++)
        s+= 1;

    printf("sum: %d\n", s);
}

Output:

orig: 0 @ 0x7ffee43ccc80
0 @ 0x7ffee43ccc80 += 1 @ 0x7ffee43cc780
orig: 1 @ 0x7ffee43ccc80
1 @ 0x7ffee43ccc80 += 2 @ 0x2b56d095ca80
sum: 3

它将归约运算应用于原始变量before从原始值初始化私有副本。这会导致错误的结果。

您可以手动添加障碍作为解决方法:

#pragma omp parallel reduction(vec_double_plus : w)
{
  #pragma omp for
  for (int i = 0; i < 4; ++i)
    for (int j = 0; j < w.size(); ++j)
      w[j] += 1;
  #pragma omp barrier
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

英特尔编译器 (C++) 在 std::vector 上减少 OpenMP 问题 的相关文章

随机推荐

  • 编译器是否对异步方法链执行“返回值优化”

    不是传统意义上的返回值优化 但我想知道你什么时候会遇到这样的情况 private async Task Method1 await Method2 private async Task Method2 await Method3 priva
  • Objective-C 类参考:符号未找到错误

    我已经在这个 iPhone 应用程序上工作了一段时间了 我已经完全完成并可以使用它了 我正在扩展的项目是从在线颠覆存储库下载的 我的教授也给了我访问权限 我不小心没有下载 根 副本或类似的东西 所以我无法向存储库提交任何更改 在老师的帮助下
  • 为什么 stddef.h 不在 /usr/include 中?

    我已经编译了gnu标准库并将其安装在 GLIBC INST 现在 我尝试编译一个very简单的程序 仅使用一个 include include
  • 如何通过切片符号 a[::-1] 解释序列的反转

    来自python org 教程 切片索引有有用的默认值 省略的第一个索引默认为零 省略的第二个索引默认为被切片的字符串的大小 gt gt gt a hello gt gt gt print a 1 olleh 正如教程所说a 1 应该等于a
  • 将变量从 PHP 导出到 shell

    我正在尝试设置一个可以从 PHP 外部访问的变量 理想情况下 这应该是局部变量 但也欢迎环境变量 首先 我尝试过putenv 但这没有给出结果 php r putenv PHP TEST string 回显 PHP TEST 当我打电话时g
  • Altair 中 mark_text 的格式文本

    我正在尝试创建一个类似于以下内容的图表多行工具提示示例 但我想格式化正在打印的字符串 以便在末尾添加一些文本 我正在尝试修改这部分 Draw text labels near the points and highlight based o
  • 用于分割嵌套坐标字符串的正则表达式

    我有一个格式的字符串 1 2 2 3 3 4 具有任意数量的元素 我试图将它拆分为分隔坐标的逗号 即检索 1 2 2 3 and 3 4 我可以用Java正则表达式来做吗 我是一个十足的菜鸟 但希望 Java 正则表达式足够强大 如果不是
  • WebSphere 7. 从另一个应用程序注入 EJB

    我正在尝试使用 EJB 注释注入 EJB 当我将一个 EJB 注入同一只耳朵中的另一个 EJB 时 它工作正常 当我从同一耳朵的另一只耳朵将一个 EJB 注入另一个 EJB 时 服务器我得到一个异常 EJB 在调用期间抛出意外的 未声明的
  • 如何确定网络服务器运行的是 Linux 还是 Windows? [关闭]

    Closed 这个问题不符合堆栈溢出指南 目前不接受答案 我被要求查明某个特定站点是否运行 Windows 或 Linux 作为其网络服务器 通常我们可以访问 我只需上传一个 phpinfo 文件 这将为我提供所需的所有相关信息 但是我们
  • 适用于 Java 的 Eclipse IDE - 全深色主题

    有什么办法可以让Eclipse彻底变成黑暗IDE吗 这是一个Picture我要问的 我不介意花 1 小时的时间来做这样的事情 D EDIT As Konstantin Komissarchik said I had to modify my
  • 为 Actionbar SearchView 创建异步 ContentProvider

    我的 ActionBar 中有一个 SearchView 它与 ContentProvider 连接以提供搜索建议 这些建议并非来自数据库 与通常的 ContentProvider 一样 而是来自 Web 服务 这就是为什么我必须异步处理
  • 如何在 IIS7 中使用 gzip 压缩?

    我已经为IIS7安装了静态和动态压缩 并设置了这两个web config我的应用程序的值Virtual Folder等级 据我了解 我不再需要在服务器或站点级别启用压缩 并且我可以使用 web config 文件按文件夹进行管理 我的里面有
  • JavaScript 数组:获取项目的“范围”

    是否有与 ruby 相当的东西array n m 在 JavaScript 中 例如 gt gt a a b c d e f g gt gt a 0 2 gt a b c Use the array slice begin end 功能 v
  • 另一个组件中的 MVC 6 RC2 控制器

    在 MVC 6 RC1 中我们使用了IAssemlbyProvider接口来注册在运行时发现的程序集并注入其他控制器类型 以类似的方式时尚到这篇文章 现在随着 RC2 的发布IAssemblyProvider已被删除并更改为 见参考资料 目
  • 为函数的参数分配默认值的困难

    在一个类中 我定义了一个私有常量 我尝试使用该常量作为函数参数的默认值 class Foo instance variable private let DefaultValue 10 Compiler error Cannot use in
  • 将android logcat数据写入文件

    每当用户想要收集日志时 我想将 Android logcat 转储到文件中 通过 adb 工具 我们可以使用以下命令将日志重定向到文件adb logcat f filename 但是我如何以编程方式执行此操作 这是一个example读取日志
  • Collections.defaultdict 与普通 dict 的区别

    我已经阅读了 python 文档中的示例 但仍然无法弄清楚这个方法的含义 有人可以帮忙吗 这是 python 文档中的两个示例 gt gt gt from collections import defaultdict gt gt gt s
  • 使用 Java 进行 ElasticSearch 聚合

    我想在我的 java 应用程序中进行聚合 首先 我使用curl 构建了REST 查询 它看起来像 curl XGET localhost 9200 analysis search pretty H Content Type applicat
  • 根据设备(iPhone 或 iPad)不同的设备方向

    我正在开发一个具有以下要求的通用项目 对于 iPhone 我只想要纵向 对于 iPad 仅限风景 我该怎么做iOS 8 迅速 在我看来 按照 ScarletMerlin 的建议 更改 info plist 中的键是满足我必须满足的要求 每种
  • 英特尔编译器 (C++) 在 std::vector 上减少 OpenMP 问题

    从OpenMP 4 0开始 支持用户定义的缩减 所以我在 C 中准确地定义了 std vector 的减少here 它在 GNU 5 4 0 和 GNU 6 4 0 上运行良好 但在 intel 2018 1 163 上它会返回随机值以进行