为什么 mex 文件中的 OpenMP 仅产生 1 个线程?

2024-05-12

我是 OpenMP 新手。我有以下代码,使用配置了 MSVS2010 的 Matlab mex 可以正常编译。计算机有 8 个可用处理器(我也使用 matlabpool 检查过)。

#include "mex.h"
#include <omp.h>

typedef unsigned char uchar;
typedef unsigned int uint;
//Takes a uint8 input array and uint32 index array and preallocated uint8 array the same
//size as the first one and copies the data over using the indexed mapping
void mexFunction( int nlhs, mxArray *plhs[], int nrhs, const mxArray*prhs[] ) 
{
    uint N = mxGetN(prhs[0]);
    mexPrintf("n=%i\n", N); mexEvalString("drawnow");
    uchar *input = (uchar*)mxGetData(prhs[0]);
    uint *index = (uint*)mxGetData(prhs[1]);
    uchar *output = (uchar*)mxGetData(prhs[2]);

    uint nThreads, tid;
#pragma omp parallel private(tid) shared(input, index, output, N, nThreads) num_threads(8) 
    {
        tid = omp_get_thread_num();

        if (tid==0) {
            nThreads = omp_get_num_threads();

        }

        for (int i=tid*N/nThreads;i<tid*N/nThreads+N/nThreads;i++){
            output[i]=input[index[i]];
        }
    }
    mexPrintf("nThreads = %i\n",nThreads);mexEvalString("drawnow");
}

我得到的输出是

n=600000000
nThreads = 1

为什么我请求 8 个线程,但只创建了 1 个线程?


叹。通常,花费数小时尝试并失败,然后在发布到 SO 后 5 分钟找到答案。

该文件需要与 openmp 支持混合

mex mexIndexedCopy.cpp COMPFLAGS="/openmp $COMPFLAGS"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 mex 文件中的 OpenMP 仅产生 1 个线程? 的相关文章

随机推荐