存储在数组中的值在OpenMP gcc中更改

问题描述 投票:1回答:2

我最近开始使用gcc探索OpenMP。基本上我正在执行这个代码来演示Eratosthenes的筛子。

void main() {
    int n, iterate_limit;

    printf("Enter the number limit for sieve of erathoros:");
    scanf("%d", &n);
    iterate_limit = (int) sqrt((double) n);
    printf("iterate limit is %d\n", iterate_limit);
    int primes[n], prime_index = 0;
    int non_primes[n], non_prime_index = 0;

    #pragma omp parallel for
    for (int i = 2; i <= iterate_limit; i++) {
        if (isprime(i) == 1) {
            int num = i;

            printf("prime is %d\n", i);
            primes[prime_index] = num;
            prime_index++;
            num += i;
            while (num < n) {
                non_primes[non_prime_index] = num;
                non_prime_index++;
                num += i;
            }
        }
    }

    printf("primes are\n"); 
    for (int i = 0; i < prime_index; i++) {
        printf("%d\n ", primes[i]);  
    }
}

理想情况下,数组primes应包含要消除其倍数的所有数字,它对25或50的输入执行。但奇怪的是,当给出更大的数字作为输入(如99或125)时,primes数组中的值与预期不同。尽管printf("prime is %d\n",i);给出了有效的输出。以下是125输出的输出:

Enter the number limit for sieve of erathoros:125
iterate limit is 11
[New LWP 17676]
[New LWP 17677]
[New LWP 17678]
prime is 11
prime is 5
prime is 7
prime is 2
prime is 3
primes are
60
 63
 66
 69
 72
 [LWP 17676 exited]
[LWP 17677 exited]
[LWP 17674 exited]
[Inferior 1 (process 17674) exited normally]

为什么我得到60,63,66,69,72而不是2,3,5,7,11?

我正在运行Ubuntu 18。

编辑:

正如Osiris指出的那样,我没有检查我的non_primes数组中的重复数据,这些数据似乎覆盖了我的primes数组。重复消除确实提供了临时解决方案。但是,由于John Bollinger提到的数据竞争,增加输入数量或增加线程数会产生不正确的结果

c gcc parallel-processing openmp
2个回答
4
投票

你有两个问题,一个是战术问题,一个是战略问题。

战术问题是OpenMP并不能减轻您对数据竞争的关注。 OpenMP线程共享变量primesprime_index等。你依靠它。但是你的所有线程都读取和写入prime_index,它不是原子的,甚至不是volatile,没有任何线程间同步。这会产生数据争用,因此程序的行为是不确定的。从语言的角度来看,这就是故事的结尾。 “未定义”意味着它所说的。

在实践中,数据竞争的通常表现形式涉及不同的线程,没有看到彼此对相关共享变量的写入,或者以令人惊讶的顺序看到它们。沿着这些方向的东西似乎就是这里发生的事情。

战略问题是,Eratosthenses筛选是并行化的不良选择。或者,至少它的外环是。这是因为跨(外部)循环迭代的数据依赖性。为了使Sieve正常工作,需要按顺序筛选每个素数的倍数,因为相关的素数测试用文字表示“将候选X作为较小数字的倍数筛选出来?”如果外部循环的迭代并行而不是串行运行,则无法可靠地回答这个问题。


这两个问题是分离和独立的,因为解决数据争用问题并不能解决数据依赖性问题,并且通过大量工作可以编写并行的Eratosthenes筛,正确地观察数据依赖性(I实际上已经完成了它,虽然在Java中,而不是C),并且由于数据竞争,这种方法仍然可能被打破。

顺便说一下,即使是正确有效的并行Sieve也会受到数据依赖性的影响,因为满足它们会限制它具有相当差的加速因子。


3
投票

如果删除OpenMP,则仍会得到错误的输出,因为您正在写出non_primes数组的边界。

没有比qazxsw poi更少的qazxsw poi非素数,这是正确的,但你不止一次写一些值。

例如,在n,你在n数组中写出除2之外的每个偶数。在i=2你写了6,9,12,15,18,..,其中偶数现在是数组的两倍元素。您需要检查数字是否已经是数组的元素。

© www.soinside.com 2019 - 2024. All rights reserved.