Структурированный блок программы

}

Одномоментно, критическую секцию может выполнять только одна нить из всех нитей с данным именем. Если критическая секция уже выполняется какой-либо нитью P0, то все другие нити, выполнившие директиву для секции с данным именем, будут заблокированы, пока нить P0 не закончит выполнение данной критической секции, после чего одна из заблокированных на входе нитей войдет в секцию. Если на входе в критическую секцию стояло несколько нитей, то одна из них случайным образом выбирается, остальные заблокированные нити продолжают ожидание. Критические секции, не имеющие имен ассоциируются с одним и тем же именем критической секции.

Частым случаем использования критических секций на практике является обновление общих переменных. Например, если переменная SUM является общей и оператор вида SUM=SUM+Expr находится в параллельной секции программы, то при одновременном выполнении данного оператора несколькими нитями можно получить некорректный результат. Чтобы избежать такой ситуации можно воспользоваться механизмом критических секций или специально предусмотренным для таких случаев оператором atomic.

Пример: иллюстрирует моделирование очереди, в которой задание выбирается из очереди и обрабатывается. Для защиты от многократной выборки нитями из очереди одного и того же задания операция выборки должна выполняться в критической секции. Т.к. две очереди в этом примере идентичны, то они защищены критическими секциями с разными именами: xaxis и yaxis.

#pragma omp parallel shared(x, y) private(x_next, y_next)

{

#pragma omp critical ( xaxis )

x_next = dequeue(x);

work(x_next);

#pragma omp critical ( yaxis )

y_next = dequeue(y);

work(y_next);

}

Вычисление максимального значения элементов массива a. В программе выполнено итерационное распараллеливание с использованием критической секции внутри каждой порции итераций.

Массив a разбивается на части(цикл по i) для поиска максимального значения в каждой порции элементов массива, критическая секция выполняет обновление значения общей переменной max по следующему принципу: если какая-то нить находит новое максимальное значение, начинает выполняться блок критической секции, в этом случае все нити останавливают свою работу и по очереди входят в критическую секцию, выполняя обновление значение max.

После того, как все нити по очереди прошли критическую секцию и обновили значение max, поиск максимального значения продолжается в параллельном режиме в каждой порции каждой нити.

В данном примере критическая секция не имеет имени.

#include <omp.h>

#include <stdio.h>

#include <stdlib.h>

Void main()

{

int i, max;

int num_threads=2;

int a[10];

for (i = 0; i < 10; i++) {

a[i] = rand()/1000;

printf("%d\n", a[i]);

}

max = a[0];

omp_set_num_threads(num_threads);

#pragma omp parallel for private(i)

for (i = 1; i < 10; i++)

{

if (a[i] > max)

{

#pragma omp critical // если нашли новый максимум, корректируем значение общей переменой max

if (a[i] > max)

max = a[i];

printf("Thread %d max=%d\n", omp_get_thread_num(), max);

}

printf("max = %d\n", max);

}

3. atomic гарантирует, что специфическая ячейка памяти обновляется атомарно (элементарно), в отличие от возможного обновления её несколькими, одновременно пишущими нитями. Данная директива относится к идущему непосредственно за ней оператору, гарантируя корректную работу с общей переменной, стоящей в левой части конструкции оператор-выражение,для предыдущего примераSUM=SUM+Expr –это переменная SUM,стоящая в левой частиприсваивания. Для исключения условия «гонки» (race condition) все модификации ячеек в параллельном режиме должны быть защищены директивойatomic.

Синтаксис директивы atomic:

#pragma omp atomic

Оператор-выражение

, где оператор-выражение должен иметь одну из следующих форм:

x binop = выражение
x++
++x
x—
--x

В предыдущих выражениях:

x- переменная.

выражение - должно быть выражением скалярного типа.

binop - должен быть одним из следующих операторов: +, *, -, /, &, |, <<,или>>.

По сути atomic и criticalрешают одну и ту же проблему, но директива atomicболее эффективна, чем critical.

Пример: Следующий пример исключает условие «гонки», т.е. одновременное изменение элемента x несколькими нитями, путем использования директивы atomic:

#pragma omp parallel for shared(x, y, n)

for (i=0; i<n; i++) {

#pragma omp atomic

x[i] += work1(i);

y[i] += work2(i);

}

Преимущество использования директивы atomic в этом примере состоит в том, что директива позволяет изменить значения двух различных элементов x параллельно. Если вместо директивы atomic была бы использована директива critical, то все модификации элементов x должны были быть выполнены последовательно (хотя и в не гарантированном порядке).

Заметим, что директива atomic приемлема только к оператору, непосредственно следующему за директивой. И как следствие, в этом примере, элемент y не модифицируется атомарно.

4. barrier выполняет явную синхронизацию работы всех нитей в группе. При достижении оператора barrier, каждая нить останавливается и ожидает, пока остальные нити достигнут этой точки, после чего все нити продолжают работать дальше в параллельном режиме.

Синтаксис директивы barrier:

#pragma omp barrier

5. flushПоскольку в современных параллельных вычислительных системах может использоваться сложная структура и иерархия памяти, пользователь должен иметь гарантии того, что в необходимые ему моменты времени каждая нить будет видеть единый согласованный образ памяти. Для этих целей и предназначена директива flush.

flush определяет пересечение нитей (cross-thread) в точке оценки, где требуется гарантия того, что все нити в группе имеют одно и то же видение некоторых объектов памяти. Это означает, что предыдущие вычисления выражений, которые ссылаются на эти объекты памяти, были завершены, а последующие вычисления не начаты.

Синтаксис директивы flush:

#pragma omp flush [(список)]

Все переменные, которые требуют синхронизации, должны быть перечислены в списке директивы. Если в этом списке присутствует указатель, то осуществляется сброс самого указателя, а не числового значения объекта, на который он указывает.

Директива flush без списка синхронизирует все разделяемые переменные (такой способ синхронизации будет иметь значительные накладные расходы по сравнению с директивой flush со списком). Директива flush без списка может использоваться в директивах:

barrier.
При ходе или выходе из конструкцииcritical.
При ходе или выходе из конструкцииordered.
При выходе из конструкцииparallel.
При выходе из конструкцииfor.
При выходе из конструкцииsections.
При выходе из конструкцииsingle.

Директиву flush нельзя использовать, если присутствует оператор nowait(т.е. выполнение без синхронизации).

Ограничения к использованию директивы flush:

1. Переменная, определенная в директиве flush, не должна быть ссылкой.

2. программная конструкция, которая содержит директиву barrier, должна быть блоком (или составным оператором).

6. ordered -директивадолжна находиться внутри конструкций for или parallel for.Программный блок, непосредственно следующий за директивой ordered, выполняется в порядке, в котором итерации цикла выполнялись бы в последовательном режиме.

Синтаксис директивыordered:

#pragma omp ordered

⇐ Предыдущая 14 15 16 17 18 192021 22 23 Следующая ⇒