commit e8814dafa68e71ce4a19b64d1a10f66941cff16c
parent 590318dbe0529bcd9ab894f1e2d3138a72f96004
Author: Ivan Gankevich <igankevich@ya.ru>
Date: Tue, 31 Oct 2017 11:49:57 +0300
Edit p3.
Diffstat:
2 files changed, 14 insertions(+), 3 deletions(-)
diff --git a/arma-thesis-ru.org b/arma-thesis-ru.org
@@ -1801,6 +1801,17 @@ arma.plot_ar_cubes_2d(3, 3, xlabel="Индекс части (X)", ylabel="Инд
#+RESULTS: fig-ar-cubes
[[file:build/ar-cubes-ru.pdf]]
+Каждая часть имеет трехмерный индекс и состояние завершения. Алгоритм начинается
+с отправки всех объектов, содержащих эту информацию, в очередь. После этого
+параллельные потоки запускаются, каждый поток последовательно ищет первую часть,
+для которой все зависимости удовлетворены (путем проверки состояния каждой из
+частей), извлекает эту часть из очереди, генерирует взволнованную поверзность
+для этой части и устанавливает состояние завершения. Алгоритм заканчивается,
+когда очередь становится пустой. Доступ к очереди из разных потоков
+синхронизируется посредством блокировок. Алгоритм подходит для SMP машин, а для
+MPP части, от которых зависит данная, должны быть предварительно скопированы на
+узел, на котором будут проводится вычисления.
+
**** Производительность реализаций на OpenMP и OpenCL.
**** Производительность ввода-вывода.
**** Параллельное вычисление поля потенциала скорости.
diff --git a/arma-thesis.org b/arma-thesis.org
@@ -1780,9 +1780,9 @@ that parallel threads start, each thread finds the first part for which all
dependencies are satisfied (by checking the completion status of each part),
removes the part from the queue, generates wavy surface for this part and sets
completion status. The algorithm ends when the queue becomes empty. Access to
-the queue is synchronised by locks. The algorithm is suitable for SMP machines,
-for MPP the copying of dependent parts needs to be done prior to computation of
-each part.
+the queue from different threads is synchronised by locks. The algorithm is
+suitable for SMP machines, for MPP all parts on which the current one depends,
+dependent parts needs to be copied to the node where computation is carried out.
So, the AR model algorithm is made parallel by implementing minimalistic job
scheduler, in which