commit 537a59cb60685cc6a50ead175524af2d0d344e68
parent d76a9a3235b84a6e0183459dfba2b01c86be993e
Author: Ivan Gankevich <igankevich@ya.ru>
Date: Wed, 8 Nov 2017 14:24:25 +0300
Edit conclusions.
Diffstat:
2 files changed, 35 insertions(+), 35 deletions(-)
diff --git a/arma-thesis-ru.org b/arma-thesis-ru.org
@@ -3721,12 +3721,12 @@ title(xlab="Размер взволнованной поверхности", yla
:END:
Этот алгоритм в отличие от параллельной версии, использует копирование данных
-для того чтобы выполнить вычисления на других узлах кластера, и, поскольку
-пропускная способность сети гораздо меньше, чем у памяти, размер передаваемых по
-сети данных должен быть оптимизирован для получения большей производительности,
-чем на системе с общей памятью. Один из способов добиться этого\nbsp{}--- это
+для выполнения вычислений на других узлах кластера, и, поскольку пропускная
+способность сети гораздо меньше, чем у памяти, размер передаваемых по сети
+данных должен быть оптимизирован для получения большей производительности, чем
+на системе с общей памятью. Один из способов добиться этого\nbsp{}--- это
распределить части взволнованной поверхности между узлами кластера, копируя на
-узлы коэффициенты и необходимы точки на границах, и, копируя обратно
+узлы коэффициенты и необходимые точки на границах, и, копируя обратно
сгенерированную часть взволнованной поверхности. Авторегрессионные зависимости
не позволяют создать все части сразу и статически распределить их между узлами
кластера, поэтому части создаются динамически на первом узле, когда точки, от
@@ -3752,11 +3752,11 @@ title(xlab="Размер взволнованной поверхности", yla
параллельной.
- Конвейеры автоматически распределяют подчиненные объекты между доступными
узлами кластера, и приложение не имеет дела с такими низкоуровневыми деталями.
-- Нет необходимости реализовать минималистичный планировщик задач, которые
- определят последовательность выполнения задач (объектов), учитывая
+- Нет необходимости реализовать минималистичный планировщик задач, который
+ определяет последовательность выполнения задач (объектов), учитывая
авторегрессионные зависимости: порядок выполнения полностью определяется в
методе ~react~ руководящего объекта.
-- Нет необходимости в отдельной версии программы для машину с общей памятью,
+- Нет необходимости в отдельной версии программы для машины с общей памятью:
реализация работает прозрачно на любой количестве узлов, даже если планировщик
задач не запущен.
@@ -3779,12 +3779,12 @@ Bscheduler превосходит OpenMP как на одном, так и на
версии программы для Bscheduler, поскольку сканирование очереди задач не может
быть эффективно реализовано в рамках этого планировщика. В случае двух узлов
более высокая производительность объясняется большим суммарным количеством
-процессорных ядер (16), высокой пропускной способностью прямого сетевого
+процессорных ядер (16) и высокой пропускной способностью прямого сетевого
соединения. Таким образом, реализация распределенного алгоритма модели АР на
Bscheduler быстрее на системе с общей памятью ввиду более эффективной обработки
-авторегрессионных зависимостей, и его производительность масштабируется на
-большее количество ядер ввиду низких накладных расходов на передачу данных по
-прямому сетевому соединению.
+авторегрессионных зависимостей, а на системе с распределенной памятью его
+производительность масштабируется на большее количество ядер ввиду низких
+накладных расходов на передачу данных по прямому сетевому соединению.
#+name: fig-bscheduler-performance
#+begin_src R :file build/bscheduler-performance-ru.pdf
@@ -3812,17 +3812,17 @@ title(xlab="Размер взволнованной поверхности", yla
В изучении возможностей математического аппарата для имитационного моделирования
морского волнения, выходящего за рамки линейной теории волн, были достигнуты
следующие основные результаты.
-- Процесс АРСС был использован для моделирования морских волн произвольных
+- Процессы АР и СС были использованы для моделирования морских волн произвольных
амплитуд. Интегральные характеристики генерируемой взволнованной поверхности
были верифицированы путем сопоставления с характеристиками реальной морской
поверхности.
- Новый метод был использован для вычисления поля потенциала скорости под
- генерируемой поверхностью. Получившееся поле потенциалов скоростей было
- верифицировано путем сравнения с полем, вычисляемым по формулам из линейной
- теории волн. Новый метод эффективен с вычислительной точки зрения, поскольку
- все интегралы в его формуле записываются как преобразования Фурье, для
- которого существуют высокопроизводительные реализации.
-- Модель и метод были реализована для систем как с общей, так и с распределенной
+ генерируемой поверхностью. Получившееся поле было верифицировано путем
+ сравнения с полем, вычисляемым по формулам из линейной теории волн. Новый
+ метод эффективен с вычислительной точки зрения, поскольку все интегралы в его
+ формуле записываются как преобразования Фурье, для которого существуют
+ высокопроизводительные реализации.
+- Модель и метод были реализованы для систем как с общей, так и с распределенной
памятью, и в нескольких тестах показали масштабируемость на различном
количество ядер, которая близка к линейной. Модель АР более эффективна с
вычислительной точки зрения на центральном процессоре, нежели на видеокарте, и
diff --git a/arma-thesis.org b/arma-thesis.org
@@ -3629,9 +3629,10 @@ only for newer Bscheduler version, as queue scanning can not be performed
efficiently in this framework. In case of two nodes the higher performance is
explained by a greater total number of processor cores (16) and high network
throughput of the direct network link. So, Bscheduler implementation of
-distributed AR model algorithm is faster on single node due to more efficient
-autoregressive dependencies handling and its performance scales to a larger
-number of cores due to small data transmission overhead of direct network link.
+distributed AR model algorithm is faster on shared memory system due to more
+efficient autoregressive dependencies handling and its performance on
+distributed memory system scales to a larger number of cores due to small data
+transmission overhead of direct network link.
#+name: fig-bscheduler-performance
#+begin_src R :file build/bscheduler-performance.pdf
@@ -3658,20 +3659,19 @@ title(xlab="Wavy surface size", ylab="Time, s")
**** Research results.
In the study of mathematical apparatus for sea wave simulations which goes
beyond linear wave theory the following main results were achieved.
-- ARMA model was applied to simulation of sea waves of arbitrary amplitudes.
- Integral characteristics of generated wavy surface were verified by comparing
- to the ones of a real sea surface.
+- AR and MA models were applied to simulation of sea waves of arbitrary
+ amplitudes. Integral characteristics of generated wavy surface were verified
+ by comparing to the ones of a real sea surface.
- New method was applied to compute velocity potentials under generated surface.
- The resulting velocity potential field was verified by comparing it to the one
- given by formulae from linear wave theory for small-amplitude waves. For
- large-amplitude waves the new method gives a reasonably different field. The
- method is computationally efficient because all the integrals in its formula
- are written as Fourier transforms, for which there are high-performance
- implementations.
-- The model and the method were implemented for both SMP and MPP systems, and
- showed near linear scalability for different number of cores in several
- benchmarks. AR model is more computationally efficient on CPU than on GPU, and
- outperforms LH model.
+ The resulting field was verified by comparing it to the one given by formulae
+ from linear wave theory for small-amplitude waves. For large-amplitude waves
+ the new method gives a reasonably different field. The method is
+ computationally efficient because all the integrals in its formula are written
+ as Fourier transforms, for which there are high-performance implementations.
+- The model and the method were implemented for both shared and distributed
+ memory systems, and showed near linear scalability for different number of
+ cores in several benchmarks. AR model is more computationally efficient on CPU
+ than on GPU, and outperforms LH model.
**** Further research directions.
One of the topic of future research is studying generation of wave of arbitrary