commit 7c5486490554694e03531d6acd734d7eec70d999
parent 2bb6f5c8dda0a4a4c0c8041788177b88ae2ff2da
Author: Ivan Gankevich <igankevich@ya.ru>
Date: Wed, 1 Nov 2017 14:05:07 +0300
Edit p5.
Diffstat:
2 files changed, 13 insertions(+), 8 deletions(-)
diff --git a/arma-thesis-ru.org b/arma-thesis-ru.org
@@ -2150,7 +2150,7 @@ arma.plot_io_events(names)
видеокарте:
- она содержит трансцендентные функции (гиперболические косинусы и комплексные
экспоненты);
-- она вычисляется на большой четырехмерной области \(t,x,y,z\);
+- она вычисляется на большой четырехмерной области \((t,x,y,z)\);
- она явная и не имеет информационных зависимостей между отдельными точками в
измерениях \(t\) и \(z\).
@@ -2169,7 +2169,12 @@ arma.plot_io_events(names)
Код, вычисляющий потенциал скорости, был переписан на языке OpenCL и его
производительность сравнивалась с реализацией на OpenMP.
-
+Для каждой реализации замерялось время работы выбранных подпрограмм и время
+передачи данных между устройствами. Поле потенциала скорости вычислялось для
+одной точки по оси \(t\), 128 точек по оси \(z\), расположенных под
+взволнованной поверзностью, и для каждой точки по оси \(x\) и \(y\)
+четырехмерной сетки \((t,x,y,z)\). Между запусками программы изменялся размер
+сетки по оси \(x\).
**** Производительность OpenCL-решателя, вычисляющего поле потенциала скорости.
diff --git a/arma-thesis.org b/arma-thesis.org
@@ -2102,7 +2102,7 @@ addition to this, three-dimensional velocity potential field
formula\nbsp{}eqref:eq-phi-3d is particularly suitable for computation by GPUs:
- it contains transcendental functions (hyperbolic cosines and complex
exponents);
-- it is computed over large four-dimensional \(t,x,y,z\) region;
+- it is computed over large four-dimensional \((t,x,y,z)\) region;
- it is explicit with no information dependencies between individual points in
\(t\) and \(z\) dimensions.
These considerations make velocity potential field computation on GPU
@@ -2123,11 +2123,11 @@ field computation, we benchmarked simplified version of\nbsp{}eqref:eq-phi-3d:
Velocity potential computation code was rewritten in OpenCL and its performance
was compared to an existing OpenMP implementation.
-For each implementation the overall performance of the solver for a particular
-time instant was measured. Velocity field was computed for one \(t\) point, for
-128 \(z\) points below wavy surface and for each \(x\) and \(y\) point of
-four-dimensional \((t,x,y,z)\) grid. The only parameter that was varied between
-subsequent programme runs is the size of the grid along \(x\) dimension.
+For each implementation running time of selected subroutines and time spent for
+data transfer between devices was measured. Velocity potential field was
+computed for one \(t\) point, for 128 \(z\) points below wavy surface and for
+each \(x\) and \(y\) point of four-dimensional \((t,x,y,z)\) grid. Between
+programme runs the size of the grid along \(x\) dimension was varied.
A different FFT library was used for each version of the solver: GNU Scientific
Library (GSL)\nbsp{}cite:galassi2015gnu for OpenMP and clFFT