arma-thesis

git clone https://git.igankevich.com/arma-thesis.git
Log | Files | Refs | LICENSE

commit 7c5486490554694e03531d6acd734d7eec70d999
parent 2bb6f5c8dda0a4a4c0c8041788177b88ae2ff2da
Author: Ivan Gankevich <igankevich@ya.ru>
Date:   Wed,  1 Nov 2017 14:05:07 +0300

Edit p5.

Diffstat:
arma-thesis-ru.org | 9+++++++--
arma-thesis.org | 12++++++------
2 files changed, 13 insertions(+), 8 deletions(-)

diff --git a/arma-thesis-ru.org b/arma-thesis-ru.org @@ -2150,7 +2150,7 @@ arma.plot_io_events(names) видеокарте: - она содержит трансцендентные функции (гиперболические косинусы и комплексные экспоненты); -- она вычисляется на большой четырехмерной области \(t,x,y,z\); +- она вычисляется на большой четырехмерной области \((t,x,y,z)\); - она явная и не имеет информационных зависимостей между отдельными точками в измерениях \(t\) и \(z\). @@ -2169,7 +2169,12 @@ arma.plot_io_events(names) Код, вычисляющий потенциал скорости, был переписан на языке OpenCL и его производительность сравнивалась с реализацией на OpenMP. - +Для каждой реализации замерялось время работы выбранных подпрограмм и время +передачи данных между устройствами. Поле потенциала скорости вычислялось для +одной точки по оси \(t\), 128 точек по оси \(z\), расположенных под +взволнованной поверзностью, и для каждой точки по оси \(x\) и \(y\) +четырехмерной сетки \((t,x,y,z)\). Между запусками программы изменялся размер +сетки по оси \(x\). **** Производительность OpenCL-решателя, вычисляющего поле потенциала скорости. diff --git a/arma-thesis.org b/arma-thesis.org @@ -2102,7 +2102,7 @@ addition to this, three-dimensional velocity potential field formula\nbsp{}eqref:eq-phi-3d is particularly suitable for computation by GPUs: - it contains transcendental functions (hyperbolic cosines and complex exponents); -- it is computed over large four-dimensional \(t,x,y,z\) region; +- it is computed over large four-dimensional \((t,x,y,z)\) region; - it is explicit with no information dependencies between individual points in \(t\) and \(z\) dimensions. These considerations make velocity potential field computation on GPU @@ -2123,11 +2123,11 @@ field computation, we benchmarked simplified version of\nbsp{}eqref:eq-phi-3d: Velocity potential computation code was rewritten in OpenCL and its performance was compared to an existing OpenMP implementation. -For each implementation the overall performance of the solver for a particular -time instant was measured. Velocity field was computed for one \(t\) point, for -128 \(z\) points below wavy surface and for each \(x\) and \(y\) point of -four-dimensional \((t,x,y,z)\) grid. The only parameter that was varied between -subsequent programme runs is the size of the grid along \(x\) dimension. +For each implementation running time of selected subroutines and time spent for +data transfer between devices was measured. Velocity potential field was +computed for one \(t\) point, for 128 \(z\) points below wavy surface and for +each \(x\) and \(y\) point of four-dimensional \((t,x,y,z)\) grid. Between +programme runs the size of the grid along \(x\) dimension was varied. A different FFT library was used for each version of the solver: GNU Scientific Library (GSL)\nbsp{}cite:galassi2015gnu for OpenMP and clFFT