arma-thesis

git clone https://git.igankevich.com/arma-thesis.git
Log | Files | Refs | LICENSE

commit c43623d890b8f25fbc4de753446823a5c1719574
parent 52b6312ac9f689a89879013dd499bc1821decaf1
Author: Ivan Gankevich <igankevich@ya.ru>
Date:   Mon,  6 Feb 2017 12:18:43 +0300

Sync p1.

Diffstat:
phd-diss-ru.org | 22+++++++++++-----------
phd-diss.org | 12++++++++++++
2 files changed, 23 insertions(+), 11 deletions(-)

diff --git a/phd-diss-ru.org b/phd-diss-ru.org @@ -2376,16 +2376,16 @@ arma.plot_factory_vs_openmp_overlap( ** Реализация для систем с распределенной памятью (MPP) *** Обзор архитектур распределенных систем Многие распределенные системы построены по принципу /субординации/: в каждом -кластере выбирается главный узел, который управляет очередью задач решаемых на -кластере и мониторингом их выполнения. Роль главного узла может задаваться как -/статически/, путем выделения конкретного физического узла под нее, так и -/динамически/, путем избрания какого-либо из узлов кластера главным. В первом -случае отказоустойчивость обеспечивается посредством резервирования -дополнительного свободного узла, который займет место главного в случае отказа -оборудования. Во втором случае отказоустойчивость обеспечивается выбором нового -главного узла из оставшихся в случае отказа текущего. Несмотря на то что -динамический распределение ролей требует наличия распределенного алгоритма, этот -подход становится все более и более популярным, поскольку не требует наличия +кластере выбирается главный узел, который управляет очередью задач, планирует их +запуск на подчиненных узлах и следит за их состоянием. Роль главного узла +задается либо /статически/, путем выделения конкретного физического узла под +нее, либо /динамически/, путем избрания какого-либо из узлов кластера главным. В +первом случае отказоустойчивость обеспечивается посредством резервирования +дополнительного свободного узла, который выполнит роль главного в случае отказа +текущего. Во втором случае отказоустойчивость обеспечивается выбором нового +главного узла из оставшихся. Несмотря на то что динамическое задание ролей +требует наличия специализированного распределенного алгоритма, этот подход +становится все более и более популярным, поскольку не требует наличия простаивающих резервных узлов на случай отказа главного узла. Алгоритмы выбора лидера (которые иногда называют алгоритмами распределенного @@ -2395,7 +2395,7 @@ cite:tel2000introduction Тель определяет их как алгори происходящем в /каждом/ параллельном процессе. Волновые алгоритмы не определены для анонимных сетей, т.е. они работают только с теми параллельными процессами, которые могут себя уникально идентифицировать. Однако, количество процессов, -которых затрагивает "волна" может быть определено по мере выполнения алгоритма. +которых затрагивает "волна", может быть определено по мере выполнения алгоритма. В рамках распределенных систем это означает, что волновые алгоритмы подходят для вычислительных кластеров с динамически меняющимся количеством узлов, так что включение и выключение отдельных узлов не влияет на работу алгоритма. diff --git a/phd-diss.org b/phd-diss.org @@ -2231,6 +2231,18 @@ devices other than disks may be used as well. ** MPP implementation *** Overview of distributed system architectures +Many distributed systems are built on the principle of /subordination/: there is +principal node in each cluster which manages job queue, schedules their +execution on subordinate nodes and monitors their state. Principal role is +assigned either /statically/ by an administrator to a particular physical node, +or /dynamically/ by electing one of the cluster nodes as principal. In the +former case fault tolerance is provided by reserving additional spare node which +takes principal role when current principal fails. In the latter case fault +tolerance is provided by electing new principal node from survived nodes. +Despite the fact that dynamic role assignment requires specialised distributed +algorithm, this approach becomes more and more popular as it does not require +spare reserved nodes to recover from principal node failure. + *** Cluster node discovery algorithm **** Introduction. *** Fail over algorithm