commit c43623d890b8f25fbc4de753446823a5c1719574
parent 52b6312ac9f689a89879013dd499bc1821decaf1
Author: Ivan Gankevich <igankevich@ya.ru>
Date: Mon, 6 Feb 2017 12:18:43 +0300
Sync p1.
Diffstat:
2 files changed, 23 insertions(+), 11 deletions(-)
diff --git a/phd-diss-ru.org b/phd-diss-ru.org
@@ -2376,16 +2376,16 @@ arma.plot_factory_vs_openmp_overlap(
** Реализация для систем с распределенной памятью (MPP)
*** Обзор архитектур распределенных систем
Многие распределенные системы построены по принципу /субординации/: в каждом
-кластере выбирается главный узел, который управляет очередью задач решаемых на
-кластере и мониторингом их выполнения. Роль главного узла может задаваться как
-/статически/, путем выделения конкретного физического узла под нее, так и
-/динамически/, путем избрания какого-либо из узлов кластера главным. В первом
-случае отказоустойчивость обеспечивается посредством резервирования
-дополнительного свободного узла, который займет место главного в случае отказа
-оборудования. Во втором случае отказоустойчивость обеспечивается выбором нового
-главного узла из оставшихся в случае отказа текущего. Несмотря на то что
-динамический распределение ролей требует наличия распределенного алгоритма, этот
-подход становится все более и более популярным, поскольку не требует наличия
+кластере выбирается главный узел, который управляет очередью задач, планирует их
+запуск на подчиненных узлах и следит за их состоянием. Роль главного узла
+задается либо /статически/, путем выделения конкретного физического узла под
+нее, либо /динамически/, путем избрания какого-либо из узлов кластера главным. В
+первом случае отказоустойчивость обеспечивается посредством резервирования
+дополнительного свободного узла, который выполнит роль главного в случае отказа
+текущего. Во втором случае отказоустойчивость обеспечивается выбором нового
+главного узла из оставшихся. Несмотря на то что динамическое задание ролей
+требует наличия специализированного распределенного алгоритма, этот подход
+становится все более и более популярным, поскольку не требует наличия
простаивающих резервных узлов на случай отказа главного узла.
Алгоритмы выбора лидера (которые иногда называют алгоритмами распределенного
@@ -2395,7 +2395,7 @@ cite:tel2000introduction Тель определяет их как алгори
происходящем в /каждом/ параллельном процессе. Волновые алгоритмы не определены
для анонимных сетей, т.е. они работают только с теми параллельными процессами,
которые могут себя уникально идентифицировать. Однако, количество процессов,
-которых затрагивает "волна" может быть определено по мере выполнения алгоритма.
+которых затрагивает "волна", может быть определено по мере выполнения алгоритма.
В рамках распределенных систем это означает, что волновые алгоритмы подходят для
вычислительных кластеров с динамически меняющимся количеством узлов, так что
включение и выключение отдельных узлов не влияет на работу алгоритма.
diff --git a/phd-diss.org b/phd-diss.org
@@ -2231,6 +2231,18 @@ devices other than disks may be used as well.
** MPP implementation
*** Overview of distributed system architectures
+Many distributed systems are built on the principle of /subordination/: there is
+principal node in each cluster which manages job queue, schedules their
+execution on subordinate nodes and monitors their state. Principal role is
+assigned either /statically/ by an administrator to a particular physical node,
+or /dynamically/ by electing one of the cluster nodes as principal. In the
+former case fault tolerance is provided by reserving additional spare node which
+takes principal role when current principal fails. In the latter case fault
+tolerance is provided by electing new principal node from survived nodes.
+Despite the fact that dynamic role assignment requires specialised distributed
+algorithm, this approach becomes more and more popular as it does not require
+spare reserved nodes to recover from principal node failure.
+
*** Cluster node discovery algorithm
**** Introduction.
*** Fail over algorithm