死亡や税金、ディスク障害(十分な時間が与えられた場合でも、ノードやラックの障害が発生した場合など)と同様に、処理リソースの半分を失ったためパフォーマンスは低下します。 Hadoop分散ファイルシステム(HDFS)では不可欠です。示された例では、1つのラックが故障しても、クラスタは機能し続けることができます。処理リソースの半分を失ったため、パフォーマンスは低下しますが、システムはまだオンラインであり、すべてのデータは引き続き使用可能です。
<!ディスクドライブまたはスレーブノードに障害が発生した場合、HDFSの中央メタデータサーバー(NameNodeと呼ばれる)は、最終的に、障害が発生したリソースに格納されているファイルブロックが使用できなくなったことを認識します。たとえば、スレーブノード3に障害が発生した場合、ブロックA、C、Dが再現されていることを意味します。つまり、HDFSではこれらのブロックのコピーが少なすぎます。 HDFSは、ブロックが複製されていないことを検出すると、新しいコピーを注文します。 <! - 2 - >
この例を続けると、数時間後にスレーブノード3がオンラインに復帰したとします。一方、HDFSでは、すべてのファイルブロックが3つコピーされていることが保証されています。ブロックA、C、Dはそれぞれ4つのコピーを持ち、
重複しています。再構成されていないブロックと同様に、HDFS中央メタデータサーバもこれについて知り、削除されるすべてのファイルの1つのコピーを注文します。 <! - 3 - > データの可用性の良い結果の1つは、ディスク障害が発生した場合、故障したハードドライブを直ちに交換する必要がないことです。これは、より効果的に定期的にスケジュールされた間隔で行うことができます。