Hadoop hat zwei Kernkomponenten, die HDFS und GARN. HDFS ist zum Aufbewahren der Daten, GARN ist für die Verarbeitung der Daten. HDFS ist Hadoop verteiltes Dateisystem, es hat Namenode wie Meisterservice und Datenknoten wie Sklavendienst.
Namenode ist die kritische Komponente von Hadoop die die Metadaten von Daten speichert, die in gespeichert sind HDFS. Wenn die Namenode ausfällt, ist der gesamte Cluster nicht zugänglich, es ist der Single Point of Failure (SPOF). Die Produktionsumgebung wird also haben Namenode Hochverfügbarkeit um den Produktionsausfall zu vermeiden, wenn einer Namenode fällt aus verschiedenen Gründen wie Maschinenabsturz, geplante Wartungsarbeiten usw.
Hadoop 2.x bietet die Machbarkeit, wo wir zwei haben können Namenoden, einer wird sein Aktive Namenode und ein anderer wird sein Standby-Namenode.
Aktivieren Namenode Hochverfügbarkeit erfordert Tierpfleger was für das automatische Failover zwingend erforderlich ist. ZKFC (Zookeeper-Failover-Controller) ist ein Tierpfleger Client, der verwendet wird, um den Zustand von Namenode.
In diesem Artikel werden wir aktivieren Namenode Hochverfügbarkeit In Cloudera-Manager.
1. Einloggen in Cloudera-Manager.
http://Your-IP: 7180/cmf/Haus.
2. Im Cluster (tekmint) Aktionsaufforderung, wählen Sie „Dienst hinzufügen”.
3. Wählen Sie den Dienst „Tierpfleger”.
4. Wählen Sie die Server aus, auf denen wir haben werden Tierpfleger Eingerichtet.
5. Wir werden haben 3 Tierpfleger Formen Kollegium für Tierpfleger. Wählen Sie die Server wie unten beschrieben aus.
6. Konfigurieren Sie die Tierpfleger Eigenschaften, hier haben wir die Standardeinstellungen. In Echtzeit müssen Sie separate Verzeichnis-/Einhängepunkte zum Speichern haben Tierpfleger Daten. In Teil 1, wir haben erklärt über Speicherkonfiguration für jeden Dienst. Klicken 'fortsetzen' fortfahren.
7. Die Installation beginnt, sobald sie installiert ist Tierpfleger Wird gestartet. Sie können die Hintergrundvorgänge hier anzeigen.
8. Nach erfolgreichem Abschluss des obigen Schrittes wird der Status ‘Fertig’.
9. Jetzt, Tierpfleger wurde erfolgreich installiert und konfiguriert. Drücke den 'Fertig’.
10. Sie können die Tierpfleger Dienst auf dem Cloudera-Manager Armaturenbrett.
11. Gehe zu Cloudera-Manager –> HDFS –> Aktionen –> Hochverfügbarkeit aktivieren.
12. Geben Sie die Nameservice-Name wie "Nameservice1” – Dies ist ein gemeinsamer Namespace für Active- und Standby-Namenode.
13. Wähle aus Zweite Namenode wo wir Standby haben werden Namenode.
14. Hier wählen wir aus master2.tecmint.com für Standby Namenode.
15. Wähle aus Tagebuch Knoten, dies sind obligatorische Dienste für die Synchronisierung Aktiv und Standby Namenode.
16. Wir machen Quorum-Journal indem Sie die Tagebuch Knoten in 3 Servern wie unten erwähnt. Wählen Sie 3 Server aus und klicken Sie auf „OK“.
17. Klicken 'Weitermachen' fortfahren.
18. Geben Sie die Journalknoten Verzeichnispfad. Wir müssen nur den Pfad angeben, während dieses Verzeichnis während der Installation automatisch vom Dienst selbst erstellt wird. Wir erwähnen als ‘/jn’
. Klicken 'Weitermachen' fortfahren.
19. Es startet die Aktivierung der Hohe Verfügbarkeit.
20. Sobald alle Hintergrundprozesse abgeschlossen sind, erhalten wir ‘Fertig’-Status.
21. Schließlich erhalten wir eine Benachrichtigung ‘Hochverfügbarkeit erfolgreich aktiviert’. Klicken 'Fertig’.
22. Überprüfen Sie die Aktiv und Standby-Namenode indem du zu gehst Cloudera-Manager –> HDFS –> Instanzen.
23. Hier können Sie zwei pi**en Namenoden, wird man im ‘Aktiv' Zustand und ein anderer wird in 'Bereithalten' Zustand.
In diesem Artikel sind wir Schritt für Schritt durchgegangen, um die Aktivierung zu ermöglichen Namenode Hochverfügbarkeit. Es wird dringend empfohlen, zu haben Namenode Hochverfügbarkeit in allen Clustern in einer Echtzeitumgebung. Bitte posten Sie Ihre Zweifel, wenn Sie während dieses Vorgangs auf einen Fehler stoßen. Wir werden sehen Ressourcenmanager Hochverfügbarkeit im nächsten Artikel.