Resolved
Oct 24 at 08:47am CEST
Nach längerer Untersuchung war eine Verkettung von folgenden Problemen die Ursache für den Ausfall:
- Unser Cluster besteht aktuell aus 3 Nodes
- Einer davon, sollte ein RAM-Update erhalten
- Hierfür wurde der Node heruntergefahren
- Durch den Switch des Traffics auf Node 1 und 2, wurde deren Last zu groß
- Ein schneller Neustart des Node 3, führte aufgrund eines lange andauernden Sync-Prozesses für eine weitere Überlastung
- Infolgedessen, war das gesamte Cluster so überlasstet, dass D...