Google erklärt Ausfall der Google-Dienste
Durch einen Ausfall diverser Google-Dienste erlebten gestern Millionen Nutzer eine kurze Auszeit, so waren zum Beispiel Hangouts, Google Drive, Google+ und Gmail betroffen. Ende September 2013 hatte Google den letzten größeren Gmail-Ausfall, damals entschuldigte man sich und plante das Netzwerk aufzurüsten, sodass ein so technisch gelagerter Ausfall nicht mehr vorkommen sollte.
Der gestrige Ausfall hat laut Google für die meisten Nutzer nur 25 Minuten angedauert, lediglich 10 Prozent mussten mehr als 30 Minuten hinnehmen. Der Fehler ist nun behoben und Google teilt mit, dass man nun noch mehr Prüfungen und Monitoring einbauen wolle, sodass diese Art des Problems nicht wieder auftauchen sollte. Ein System, welches Konfigurations-Dateien generiert, generierte durch einen Fehler falsche Konfigurationen.
Diese fehlerhaften Konfigurationen gelangten für 15 Minuten auf die Live-Server, sodass die Anfragen der Benutzer ignoriert wurden und Fehler produzierten. Wenige Augenblicke später bekam das interne Team den Alarm und 12 Minuten verbrachte man mit Debugging und der Behebung des Fehlers. 26 Minuten nach dem Alarm war die neue Konfiguration auf den Live-Servern und für die meisten Benutzer lief wieder alles, wie sonst gewohnt.
Nun will man weiter forschen und die Fehlerquelle eliminieren, auch will man an der Geschwindigkeit arbeiten, in der man Fehler behebt. Konfigurationsdateien sollen nun zusätzliche Prüfmechanismen durchlaufen.
Während Google Probleme hatte, ließen es sich die Twitter-Accounts von Yahoo Mail und Outlook.com nicht nehmen, darüber zu twittern. Sie sprachen über den Ausfall und dass es nun Zeit wäre, andere Dienste zu testen. Ich behaupte einfach mal, dass in einer Krisensituation auch bei Yahoo und Outlook nicht schneller agiert worden wäre.
Übrigens: Mein erster Blick bei Problemen fällt immer erst auf die Twitter-Suche, da sich hier unwahrscheinlich viele Benutzer melden, wenn bei größeren Diensten etwas ausfällt, ferner gibt es noch das Service-Dashboard von Google, welches über Ausfälle informiert.
@tomrudi Abgesehen davon, dass es mich auch nerven würde wenn es immer auf der ersten Seite stehen würde und ich erst mal eine Seite weiter blättern müsste… ich nutze Flipboard aus vielerlei Gründen (wie bspw. wie dein Fall) nicht.
@tomrudi Ich nutze Flipboard nicht. Deshalb auch meine Nachfrage, denn ich dachte, die ersten fünf Zeilen des Artikels hast Du als „Ego-Vorspann“ bezeichnet. Gefragt – beantwortet – gut ist. 😉
@tomrudi: Nutze Flipboard ebenfalls nicht. Dachte nicht, dass es anders aussieht als bei RSS
‚behaupte einfach mal, dass in einer Krisensituation auch bei Yahoo und Outlook nicht schneller agiert worden wäre‘
Ich denke auch der Gesamtverlauf zeigt ja das bei Google das Fehlermanagment gut funktioniert. Überhaupt kein Grund sich aufzuregen. Google insgesamt ist einfach inzwischen sehr komplex, da kann auch schon mal was ausfallen ..
Wir hatten hier in Berlin(!!) in meiner Gegend im Dezember 2 mal Stromausfall – und das hat jeweils über ne Stunde gedauert ..
Sorry, aber ich kann eigentlich nur sagen: ver****t gucke reaktionszeit seitens google. anders kann man das bei derart komplexen und großen systemen nicht nennen.
hier läuft scheinbar einiges richtig – und der service ausfall von 30 minuten? gut, verbesserungspotential ist immer da, aber mein ISP hat im jahr mehr ausfälle als google.