T-Mobile und der Netz-GAU

Na da hat sich T-Mobile ja schön in die Scheiße geritten! Ein einziger Stromausfall in einem Rechenzentrum des rosa Mobilriesen hat heute Deutschland-weit das GSM- und UMTS-Netz lahm gelegt.

Auch ich war ab 16 Uhr bis kurz vor Mitternacht von dem Debakel betroffen, über das auch heise online berichtet hat. Glücklicherweise hatte ich noch meinen Vodafone Communicator im Schrank liegen - so konnte ich wenigstens mit Low-Speed online gehen und mal via ICQ nachfragen, wo denn nun das Problem liegt.

Soweit ich gehört habe, soll es hier wohl ein Dokument über die genaue Ursache des Ganzen geben - leider konnte ich es mir nicht ansehen, da anscheinend aufgrund eines massiven Ansturms der Webserver von T-Mobile in die Knie gegangen ist.

Mich würde wirklich mal interessieren, ob für diesen massiven Fehler jemand aus dem Bereich der Netzwerk-Planung seinen (Akten-) Koffer packen muss. Von Redundanz und Hochverfügbarkeit haben die Menschen, die das Netz von T-Mobile geplant haben, anscheinend noch nie etwas gehört.

Lustige Randnotiz: sollte wirklich - wie gemunkelt wird - das Home Location Register von T-Mobile betroffen gewesen sein, so würde das bedeuten, dass heute weltweit T-Mobile-Kunden nicht telefonieren konnten. Denn: auch wenn man sich im Ausland ins Netz einbucht, wird hier in Deutschland bei T-Mobile im HLR nachgefragt, wer sich denn da gerade einwählen will.
Update:
Neuen Angaben zufolge war der Grund kein Stromausfall, sondern ein Software-Fehler, durch den alle 3 Systeme, die für das HLR zuständig sind, ausgefallen sind - damit wird meine lustige Randnotiz wohl zur traurigen Wahrheit.

Indes schockiert der Tagesspiegel mich - als Informatiker - mit dieser Aussage:

Die Panne war so gravierend, dass die Techniker zunächst offenbar noch nicht einmal wussten, wo genau das Netz ausgefallen war.
(Tagesspiegel-Artikel zum Netzausfall)

Vielleicht sollten die Jungs sich mal ein ordentliches Monitoring-Tool zulegen? Vielleicht erkennen sie ja dann eher, welche Server nicht mehr auf Status-Abfragen reagieren? Dafür ist das Zeug schließlich da!
Acht-Stunden-Offline Grüße, Kenny