Stuttgart 21/Stresstest/Richtlinienverstöße: Unterschied zwischen den Versionen

Version vom 11. Oktober 2011, 22:18 Uhr

→ Dies ist die Detaildarstellung des entsprechenden Abschnitts im Hauptartikel Stuttgart 21/Stresstest (wichtige Quellen dort unter Dokumente).

Richtlinien-Verstöße
Richtlinien-Verstöße, Methode
Regelwidrige Grenzen für Betriebsqualität
Betriebsqualität aus gekappter Streckenauswertung
Betriebsqualität allein aus Verspätungsveränderung
Betriebsqualität von Haltezeitverkürzung überlagert
Sensitivitäten kein Ersatz für Vollsimulation
Finaler Simulationslauf auch unvollständig
Test nur im Vergleich aussagefähig
Stresstest-Dokumentation nicht nachvollziehbar
Keine Belegungsgrade
Simulation nach ungültiger Prozessbeschreibung
Keine Modellzug-Spezifität
Richtlinien-Verstöße, Parameter
Kein Stress im Test
Haltezeitverlängerungen gekappt
Fahrzeitüberschüsse voll verwendet

Im Schlichterspruch zum Stresstest war die Anwendung "anerkannter Standards des Bahnverkehrs" gefordert worden. Eine solche weiter gefasste Prüfung der Prämissen des Stresstests auch im Vergleich zu internationalen Standards fand nicht statt. Es wiegt deshalb besonders schwer, dass sich in den Details der Durchführung des Stresstests zu Stuttgart 21 sogar eine Reihe von Verstößen gegen Bahn-interne Richtlinien finden. Besondere Bedeutung kommt dabei der Richtlinie 405 "Fahrwegkapazität" zu. Selbst diese Richtlinie ist argumentativ nicht geschlossen, da sie an vielen Stellen auf die Unter-Richtlinie 405.0105 "Theoretische Grundlagen" verweist, die noch nicht vorliegt.

Es wird eine unglaubliche Fülle an Richtlinienverstößen gezählt, aktuell allein KO-Kriterien (Stand ), von denen jedes für sich genommen den Stresstest ungültig macht. Es stellt sich die Frage, wie das passieren konnte und ob aus Fahrlässigkeit oder Vorsatz. Die Bahn selbst gibt die Antwort, offenbar war sie schon früh selbst nicht davon überzeugt, dass der Stresstest unter regulären Bedingungen bestanden werden könnte:

"Während SMA die Prämissen gleich zu Anfang festzurren wollte, wollte die Bahn diese im Prozess anpassen, damit der Stresstest für den Tiefbahnhof mit 49 Zügen auch bestanden werde." ^[1]

Es war also von der Bahn offen angekündigt worden, dass die Prämissen (die weitgehend von Richtlinien festgelegt sind) auf das gewünschte Stresstest-Ergebnis hin "angepasst" werden würden. Das erklärt die zahlreichen Richtlinienverstöße.

Einzelne Verstöße würden wohl nicht zwangsläufig ein Scheitern des Stresstests bedeuten, sind aber ein
– deutlicher Mangel.

Andere Richtlinienverstöße erscheinen als besonders schwerwiegend und als geeignet, den gesamten Stresstest in Frage zu stellen:
– KO-Kriterium.

Davon sind wiederum einzelne Verstöße so gravierend, so klar bewiesen und nicht wegzudiskutieren, dass sie bevorzugt in die öffentliche Diskussion gerückt werden sollten:
– KO-Kriterium von hervorgehobener Bedeutung, das in die öffentliche Diskussion gerückt werden sollte.

Inhaltsverzeichnis

1 RICHTLINIENVERSTÖSSE, METHODE
2 Sensitivitäten kein Ersatz für Vollsimulation
3 Simulation nur im Vergleich aussagefähig
4 Abschlussdokumentation nicht nachvollziehbar
5 Belegungsgrade sind nicht ermittelt
6 Test des Fahrplans oder der Infrastruktur?
7 Keine modellzugspezifische Verspätungsveränderung
8 Stresstest-Simulation auf Basis ungültiger Prozessbeschreibung
9 RICHTLINIENVERSTÖSSE, PARAMETER
10 Kein Stress im Test
11 Mangelhafte Berücksichtigung von Urverspätungen
12 Gekappte Haltezeitverlängerungen
13 Fahrzeitüberschüsse voll im Verspätungsabbau
14 Haltezeitverkürzung nicht für Betriebsqualität
15 Infrastrukturbewertung nicht nur aus Verspätungsabbau
16 Usw, usf.
17 Einzelnachweise

Machen Sie mit! Wollen Sie zu dieser Analyse beitragen oder haben Sie einen Fehler gefunden? Registrieren Sie sich oder melden Sie sich an (oben rechts) und helfen Sie mit bei der Aufklärungsarbeit oder eröffnen Sie ein neues Thema. Auf der Diskussionsseite kann ohne komplizierte Textformatierung mitgearbeitet werden. Bei strittigen Fragen hilft der Experten-Rat Stuttgart 21. Auf dieser Hauptseite bitte nur ausformulierte und belegte Aussagen eintragen. Oder unterstützen Sie unsere Arbeit mit einer Spende!

Dieser Artikel befindet sich noch im Aufbau. Inhalte und Quellenangaben sind unvollständig, alle wertenden Aussagen sind vorläufig. Jede Mithilfe oder Korrektur ist willkommen, gerne auf der Diskussionsseite – gleich registrieren/anmelden (rechts oben) – oder an

!

RICHTLINIENVERSTÖSSE, METHODE

Sensitivitäten kein Ersatz für Vollsimulation

Die Berechnung einer "Sensitivität" wie auch der "Finale Simulationslauf" der letzten verbliebenen Fehler besteht nur aus einzelnen max. wenigen Läufen des Simulationsmodells mit teilweise veränderten Parametern. Ein solcher Simulationslauf ist kein Ersatz für eine Vollsimulation von 100 Tagen unter Anpassung aller Parameter auf realistische Werte. Diesen Simulationsläufen fehlt einerseits die statistische Basis andererseits ist die gegenseitige Verstärkung der Einflussparameter nicht abgebildet.

Für den finalen Simulationslauf liegen die folgenden Dokumente vor, auf die in der in Klammern angegebenen Kurz-Zitierung referenziert wird:

10.10.2011, bahnprojekt-stuttgart-ulm.de, Bahn: Stesstest Stuttgart 21 Abschlussbericht (Doku. FS)
10.10.2011, bahnprojekt-stuttgart-ulm.de, SMA: Audit Finaler Simulationslauf (Audit FS)
10.10.2011, bahnprojekt-stuttgart-ulm.de, SMA: Anpassungen für finalen Simulationslauf (Anpassungen FS)

Die Sensitivitäten sind laut Aussage der Bahn (... Quelle) kein vollständiger Stresstest (mit 100 simulierten Betriebstagen). Der finale Simulationslauf besteht aus drei simulierten Tagen (Audit FS S. 7). Solche Sensitivitäten sind hilfreich für den Bediener des Modells, um vor Planung eines neuen kompletten Simulationslaufs ein Gefühl für die Auswirkung einzelner Parameter-Änderungen zu bekommen oder um Fehler im Modell aufzuspüren.

Sensitivitäten oder Einzelläufe sind jedoch nicht in Richtlinie 405 vorgesehen, schon gar nicht als Ersatz für eine Vollsimulation. Einerseits fehlt ihnen die statistische Basis der notwendigen 100 simulierten Tage zur Erlangung einer gültigen Aussage und andererseits erlaubt die Richtlinie auch nicht, stichprobenartig nur einzelne Parameter auf realistischere Werte zu setzen. Eine Simulation muss durchgehend mit realistischen Parametern (deren Realitätsnähe einzeln geprüft und nachgewiesen sein muss) und über die vollen 100 Tage durchgeführt werden, um eine belastbare Aussage zu erhalten. Es ist deshalb nicht nachvollziehbar, wie die SMA verschiedentlich "Sensitivitäten" zu einzelnen Mängeln als Abschluss der Untersuchung empfiehlt.

Die Bewertung der Sensitivitäten durch den Auditor SMA ist irrational und inkonsequent.

Sensitivitäten ohne statistische Basis

Eine Sensitivität kann in keiner Weise eine Vollsimulation ersetzen, da die Statistik des Ergebnisses vollkommen unzureichend ist. Eine solche Sensitivität ist erheblich beeinflusst von dem spezifischen Satz von Zufallsparametern, d.h. ob ein guter oder ein schlechter Tag für die Sensitivität gerechnet wurde.

Richtlinie 405 schreibt "möglichst" 100 Simulationsläufe vor, um mittels einer "ausreichend großen Grundgesamtheit" ein Minimum an statistischer Signifikanz der Ergebnisse sicherzustellen (Richtlinie 405.0205 S. 3 / Bl. 229). Ein einzelner oder wenige Simulationsläufe wie für die Sensitivitätsbetrachtungen, können höchstens eine Indikation liefern über die Größenordnung der Auswirkung einzelner Parameter-Veränderungen. Um einen Nachweis zu erbringen, müssen alle Parameter auf realistische Werte gesetzt werden und im Minimum die vollen 100 Tage simuliert werden.

Sämtliche Zufallsparameter der 100 zu simulierenden Tage wurden mit ihren Verspätungsverteilungen an den Einbruchstellen und den Haltezeitverlängerungen zu Beginn des Stresstests festgelegt (Audit SI-03 S. 1 / Bl. 147 Fußnote 2). SMA-Chef Stohler stellte in der Stresstest-Präsentation klar, dass es bei den 100 Simulationsläufen "gute und schlechte Tage" gibt.^[2] Es braucht also nur ein "guter Tag" gewählt zu werden und so lassen sich auch erschwerte Bedingungen verkraften.

Dies ist auch das Problem, warum die Berechnung einer weiteren Sensitivität mit der Korrektur einzelner Fehler in der Nachsimulation ohne jede Aussagekraft für die Frage ist, ob Stuttgart 21 in Zukunft die geplante Leistung erbringen kann.

Sensitivitäten und Nichtlinearität

rechts|thumb|360px|Prinzipskizze zur Nichtlinearität der Bahnhofs-Leistungsfähigkeit. Eine Parameter-Verschlechterung wird noch verkraftet, die zweite nicht mehr.Sensitivitäten haben einerseits keine Aussagekraft wegen der nicht ausreichenden statistischen Basis. Andererseits wurden im Stresstest und auf Anforderung von SMA nur einzelne oder wenige Einzelparameter verändert, die jeweils kleinere und noch 'verkraftbare' Verschlechterungen des Systems verursachten. Wenn einzelne Korrekturen verkraftet werden, heißt das nicht, dass sie auch noch in Summe verkraftet werden, da sie sich gegenseitig verstärken.

Die Leistungsfähigkeit eines Bahnhofs ist ein hoch-nichtlineares Problem. Das heißt nichts anderes, als dass beispielsweise bei hoher Belastung die Qualität des Bahnhofs immer schneller zurückgeht, da die Verspätungen sich gegenseitig verstärken. Dies wird in der nebenstehenden Abbildung schematisch gezeigt, angelehnt an die unten folgende Berechnung von Prof. Martin zu Stuttgart 21. Dargestellt ist auf der x-Achse die Leistung bzw. Auslastung des Bahnhofs in Zügen pro Stunde und rechts dieser Wert multipliziert mit der mittleren Geschwindigkeit der Züge, einem Maß für die Qualität (Verspätungen), dies ergibt die sogenannte Beförderungsenergie.

Die maximale Leistung bei noch vertretbarer Qualität finden wir im Maximum oder etwas rechts davon. Sollen hier noch ein paar Züge mehr im Bahnhof abgefertigt werden, sinkt die Qualität, anfangs in einem evtl. noch vertretbaren Maße, evtl. während einer kurzen Belastungsspitze. Wer von der prozentualen geringen Qualitätseinbuße schließt, dass auch noch ein zweites Paket von Zusatzzügen verkraftet werden könnte, irrt. Der Bahnhof ist bei dieser Belastung schon komplett zusammengebrochen. Das ist das Problem der Nichtlinearität, Belastungsfaktoren können nicht addiert werden.

rechts|thumb|360px|Schematische Darstellung der durch zunehmend realistischere Parameter korrigierten Bahnhofsleistungskurve.Verschärfen wir die Parameter, die der Bahnhofsleistungskurve zugrunde liegen und halten die gewünschte Zugleistung konstant, dann zieht sich die Kurve nach links unten zurück. Hier würde die erste Parameterverschlechterung unseren Zielpunkt sinken lassen, die zweite hätte ihm ebenso beschleunigt wie im vorigen Fall den Boden unter den Füßen entzogen.

Konkret auf den Stresstest bezogen stellt sich die Situation wie folgt dar. Die am weitesten nach rechts reichende Kurve ist die Originalkurve aus dem Gutachten von Prof. Martin^[3], mit dem vor dem Verwaltungsgerichtshof "nachgewiesen" wurde^[4], "der achtgleisige Durchgangsbahnhof sei ausreichend und zukunftssicher bemessen". Das Gutachten von Prof. Martin ist aus heutiger Sicht zu optimistisch, da es nicht die Zu- und Ablaufstrecken voll berücksichtigte und bspw. im Regionalverkehr mit Mindesthaltezeiten von 1 Minute arbeitete.

Die Kurve für die Parameter der Grundversion des Stresstets müsste etwas geschrumpft angenommen werden. Die Sensitivitäten zeigen, dass jede Parameterverschlechterung schon eine deutliche Verschlechterung der Qualität bringt, so dass die 49 Züge sich auf dem Abhang rechts vom Maximum befinden müssen. Grob geschätzt haben wir durch die Verschärfung der Parameter im Stresstest gegenüber der Simulation von Prof. Martin eine Leistungseinbuße von etwa 12 % angenommen. Die 57 Züge, auf die die Bahnhofsleistung im Falle des S-Bahn-Notfallkonzepts steigt, befinden sich schon in einem äußerst kritischen Teil des Graphen, in dem kein fahrbarer Betrieb mehr anzunehmen ist.

Mit jeder Parameter-Verschlechterung zieht sich die Kurve weiter nach links unten zurück. Immer schneller wird den angepeilten 49 Zügen der Boden unter den Füßen entzogen. Für ein besseres Verständnis soll versucht werden, den Vorgang in einer bildhaften Sprache zu beschreiben: Die einzelnen Sensitivitäten entsprechen immer wieder einem vorsichtigen Schritt von der Bergkuppe hangabwärts. Die Berücksichtigung aller Korrekturen würde mehrere Schritte bedeuten und damit den Absturz.

Wenden wir nun für das Beispiel die Korrektur einer ganzen Reihe von Parametern des Stresstests auf realistische Werte an, in Summe etwa um 33 % (zu vergleichen mit der abgeschätzten aktuellen Leistungsreduktion bei Korrektur der Fehler im Stresstest von %, Stand ), erhalten wir eine maximale Leistung des Bahnhofs von 33 Zügen. Die 49 Züge sind schon lange nicht mehr fahrbar.

Wegen der hohen Nichtlinearität ist es eben nicht seriös, zu argumentieren, dass die eine Korrektur nur geringfügig ausfallen würde und die andere auch, und dass hier nur eine Sekunde fehlt und dort nur ein Prozent. Die Qualitätseinbußen verstärken sich gegenseitig, so dass mehrere kleine Korrekturen nicht mehr tolerierbar sind, sondern vielmehr schon längst den Kollaps des Gesamtsystems herbeigeführt haben können.

Wegen der mangelnden statistischen Basis und wegen der notwendigen Berücksichtigung der Wechselwirkung aller Parameter ist jede Argumentation aufgrund einer "Sensitivität" (ob eine bestimmte Parameter-Verschlechterung noch verkraftet wird) ohne jede Beweiskraft. Aus diesem Grund schreibt die Richtlinie die Vollsimulation von 100 Tagen mit allen auf realistische Werte eingestellten Parametern vor. Nichts anderes könnte einen "Nachweis" erbringen.

Auch die Nachsimulation könnte nur bei Korrektur aller Parameter, nicht nur der von SMA erkannten Fehler, sondern nach Korrektur sämtlicher unrealistischer Größen und bei Vollsimulation über 100 Tage einen "Nachweis" erbringen.

Sensitivitäten und Teilkorrekturen

Aufgrund der Nichtlinearität des Problems ist die Korrektur von Einzelparametern ohne Aussage für das Gesamtergebnis. Die Sensititäten adressierten aber jeweils nur einzelne Parameter, die Parameteränderungen anderer Sensitivitäten bleiben außen vor (siehe auch die kommentierte Übersicht der Sensitivitäten):

Sensitivitätsberechnungen: / Realistischere Parameterwerte:	Grund- version (Vollsim.)	75% der Fahrzeit- übersch.	ohne Güter- verkehr	Auswerte- zeitraum 7-8 Uhr	Daten- modell 15. Juli	Finaler Simula- tionslauf	Nachweis (Vollsimul. 100 Tage)
	(Doku. S. 67)	(Doku. S. 112)	(Doku. S. 132)	(Audit Bl. 183)	(Audit Bl. 195)	(Doku. FS S. 5)
	Datenmodell vom 21.06.2011				15.07.2011	08.09.11
75 % Fahrzeitüberschüsse
Auswertezeitraum
Abfertigungszeiten
Verläng. S-Bahn Haltez.
Haltez., Takte, Verknüpf. etc.
Realistische Spitzenstunde
Realist. Verspätungsspitzen
Sonstige Korrekturen
Verspätungsänd. Zu-/Ablauf	—	+11 Sek.	–25 Sek.	+25 Sek.	+3 Sek.	+2 Sek.
Zugzahl bzw. Differenz*	49	–2,8	(sinnlos)	–6,4	–0,8	–0,5	32 (?)

Finaler Simulationslauf liefert keinen Nachweis

Das Gleiche wie für die Sensitivitäten gilt für den sogenannten "finalen Simulationslauf" ....

Simulation nur im Vergleich aussagefähig

Eine Computersimulation hängt entscheidend von den Eingangsparametern ab. Weil es hier so schwierig ist, absolut realistische Methoden und Parameter zu modellieren werden Simulationen in der Regel im Vergleich von Alternativen durchgeführt. Auf diesem Weg wirken sich die Falschannahmen in beiden Fällen ähnlich aus, so dass der relative Unterschied der Alternativen das belastbarere Ergebnis liefert.

Die Richtlinie gibt genau aus diesem Grund als Grenzen des Simulationsverfahrens an:

"• Ermittlung von Leistungsfähigkeitskenngrößen nur aufwändig über Variantengleich oder Iteration • Bemessung nur über Variantenvergleich" (Richtlinie 405.0202A01 S. 5 / Bl. 175)

"Für die Eichung der mit Simulationstools ermittelten Kenngrößen ist die Untersuchung des Ist-Zustandes als Vergleichsmaßstab hilfreich und deshalb zu empfehlen, da Qualitätsmaßstäbe noch nicht voll abgesichert sind bzw. sich noch in Entwicklung befinden." (Richtlinie 405.0202 S. 13 / Bl. 163)

Das heißt, die einzige Methode, den vielen unvermeidlichen systematischen Fehlern des Stresstests (die sicherlich auch nach Korrektur der gröbsten Fehler verbleiben) zu begegnen, ist die Simulation einer echten Alternative. Hierfür kommt vor allem der Kopfbahnhof in Betracht, da die S21-Investition sich ja durch den Vorteil gegenüber diesem rechtfertigen soll.

Allerdings ist abzusehen, dass die Leistungsfähigkeit des Kopfbahnhofs unter gleichen Annahmen (z.B. den verkürzten Blockabständen von Zuffenhausen zum Bahnhof, den Pufferzeitverletzungen, den dramatisch reduzierten Verspätungsniveaus, etc.) regelrecht explodieren würde. Und damit erklärt sich auch, dass die Bahn sich so vehement gegen diese Forderung der Kritiker zur Wehr setzt (die jedoch auch vom Regelwerk und dem wissenschaftlichen Prinzip geboten wäre). Dass dieses Grundprinzip der Computersimulationen von der SMA nicht angesprochen wurde (trotz dem Hinweis in der Richtlinie) ist als weiteres schweres Versäumnis zu werten.

An fehlenden Infrastrukturdaten des Kopfbahnhofs würde das Projekt nicht scheitern, da diese sämtlich schon im System vorhanden sind, wie in der Prämissen-Gesprächen deutlich wurde (.... Quelle).

Quelle für Infrastrukturdaten Kopfbahnhof ergänzen.

Abschlussdokumentation nicht nachvollziehbar

Die Abschlussdokumentation des Stresstests entspricht nicht den Anforderungen:

"Alle Ergebnisse sind so aufzubereiten, dass die sich ergebenden Schlussfolgerungen nachvollziehbar sind." (Richtlinie 405.0205 S. 1 / Bl. 227)

Insbesondere ist eine "Darstellung im Kontext mit den Ausgangsbedingungen bzw. mit den Prämissen für die Gültigkeit" sowie aussagefähige Legenden bei Diagrammen ausdrücklich vorgeschrieben (Richtlinie 405.0205 S. 4 / Bl. 230).

Die Ergebnisdarstellung ist in höchstem Maße irreführend:

Das Ergebnisdarstellung von "wirtschaftlich optimal" im Zusammenhang mit den Sekundenwerten des mittleren Verspätungsaufbaus in Zulauf und Ablauf ist suggestiv und irreführend. Eine Mittelung der Verspätungen unterschiedlicher Strecken ist unzulässig. Für die Ermittlung einer Ergebnis-Qualität hatte angegeben werden müssen, dass ein merklicher Anteil der Strecken ein "mangelhaft"-Prädikat erhält. Hier wurden sogar die Detail-Auswertungen unzulässig teilweise nur in verkürzten Teilstrecken bewertet, um überall ein "optimal"-Prädikat zu erhalten.
Die Ermittlung einer "Premium" Qualität unter Abzug der Haltezeitverkürzungen im Hauptbahnhof stellte suggestiv und irreführend einen Zusammenhang zwischen den Mittelwerten ..........

Diese Fehler haben zu unnötigen Missverständnissen und langen Diskussionen in der Stresstest-Präsentation geführt. In der allgemeinen Verwirrung war eine zuverlässige Interpretation der Betriebsqualität nicht möglich. Insbesondere hat aber offenbar auch der Auditor diese Fehler in der Ermittlung der Betriebsqualität nicht durchschaut.

Tatsächlich wurden die entscheidenden Eingangsgrößen des Stresstest, die Prämissen, zum größten Teil überhaupt nicht dokumentiert, z.B.:

Die Abweichungen von den Vorgaben des Landes im Fahrplan sind nicht dargestellt.
Die Annahmen zum Verspätungsaufbau sind ohne Darstellung der erheblichen Kappung der Verspätungs-Maximalwerte falsch dargestellt, tatsächlich waren die Verspätungen in der Simulation teils um mehr als einen Faktor 2 geringer angenommen worden.
Obwohl die Betriebsqualität für die Zeit von 6 bis 10 Uhr ermittelt wurde, werden in der Dokumentation nicht die Fahrpläne, ja nicht einmal die Zugzahlen außerhalb der Spitzenstunde genannt.
Die Annahmen zum Verspätungsabbau sind überhaupt nicht angegeben.
Es hätte geprüft werden müssen, ob für die Verspätungsannahmen die Näherungswerte (Richtlinie 405.0204A03 S. 1 / Bl. 225 f) oder Ist-Verspätungswerte oder Modifizierungen anzunehmen wären (Richtlinie 405.0204 S. 12 / Bl. 210). Eine solche Prüfung ist nicht dargestellt.
Die Belegungsgrade sind entgegen der Vorschrift nicht angegeben (siehe Folgeabsatz, Richtlinie 405.0202 S. 13 / Bl. 162).
Die Art der Berücksichtigung von Urverspätungen ist nicht angegeben. D.h. es wurde nicht dargestellt, dass die Haltezeitverlängerungen (Doku. Teil 1 S. 21) neben den echten Haltezeitverlängerungen in den Bahnhöfen im wesentlichen auch die auf der Strecke entstehenden Urverspätungen wiedergeben sollen.
Seitenweise Zuglisten (Doku. Teil 1 S. 27-39) werden ohne Angabe der technischen Daten zu den Zügen dargestellt und sind somit praktisch ohne Aussage.
Die Belegungsgrafiken (Doku. Teil 1 S. 40-48) sind unvollständig und mangels Legende nicht selbsterklärend.
Es wurde in keiner Weise spezifiziert unter welchen Annahmen die Sensititvitätsanalysen (Doku Teil 2 S. 112, 132 / Bl. 51, 71) durchgeführt wurden, d.h. mit welchem Parametersatz (d.h. Verspätungswerten, war es ein guter oder ein schlechter Tag, wurde er zufällig ausgewählt), mit welcher Anzahl von Simulationsläufen (wie groß ist die Unsicherheit aufgrund mangelnder Statistik anzusetzen) etc.
Es wurde lediglich dargestellt, welche Infrastrukturoptionen nicht aktiviert wurden (Doku. Teil 1 S. 54-61). Es wurde aber nicht untersucht (bzw. zumindest nicht dargestellt), welche Verbesserung diese Optionen gebracht hätten, wie es der Vorgabe im Schlichterspruch und der gültigen Prozessbeschreibung entsprochen hätte.
Über die Sensitivitätsrechnung zur Korrektur eines Teils der von SMA angemahnten Fehler, also das Datenmodell vom 15. Juli (Audit SI-08 / Bl. 186 ff) gibt es keinerlei Ergebnisdokumentation der Deutschen Bahn.

Selbst die SMA attestiert:

"Der Bericht 'Stresstest Stuttgart 21 – Fahrplanrobustheitsprüfung' der DB Netz AG vom 30. Juni ist nicht selbsterklärend, weist teilweise inhaltliche Mängel auf und bietet keine vollständige Dokumentation der durchgeführten Arbeiten." (Audit SI-07 S. 10 / Bl. 184)

Es ist nicht nachvollziehbar, wie die SMA nach einer solchen Aussage und auf der Basis einer solchen Ausgangsdatenlage überhaupt in der Lage war zu testieren. Es ist außerdem inakzeptabel, dass die SMA einen solchen schweren Vorwurf nicht im Einzelnen mit den konkreten Mängeln belegt, dadurch verdeckt sie mehr als sie kritisiert.

Wenn die SMA ausführt, dass weitergehende Informationen von der DB bilateral erhalten wurden (.... Quelle), so sind diese Informationen nicht hinreichend dokumentiert ....

Ein solch umfassender Verstoß gegen die Richtlinie und gegen die Nachvollziehbarkeit durch die Öffentlichkeit ist als KO-Kriterium für den Stresstest zu sehen. Kein Wirtschaftsprüfer dürfte eine solch lückenhafte Bilanz akzeptieren.

Belegungsgrade sind nicht ermittelt

Die Richtlinie schreibt für die Dokumentation der eisenbahnbetriebswissenschaftlichen Simulation verbindlich vor:

"Generell werden ausgewiesen: Verspätungszuwachs bzw. Verspätungsveränderung zwischen zwei definierten Querschnitten, dieser Wert dient als Kenngröße und wird dem zugehörigen Bewertungsmaßstab verglichen. • Verspätungsverlauf über den Fahrweg des Zuges (der Zugfamilie). • Einzelbelegungsgrade von Belegungselementen bzw. Kanten (Kenngröße)." (Richtlinie 405.0202 S. 13 / Bl. 162)

Dies fand an keiner Stelle der Stresstest-Dokumentation statt. Dieser schwerwiegende Verstoß wurde von der SMA übersehen bzw. nicht angesprochen. Die Belegungsgrade gehören zu den wichtigsten Kenngrößen in der Simulation einer Bahn-Infrastruktur mit stabilen Erfahrungswerten für fahrbare Auslegungen. So ergibt beispielsweise der Fahrplan für den achtgleisigen Tiefbahnhof einen Belegungsgrad in der Spitzenstunde von 85 % bis 95 %, das sind Werte von "katastrophal" bis unfahrbar. Dies ist möglicherweise der Hintergrund für diesen Richtlinienverstoß.

Es ist zu vermuten, dass auch die Belegungsgrade für andere Stellen der Infrastruktur bspw. die Zufahrt von Zuffenhausen, die Filderstrecke, Wendlinger Kurve ähnliche Warnsignale für die Überlastung der Stuttgart 21-Infrastruktur ergeben.

Nach Möglichkeit könnten aus den vorhandenen Daten hierzu Berechnungen angestellt werden und auf diesem Portal ergänzt werden.

Test des Fahrplans oder der Infrastruktur?

Die Bahn verfuhr nach dem Prozess zur Fahrplanrobustheitsprüfung ....
Die Vorschriften der RiLi 405 für Infrastrukturprüfungen sind nicht erfüllt ....
Auch die SMA spricht nur von der Untersuchung der "Robustheit des Fahrplans" nicht von der Robustheit der Infrastruktur bei hoher Belastung. (Audit SI-02 S. 4 / Bl. 144)

....

Keine modellzugspezifische Verspätungsveränderung

Die Richtlinie schreibt eine etwas detailliertere Analyse der Simulationsergebnisse vor, als sie in der Stresstest-Dokumentation erfolgte:

"In Simulationsmethoden werden bei allen Tools Verspätungszuwächse (nicht immer völlig identisch mit der Summe der Wartezeiten, je nachdem, ob Urverspätungen oder Verspätungsabbau mit enthalten ist) modellzugspezifisch ermittelt." (Richtlinie 405.0202 S. 12 / Bl. 162)

Zumindest mangelt es der Dokumentation an der klaren Zuordnung der Modellzüge zu den Linien.

Stresstest-Simulation auf Basis ungültiger Prozessbeschreibung

Kopf Prozessbeschreibung LN34-07.01.03, DB Netze

Der Stresstest wurde nach einer noch nicht gültigen Prozessbeschreibung durchgeführt und dies wurde dennoch von der SMA testiert.

Die Bahn gab in ihrer Abschlussdokumentation vom 30.06.2011 an, beim Stresstest "gemäß Prozess 'Fahrplanrobustheitsprüfung (FRP) durchführen' (LN34-07-01-03)" verfahren zu haben (Doku Teil 1 S. 2). Diese Prozessbeschreibung ist gültig seit 10.07.2011, d.h. sie konnte für die Durchführung des Stresstests keine Anwendung finden. Diesen Mangel übersieht die SMA und testiert einen Prozess, der auf einer nicht gültigen Verfahrensanweisung basiert. Dies ist überraschend, weil es zum Kern der Auditierung gehören müsste. Es ist die Frage, ob bzw. in welcher Form die noch nicht gültige Prozessbeschreibung der SMA überhaupt vorlag.

Prozessbeschreibung LN34-07-01-03, gültig ab 10.07.2011, DB Netze. Ausriss zu den Infrastrukturvarianten

Prozessbeschreibung LN34-05-07, gültig ab 16.02.2009, DB Netze. Ausriss zu den Infrastrukturvarianten

Für die Durchführung des Stresstests war eine frühere Fassung relevant, die Prozessbeschreibung LN34-05-07, gültig ab 16.02.2009. Es gibt womöglich mehrere Unterschiede zwischen beiden Verfahrensanweisungen. Ein entscheidender Unterschied liegt in dem Folgenden: In der älteren Prozessbeschreibung war die Berücksichtigung unterschiedlicher Infrastrukturvarianten an den Untersuchungsauftrag gebunden. In unserem Fall ist das der Schlichterspruch zum Stresstest, der ausdrücklich die Simulation den Zusammenhang zwischen Simulation und Varianten darstellte:

"Welche der von mir vorgeschlagenen Baumaßnahmen, wie ich das eben getan habe, zur Verbesserung der Strecken bis zur Inbetriebnahme von S 21 realisiert werden, hängt von den Ergebnissen der Simulation ab." ^[5]

D.h. es hätte bspw. auch zwingend zumindest der Verkehr bei Bau der großen Wendlinger Kurve simuliert werden müssen (da hier die Leistungsvorgabe klar nicht erfüllt wird). Aber angesichts der extremen Parameter im Tiefbahnhof mit vielen Pufferzeitverletzungen und Doppelbelegungen hätten auch 9. und 10. Gleis und P-Option geprüft werden müssen.

Die neue Richtlinie, die möglicherweise eigens für den Stuttgart 21-Stresstest geändert wurde, galt aber nicht während seiner Durchführung. Allein sie würde es erlauben, von dem Untersuchungsauftrag durch einen gegebenenfalls enger gefassten Simulationsauftrag abzuweichen.

D.h. gemäß der geltenden Prozessbeschreibung und dem Auftrag aus dem Schlichterspruch hätten im Stresstest die Varianten mit den Ausbauten Große Wendlinger Kurve, P-Option, etc. geprüft werden müssen, was nicht geschah, so dass der Stresstest die betreffende Vorschrift verletzt. Allein wegen dieses Regelverstoßes müsste der Stresstest noch einmal regelkonform wiederholt werden. Inzwischen – aber eben erst jetzt – wäre dann eine Abweichung vom Untersuchungsauftrag möglich. Allerdings müsste die Bahn dann bei der Veröffentlichung fairerweise auch den Simulationsauftrag offenlegen und Abweichungen vom Untersuchungsauftrag begründen. Dieses Vorgehen müsste dann auch vollständig vom Auditor geprüft und als sachgerecht eingestuft werden.

RICHTLINIENVERSTÖSSE, PARAMETER

Kein Stress im Test

Es existiert offenbar bei der Bahn keine eigene Richtlinie für die Durchführung eines echten "Stresstests". Die hier immer wieder zitierte Richtlinie 405 macht Vorgaben für die Durchführung einer eisenbahnbetriebswissenschaftlichen Simulation, die zu den verschiedensten Zwecken durchgeführt werden könnte. Klar ist aber der Untersuchungsauftrag im Schlichterspruch mit dem Begriff "Stresstest" formuliert worden.

Aufgabe eines Stresstests ist die Prüfung einer erhöhten Belastungssituation, wie sie gerade im Falle von Stör- und Notfällen auftreten, insofern ist besondere Aufmerksamkeit auf die korrekte Abbildung dieser Betriebssituationen zu legen. Es existiert eine Prozessbeschreibung "Fahrplanrobustheitsprüfung durchführen" (bei der auch nicht die gültige Fassung vom Stresstest eingehalten wurde), diese beschreibt aber lediglich den Ablauf, nicht die Parameter.

Richtlinie 405 geht aber darauf ein, dass eine Simulation und die darin verwendeten Parameter der Aufgabe angepasst werden müssen:

Zu den Eingangsgrößen: "Direkt aus dem Istzustand ermittelte Kenngrößen spiegeln zwar die Realität gut wieder, entsprechen aber, sofern sie nicht speziell für die aktuelle Aufgabe ermittelt wurden, nicht immer genau der geforderten Aussage." (Richtlinie 405.0205 S. 1 / Bl. 227)

Weitere Belege?

D.h. im Falle, dass die Simulation einen Stresstest darstellen soll, ist die Verwendung von Jahres- und Tages-Durchschnittswerten aus dem Alltagsbetrieb nicht zielführend. Es müssten Werte der untersuchten Belastungsspitze (im Stresstest die Spitzenstunde), für Tage besonderer Belastung (Winter, Suizid, etc.) eingesetzt werden. Statt Durchschnittswerten müssten also bspw. eigentlich die zur Stoßzeit spezifisch verlängerten Haltezeiten verwendet werden. Außerdem müssten typische Störungsszenarien, wie die rund zweistündige Sperrung von ein bis zwei Gleisen, oder die nicht so seltene zumindest halbstündige Blockade eines Zuges im Bahnhof durch eine technische Störung am Zug simuliert werden. Beide typische Stresssituationen kommen in der Simulation nicht vor.

Dem Argument, dass die in der Simulation eingesetzte Verteilung auch einzelne Extremwerte liefert, muss entgegnet werden, dass diese gerade im Stresstest für Stuttgart 21 durch die spezifischen Einstellungen im Modell beschnitten wurden:

Die Störungswerte insbesondere des Fernverkehrs und der S-Bahn wurden extrem unterdurchschnittlich angesetzt.
Die Streuung im Modell fällt nur rund halb so groß aus wie in der Realität beobachtet. D.h. die eigentlich kritischen Extremwerte fallen nur halb so gravierend aus.
Im Modell wurden aber darüber hinaus gerade die Maximalwerte beschnitten, so dass genau der Anteil der Verspätungsstatistik, der Stör- und Notfälle abbilden sollte, aus der Simulation herausgenommen wurde. Dieser Eingriff ist einer der gravierendsten Fehler im Stresstest.

D.h. statt auf die korrekte Abbildung gerade der hohen Belastungsspitzen zu achten, wurde eine Simulation durchgeführt, die gegenüber durchschnittlichen Bedingungen noch deutlich weichgespült wurde, also definitiv eine Schönstwettersimulation statt einem Stresstest. Dabei gibt die Richtlinie explizit vor, dass die Simulation von Stör- und Notfällen durch das Gegenteil, nämlich die Erhöhung der Parameter simuliert werden soll:

"Die Modellierung der Ausfälle oder Teilverfügbarkeiten von Infrastrukturelementen muss bisher ersatzweise durch Erhöhung der zugbezogenen Parameter für Urverspätungen erfolgen." (Richtlinie 405.0206 S. 11 / Bl. 251)

Eine solche spezifische Modellierung einer spezifischen Verspätungssituation kann offenbar problemlos in das System integriert werden, wie am Beispiel der "Gesonderten Ur- und Einbruchsverspätungen" in Marbach und Bondorf geschehen (Audit SI-08 S. 9 / Bl. 194). In gleicher Weise könnten auch die für den achtgleisigen Tiefbahnhof so kritischen Szenarien "Suizid" und "Technische Störung am Zug" bspw. durch testweise auf 120 bzw. 30 Min. heraufgesetzte Haltezeitverlängerungen im Hauptbahnhof simuliert werden.

Der Auditor des Stresstests, die Schweizer Firma SMA distanzierte sich außerdem ausdrücklich davon, die "betriebswissenschaftliche Simulation" als "Stresstest" zu bezeichnen^[6]. Insofern stellt der Auditor klar, dass er lediglich eine Simulation und keinen Stresstest bewertet hat.

Die Ausblendung von Stress im Stresstest sowohl durch eine vom Ansatz her schon wenig anspruchsvolle Verspätungsstatistik als auch durch die unverantwortliche und extrem manipulative Kappung der Haltezeitverlängerungen ist ein eklatanter Verstoß gegen die Anforderungen der Richtlinie, den Untersuchungsauftrag in der Simulation korrekt abzubilden. Weder hat die die Bahn die Anforderung nach einem Stresstest erfüllt, indem sie nie behauptet hat, einen Stresstest durchgeführt zu haben, und auch der Auditor stellt klar, dass er keinen Stresstest auditierte. Diese grundlegendste Anforderung ist also definitiv nicht erfüllt.

Mangelhafte Berücksichtigung von Urverspätungen

Richtlinie 405 macht eine Reihe von Vorgaben für die Berücksichtigung von Urverspätungen als notwendigen Störungsparameter für eine eisenbahnbetriebswissenschaftliche Untersuchung. Urverspätungen setzen sich zusammen aus Unterwegsverspätungen aufgrund von Störungen auf der Strecke (Gleis, Oberleitung, Signale, Personen oder Zug) sowie Haltezeitverlängerungen durch ähnliche Störungen in den Bahnhöfen:

"Zur Abbildung der im Betriebsablauf zu erwartenden Folgeverspätungen bzw. außerplanmäßigen Wartezeiten werden die Züge mit • Einbruchsverspätungen (ggf. bei Güterzügen auch Einbruchsverfrühungen) und • Urverspätungen (aufgaben- und toolspezifisch) belegt. Zu Quellen und Aufbereitung dieser Parameter siehe 405.0204 und 405.0206. Liegen Auswertungen nicht vor oder erscheint ihre Anwendung nicht sinnvoll (z.B. bei perspektivischen Untersuchungen), sind entsprechende Annahmen (siehe 405.0103A03) zu treffen." (Richtlinie 405.0201 S. 6 / Bl. 138)

"Bei Simulationen ist zu berücksichtigen, dass bei großem Betrachtungsraum und ohne Einspielen zusätzlicher Urverspätungen durch Verspätungsabbau im Betriebsablauf u.U. ein unrealistisch niedriges Verspätungsniveau bei der Einfahrt in den Auswerteraum entstehen kann. In diesen Fällen ist der Betrachtungsraum zu reduzieren oder es sind Urverspätungen einzuspielen." (Richtlinie 405.0203 S. 5 / Bl. 195)

Insbesondere für den Fernverkehr sind die Urverspätungen besonders relevant:

"Liegen vor einem Knoten lange Streckenabschnitte, so führt der Abbau ggf. zu einem zu günstigen Verspätungsniveau beim Einbruch in den Knoten. Um diesen Nachteil zu vermeiden, muss von der Möglichkeit Gebrauch gemacht werden, Urverspätungen einzugeben." (Richtlinie 405.0202 S. 11 / Bl. 161)

In der Stresstest-Simulation werden Urverspätungen allein in Form von Haltezeitverlängerungen abgebildet (Doku. Teil 1 S. 21). Erst der Auditor stellt klar, dass die Haltezeitverlängerungen auch die Urverspätungen auf der Strecke enthalten sollen (Audit SI-05 S. 1 ff / Bl. 156) .... vollkommen unzureichende Berücksichtigung innerhalb der Haltezeitverlängerungen entspricht einem weiteren Richtlinienverstoß. Inwieweit sich bei der im Audit erwähnten Lenkungskreissitzung Stresstest in Karlsruhe am 05.05.2011 sich evtl. kaum eingearbeitete Vertreter der neuen Landesregierung sich bei dieser Festlegung evtl. über den Tisch haben ziehen lassen, lässt sich nicht sagen. Im Ergebnis werden die Urverspätungen jedoch gegen die Vorgaben der Richtlinie unzureichend bis gar nicht berücksichtigt.

Gekappte Haltezeitverlängerungen

Eine der quantitativ größten Manipulationen am Stresstest zum Zweck der Erleichterung des Bestehens ist auch eine der zuletzt identifizierten: Die vollkommen unbegründete Kappung der Haltezeitverlängerungen auf vollkommen unzulässig niedrige Maximalwerte. Diese Maximalwerte wurden sorgsam von der Bahn aus der Stresstest-Dokumentation und den Prämissengesprächen herausgehalten. Und selbst der Auditor SMA hatte offenbar für die längste Zeit keine vollständige Kenntnis davon. Zumindest hatte er zum Zeitpunkt der Prämissengespräche noch keine Kenntnis von der dreistesten der Kappungen, der im Güterverkehr.^[7]

.... Tabelle und Grafik ....

Die Bahn hatte in ihrer Abschlussdokumentation zum Stresstest die Annahmen für die unterstellten Verspätungsverteilungen dargestellt (Doku. S. 21), aber nicht angegeben um welche Verteilungsfunktion es sich handelte.

In den Prämissengesprächen hatte das Aktionsbündnis detailliert zur der Ausgestaltung der Verspätungsverteilung nachgefragt, nach der Funktion, nach den im Test für die einzelnen Züge verwendeten konkreten Verspätungswerten, dem Vergleich mit realen Verspätungsdaten und sogar schon nach der Höhe der "Ausreißer" in der Verteilung. Diese Fragen wurden schriftlich mit der mageren Information "negative Exponentialverteilung" beantwortet. In der mündlichen Nachfrage wurde keiner der weiteren Punkte beantwortet, aber es wurde immerhin zu den Einbruchsverspätungen die Information gegeben, dass die "DB Spielräume hat, welche Verteilung an welchem Punkt angenommen wird." (Prämissengespräch 19.07.2011)

Hier fehlte jedoch jeglicher Hinweis darauf, dass insbesondere bei den Haltezeitverlängerungen die Maximalwerte erheblich gekappt wurden. Erst im Audit

Die Wirkung der Maximalwerte wie auch lässt sich übers für sich ohne jede Aussagekraft

, mit der Wirkung einer Entlastung der Verspätungen um erhebliche 5 %, 8 % und 14 % bei Regional-, Fernverkehr und S-Bahnen (gerade bei den besonders anspruchsvollen hohen Verspätungswerten). Beim Güterverkehr wurde durch diese Kappung die Belastung des Systems gegenüber dem offiziell Dargestellten in der Simulation gar um 55 % zurückgenommen.

Wenn die wesentlichen Stressparameter teilweise um mehr als einen Faktor 2 falsch dargestellt werden in einer Unterlage, die eine Milliardeninvestition rechtfertigen soll, dann rückt dieser Fehler schon stark in Richtung Betrug. Es ehrt die SMA, dass sie diese Manipulation (wenn auch nur versteckt, quasi in einer Randnote) öffentlich machte. Es wirft aber ein sehr zweifelhaftes Licht auf den Auditor, wenn dieser dabei die Abweichung von dem Bahn-Regelwerk und diesen erheblichen Manipulationseingriff nicht erkannte, ja die Auswirkung dieser eigens für die Stresstest-Simulation eingeführten Parameter gar nicht prüfte. Die gekappten Verspätungen zählen zu den quantitativ größten Fehlern in der Simulation. Die Verheimlichung dieser Parameter durch die Bahn, zeitweise sogar vor dem Auditor, könnte den Eindruck verstärken, dass hier kriminelle Energie im Spiel war.

Man kann nachvollziehen, dass die Berücksichtigung des Güterverkehrs unter realistischen Bedingungen enorme Schwierigkeiten in der Simulation verursachen würde. Dies könnte auch eine Erklärung liefern für die so vollkommen unsinnige Sensitivitätsbetrachtung ohne Güterverkehr, zu der die SMA schreibt:

"DB Netz AG hat eine Sensitivitätsbetrachtung ohne SGV durchgeführt. Ein Betriebsprogramm ohne Güterverkehr ist nicht realistisch. Da dieser Zustand einen fiktiven Fall darstellt, wird er hier nicht detailliert kommentiert. Die Sensitivitätsprüfung zeigt einen deutlichen Effekt des Güterverkehrs in der Simulation. Zwischen Einbruchbetriebsstelle und Ausbruchbetriebsstelle können gut 40 Sekunden mehr Verspätung als in der Grundvariante abgebaut werden." (Audit SI-07 S. 7 / Bl. 181)

Da die Berechnung einer Sensitivität ohne Güterverkehr so vollkommen unsinnig ist, stellt sich die Frage, wozu diese Untersuchung gemacht wurde. Es kann nur spekuliert werden, ob man nach der extremen Kappung der Haltezeitverlängerung und damit der Reduktion der Urverspätungen im Güterverkehr um mehr als die Hälfte nicht mehr sicher war, ob sich der Güterverkehr überhaupt noch signifikant in der Simulation bemerkbar macht. In diesem Fall hätte das Ergebnis eines immer noch "deutlichen Effekts" des Güterverkehrs für die Verantwortlichen des Eingriffs in die Simulationsparameter eine Beruhigung sein können.

Angesichts der besonders großen Verfälschung beim Güterverkehr durch die Kappung der Verspätungen hat das folgende Fazit der SMA zum Güterverkehr einen besonders bitteren Klang und erscheint als einer der kapitalsten Fehler im Audit: "Beim Güterverkehr sind keine Anpassungen erforderlich." (Audit FP-09 S. 3 / Bl. 115)

Für die extreme Kappung der für die Simulation so enorm wichtigen Urverspätungen in Form der Haltezeitverlängerungen gibt es keine Rechtfertigung. Eine solche wurde auch an keiner Stelle von der Bahn oder der SMA gegeben. Vielmehr hatte sich die Bahn bemüht, diesen Punkt nicht öffentlich zu machen, ja sogar die Information offenbar zögerlich an den Auditor weitergegeben. Die Richtlinie gibt an keiner Stelle Raum für einen solch umfassenden Eingriff in die Verspätungsstatistik. Dieser Eingriff erweckt den Eindruck eine betrugsmäßigen Vorgehens.

Fahrzeitüberschüsse voll im Verspätungsabbau

Simulation: Nutzung von 100 % Fahrzeitreserven

Verspätungsabbau aus Fahrzeitreserven. Antwort DB Netz in den Prämissengesprächen.

Der Stresstest geht im Unterschied dazu davon aus, dass im Verspätungsfall die Haltezeit der Züge bis auf eine Mindesthaltezeit reduziert werden kann, d.h. dass die Haltezeitreserven vollständig zum Verspätungsabbau eingesetzt werden können, ebenso wie die Fahrzeitreserven. Diese für den Stresstest wesentlichen Annahmen sind nicht in der Stresstest-Dokumentation dargestellt. Ebensowenig wie die Mindesthaltezeiten selbst oder andere Annahmen zum Verspätungsabbau.

Erst in den Prämissengesprächen wurden die Bedingungen des Verspätungsabbaus offenbart. Allerdings ohne den Hinweis darauf, dass die Richtlinie nur die Nutzung von 50 % der Reserven zum Verspätungsabbau zulässt. Im Audit wird im Steckbrief FP-03 auf die Haltzeiten eingegangen (Audit FP-03 S. 1 / Bl. 67 ff). Dort findet sich auch die folgende Tabelle:

Die Planhaltezeiten werden im Fahrplan der Grundversion noch in einigen Fällen unterschritten (Doku. Teil 1 S. 26). Angeblich sind sie in der zuletzt gerechneten Sensitivität zumindest im Hauptbahnhof beseitigt (Audit SI-08 S. 5 / Bl. 190 f). Allerdings ist der entsprechend Fahrplan unbekannt. Unbekannt ist auch, welche Pufferzeitverletzungen dadurch ggf. hinzukamen.

Die SMA weist bei der Darstellung der Reserven (Audit ff FP-05 S. 1 / Bl. 80) zwar hin: "Die Reserven, die zum Verspätungsabbau genutzt werden können, sind eher hoch." ....

....

Dass "Die Differenz von Haltezeit und Mindesthaltezeit kann in der Simulation zum Verspätungsabbau genutzt werden und ist damit Teil der Reserven eines Zuges.

Bezüglich der Berücksichtigung von

Richtlinie: Maximal 50 % Fahrzeitreserven

Laut Richtlinie 405 dürfen insbesondere bei der Bewertung der Betriebsqualität (wenn es um "wirtschaftlich optimal" oder "Premium" geht) Bauzuschläge und Haltezeitüberschüsse nur zum Teil, in der Regel nur zu 50 %, genutzt werden. Fahrzeitüberschüsse sollten ggf. ganz unberücksichtigt bleiben:

"Simulationsmethoden erlauben die Abbildung von Verspätungsabbau, wobei i.d.R. der Abbau der Hälfte des Bauzuschlags und der im zu Grunde liegenden Fahrplan enthaltenen planmäßigen Wartezeiten im Betrachtungsraum zugelassen wird. Die Nutzung von Fahrzeitzuschlägen zum Abbau von Verspätungen kann toolgebunden unterbunden werden." (Richtlinie 405.0202 S. 11 / Bl. 161)

In der Definition der Betriebsqualität wird vielfach auf folgende Fußnote verwiesen, die jedoch sowhl von der Bahn in der Stresstest-Dokumentation (Doku. Teil 1 S. 23) als auch von der SMA im Audit (Audit SI-02 S. 2 / Bl. 176) unterschlagen wird:

"Hierbei wird angenommen, dass entsprechend den Bedingungen in der Praxis ein Teil der in der Regel erforderlichen planmäßigen Wartezeiten und der bei der Fahrplanerstellung üblicherweise eingearbeiteten Zeitzuschläge zum Verspätungsabbau genutzt werden kann." (Richtlinie 405.0104 S. 6 / Bl. 94)

Erstere Formulierung ist nicht ganz eindeutig, der Satz am Anfang könnte so gelesen werden, dass nur die Hälfte des Bauzuschlags und die Wartezeiten (insbes. auch die Haltezeiten im Bahnhof) voll zum Verspätungsaufbau genutzt werden könnten (wenn der Genitiv der Wartezeiten sich auf "Abbau" und nicht auf "Hälfte" beziehen würde). Wäre dies so gemeint, hätte die Richtlinie das präziserweise mit einer zusätzlichen Formulierung wie 'der Abbau der vollen [...] enthaltenen planmäßigen Wartezeiten' klarstellen müssen. Dass sich die Hälfte sowohl auf Bauzuschlag wie auch auf die planmäßigen Wartezeiten bezieht, wird durch die vorausgehend genannte Passage der Richtlinie klar. Aber insbesondere ist es die einzig logische Interpretation. Denn es ist nicht zu erkennen, warum im Verspätungsfall andere Störungen aufgrund von Bautätigkeiten, Ausfällen der Technik oder Problemen mit Personen ausgeschaltet sein sollten.

Praxis: Haltezeitverkürzung in der Praxis

Nach den im vorausgehenden Absatz zitierten Aussagen der Richtlinien dürfen auch Fahrzeitüberschüsse nicht zu 100 % sondern nur zum Teil, in der Regel zu 50 % zum Verspätungsabbau verwendet werden. Sie sollen nach der Richtlinie sogar gegebenenfalls ganz unberücksichtigt bleiben. D.h. die Simulation der "Grundversion", die die Basis des Stresstest-Ergebnisses ist, und offenbar im Unterschied zu den "Sensitivitäten" die einzige Vollsimulation mit 100 simulierten Tagen ist, beruht somit auch bezüglich der Verwendung der Fahrzeitüberschüsse auf unzulässigen Parametern.

Haltezeitverkürzung nicht für Betriebsqualität

Die Bahn stellte in der Stresstest-Dokumentation eine eigenwillige Definition der Betriebsqualität zusammen (Doku. Teil 1 S. 23). Ausgegangen wird zwar von der tatsächlichen Definition der Betriebsqualität aus der Richtlinie (Richtlinie 405.0104 S. 6 / Bl. 94):

{| class="wikitable"

! "Summe Folgeverspätungen / Verspätungsveränderung ! Bewertungsstufen der Betriebsqualität nur geringe Folgeverspätungen (außerplanmäßige Wartezeiten); Sofern Zeitreserven* zur Verfügung stehen können diese genutzt werden, so dass sich die Gesamtsumme der Verspätungen zwischen Einbruch und Ausbruch deutlich verringert (Verspätungsabbau*). | Premiumqualität |- | Summe der Folgeverspätungen (außerplanmäßige Wartezeiten) noch akzeptabel. Sofern Zeitreserven* zur Verfügung stehen, können die Folgeverspätungen im Mittel kompensiert werden, die Gesamtsumme der Verspätungen bleibt annähernd gleich bzw. ändert sich nicht signifikant.* | wirtschaftlich optimal |- | Summe der Folgeverspätungen (außerplanmäßige Wartezeiten) steigt erheblich, Im Falle vorhandener Zeitreserven* reichen diese nicht aus, die Folgeverspätungen zu kompensieren. Die Summe der Verspätungen steigt zwischen Einbruch und Ausbruch deutlich an(Verspätungszuwachs). | risikobehaftet |- |Verspätungssumme steigt zwischen Einbruch und Ausbruch stark an |mangelhaft (nicht marktgerecht) |- |}

* Hierbei wird angenommen, dass entsprechend den Bedingungen in der Praxis ein Teil der in der Regel erforderlichen planmäßigen Wartezeiten und der bei der Fahrplanerstellung üblicherweise eingearbeiteten Zeitzuschläge zum Verspätungsabbau genutzt werden kann."

Die Darstellung der Stresstest-Dokumentation unterscheidet sich hiervon in zwei Punkten wesentlich:

Die entscheidende Einschränkung durch die Fußnote, dass nur ein Teil der Wartezeiten und Zeitzuschläge verwendet werden kann, fehlt (gerade hier beging die Bahn zwei weitere Regelverstöße bezüglich der Haltezeitverkürzung und der Fahrzeitüberschüsse)

Der zweite Unterschied ist ein Zusatz zur "wirtschaftlich optimalen" Betriebsqualität zu der Frage, was als "noch akzeptabler" Verspätungsaufbau zu sehen ist. Er stammt aus der Erläuterung der Kenngröße Verspätungsveränderung:

"Für den Verspätungszuwachs gilt vorläufig folgender Rahmen (für Personenverkehr auf Mischbetriebsstrecken) • Als Optimum gilt: zul t_Vz = 0,0 [min] im Mittel über alle SPV-Züge. D.h. Die mittlere Verspätung soll im Untersuchungsbereich (Auswerteraum) möglichst nicht ansteigen. Ein Verspätungsaufbau kann auf Abschnitten ggf. dann zugelassen werden, wenn entsprechende Abbaumöglichkeiten in den benachbarten Netzele menten bestehen. • Als noch akzeptabel gilt eine mittlere Verspätungsveränderung (Zuwachs) von: zul t_Vz = 1,0 [min] im Mittel über alle SPV-Züge auf einer Folge von Netzelementen (Strecke, Teilnetz), zul t_Vz = 0,5 [min] im Mittel über alle SPV-Züge in Bahnhofsköpfen. Diese Werte liegen somit an der Grenze zum mangelhaften Bereich." (Richtlinie 405.0104 S. 20 / Bl. 108)

In der Stresstest-Dokumentation wurde nicht zitiert, dass die angeführten Werte schon die Grenze zum "mangelhaften" Qualitätsbereich markieren (zwei Stufen unter "wirtschaftlich optimal" nach der Stufe "risikobehaftet", siehe oben).
In der Stresstest-Dokumentation wurde auch nicht darauf hingewiesen, dass diese Werte nicht für eine Mittelung über alle Zulauf- oder alle Ablaufstrecken sowie nicht für den gesamten Untersuchungsbereich gelten, insbesondere nicht für Zulaufstrecke plus Bahnhof mit Halt plus Ablaufstrecke. Dass die Bahn und auch SMA wiederholt die Sekundenwerte dieser Strecken-Mittelwerte mit der Minutengrenze der Qualitätsdefinition in Beziehung setzte ist unzulässig und führte das Aktionsbündnis in die Irre.^[8] In den Grafiken hätte per Fußnote darauf hingewiesen werden müssen, dass bspw. die 8 bis 9 Sekunden Verspätungsabbau nichts mit dem Qualitätsprädikat und der Qualitätsgrenze von 30 oder 60 Sekunden zu tun haben.
Allenfalls hätte eine Aussage dargestellt werden dürfen, dass X % der Zulaufstrecken, betreffend Y % der Züge im Zulauf "wirtschaftlich optimal" erhalten, etc. Tatsächlich hat die Bahn aber auch in der Qualitäts-Bewertung der einzelnen Strecken unsauber gearbeitet, indem bei kritischen Strecken das Prädikat nur für den Abschnitt erteilt wurde, der noch "optimal" ausfiel, die Gesamtstrecke, die "mangelhaft" ergeben hätte, wurde nicht bewertet. In der Gegenrichtung wurde aber die Gesamtstrecke bewertet, um möglichst bspw. das "Premium"-Prädikat möglichst deutlich zu erreichen (Doku. Teil 2 S. 92-93, 96-101, 106-109 / Bl. 31-32, 35-40, 45-48). Tatsächlich hätten einige Strecken als "mangelhaft" bewertet und ausgewiesen werden müssen und im Gesamtergebnis hätte ein entsprechender Anteil an "mangelhaften" Strecken dargestellt werden müssen.
In der Qualitätsdefinition der Stresstest-Dokumentation ist zwar die Formulierung "in Bahnhofsköpfen" korrekt übernommen worden. Dennoch wurde nie, insbesondere bei dem verschiedentlichen Bezug auf die 30 Sekunden-Verspätungsgrenze in den "freiwilligen" Zusatzprüfungen eine Prüfung der tatsächlichen Bahnhofsköpfe vorgenommen, sondern vielmehr ein großer Anteil Alt-Zulaufstrecke zum Abpuffern der Verspätungen genutzt.
Die tatsächliche Auswertung der Bahnhofsköpfe hätte weit unvorteilhaftere Werte für den Verspätungsaufbau geliefert, z.B. von +24 Sek. für die Züge aus Horb nach Stuttgart (Doku Teil 2 S. 89 / Bl. 28), nahe der Grenze zu "mangelhaft" bei +30 Sek. – und das schon in der viel zu optimistischen Grundvariante. Ein Wert deutlich verschieden von den 8 Sek., dem Mittelwert der Bahn für die Zuläufe.
Obwohl bei merklichem Verspätungsabbau durch Haltezeitverkürzug laut Richtlinie andere Größen zur Qualitätsbestimmung hinzugezogen werden müssen, wurde diese allein und somit regelwidrig in den Ergebnischarts herangezogen:
"Für infrastrukturbezogene Aufgabenstellungen ist sie [die Kenngröße Verspätungsveränderung] jedoch nur bedingt geeignet, da ggf. Verspätungsabbau das Leistungsverhalten von Netzelementen überlagern kann. In diesen Fällen sind weitere Kenngrößen (z.B. infrastrukturbezogene Behinderungen bzw. Wartezeiten) heranzuziehen." (Richtlinie 405.0104 S. 20 / Bl. 108)

Im Stresstest wurde die Haltezeitverkürzung im Hauptbahnhof extrem (sogar regelwidrig zu 100%) zum Verspätungsabbau genutzt. Damit sind die Ergebnisgrafiken in der Abschlussdokumentation der Bahn (Doku. S. 67 Teil 2 / Bl. 6, S. 112 Teil 2 / Bl. 51), die in der Summe über die Zulaufstrecken, die Haltezeitverkürzung im Hauptbahnhof und die Ablaufstrecken eine Premium-Qualität nahelegen, unzulässig. Dies könnte auch erklären, warum die Bahn im Abschlussbericht keine entsprechende textliche Schlussbeurteilung in ihren Bericht aufnahm, und ist wohl auch der Hintergrund der Äußerung eines Bahnvertreters in der Prämissen-Sitzung vom 19.07.2011, dass die Haltezeitverkürzung im Hauptbahnhof "nicht entscheidungsrelevant" sein könne.^[9]

Die Bahn hielt sich in der Stresstest-Präsentation in dieser Frage auffällig zurück und überließ den Laien-Vertretern der Befürworterseite die Argumentation, dass ja die Haltezeitverkürzung im Hauptbahnhof die Premium-Qualität begründen würde (.... Quelle).

Die Argumentation, mit der Haltezeitverkürzung im Hauptbahnhof eine "Premium"-Betriebsqualität von Einbruch- zu Ausbruchsbetriebsstelle zu begründen, ist wissenschaftlich nicht haltbar, widerspricht den Vorgaben der einschlägigen Richtlinie und wurde weder von der Bahn geführt, noch wurde sie von der SMA testiert. Darüber hinaus ist die Haltezeitverkürzung in ihrem Umfang unrealistisch hoch angesetzt.

Infrastrukturbewertung nicht nur aus Verspätungsabbau

Richtlinie 405 stellt anspruchsvolle Anforderungen an die Entscheidungsbasis über die in einer Infrastruktur zu erreichende Betriebsqualität:

"Um einen Qualitätsnachweis zu führen, sind die an den Messpunkten (vgl. Abs. (9)) gewonnenen Qualitätskenngrößen mit Qualitätsmaßstäben zu vergleichen, die i.d.R. aufgrund von Erfahrungswerten und zusätzlichen theoretischen Überlegungen gewonnen wurden." (Richtlinie 405.0104 S. 5 / Bl. 93)
"Fundierte Entscheidungen sind in der Regel nur auf der Grundlage der komplexen Betrachtung mehrerer Kenngrößen ggf. unter Angabe möglicher Bandbreiten bzw. Wertebereiche zu treffen." (Richtlinie 405.0104 S. 7 / Bl. 95)
"Aussagen zur Kapazität der Infrastruktur sollten sich nicht nur auf ein einziges Betriebsprogramm bzw. eine einzige Struktur der Leistungsanforderungen und einen einzigen daraus resultierenden Leistungswert stützen. Vielmehr ist es erforderlich, bei solchen Untersuchungen auf Bandbreiten, die sich z.B. aus unterschiedlichen möglichen Entwicklungen der Leistungsanforderungen ergeben können, hinzuweisen. Dazu ist die Berechnung mehrerer Kenngrößen bzw. gleicher Kenngrößen unter unterschiedlichen Randbedingungen sowie von geeigneten Eckwerten sinnvoll" (Richtlinie 405.0104 S. 10 / Bl. 98)
"Für infrastrukturbezogene Aufgabenstellungen ist sie [die Kenngröße Verspätungsveränderung] jedoch nur bedingt geeignet, da ggf. Verspätungsabbau das Leistungsverhalten von Netzelementen überlagern kann. In diesen Fällen sind weitere Kenngrößen (z.B. infrastrukturbezogene Behinderungen bzw. Wartezeiten) heranzuziehen." (Richtlinie 405.0104 S. 20 / Bl. 108)

D.h. die Beschränkung der Qualitätsbetrachtung auf die eine Größe Verspätungsabbau durch die Bahn im Stresstest zu Stuttgart 21 (Doku. Teil 1 S. 23, Teil 2 S. 67, 112, 132 / Bl. 6, 51, 71) ist nicht richtlinienkonform. Besonders schwerwiegend erscheint die regelwerkswidrige Unterschlagung der Kenngröße Belegungsgrad.

Usw, usf.

Bitte diese Punkte prüfen/ergänzen/ausformulieren und evtl. mit weiteren Referenzen aus den Richtlinien (zumeist 405) belegen! Gerne können hier weitere Punkte angefügt werden.

Einzelnachweise

In Klammern gesetzte (Quellenangaben) ohne Fußnote beziehen sich auf wesentliche Unterlagen zum Stresstest, die im Hauptartikel unter "Dokumente" aufgeführt sind.

↑ 21.06.2011, stuttgarter-zeitung.de, "Bahn hält die Vorgaben für «irreal»"
↑ 29.07.2011, Stresstest-Präsentation, 13:54 Uhr, Werner Stohler: "[...] das Modell kennt gute Tage und schlechte Tage [...]"
↑ U. Martin et al., „Vergleich der Leistungsfähigkeiten und des Leistungsverhaltens des neuen Durchgangsbahnhofes (S21) und einer Variante umgestalteter Kopfbahnhof (K21)“. In: Landeshauptstadt Stuttgart (Hrsg.): Stuttgart 21 – Diskurs, Stuttgart 2007, S. 2287–2369 (das-neue-herz-europas.de, PDF).
↑ 06.04.2006, Verwaltungsgerichtshof Baden-Württemberg 5. Senat, Aktenzeichen 5 S 848/05 (landesrecht-bw.de)
↑ 30.11.2010, Schlichterspruch Heiner Geißlers, 17:22 Uhr
↑ 29.07.2011, Stresstest-Präsentation, 13:51 Uhr (s.a. 14:04 Uhr), Werner Stohler, CEO von SMA
↑ Dies belegt die nachträgliche Auswertung einer Folie der SMA aus den Prämissengesprächen, die für den Güterverkehr keine Kappung ausweist und bei deren Präsentation auch nicht die Bedeutung und vor allem die Auswirkung der Kappungsgrößen bei Fern- und Nahverkehr sowie S-Bahn erläutert wurde.
↑ 29.07.2011, Stresstest-Präsentation, .... Uhr, Boris Palmer (Stenogr. Protokoll: "Es ist also nicht so, dass da jetzt drei oder vier Minuten Reserve sind, sondern die Grenzen liegen im 30-Sekunden-Abstand oder in einem Abstand von einer Minute für die durchschnittlichen Verspätungen und den Verspätungsabbau.")
↑ 19.07.2011, 3. Prämissengespräch im Stuttgarter Rathaus, Protokoll. Thorsten Schaer, DB Netz, sinngemäß zu Chart 67 der Abschlussdokumentation: Die Haltezeitverkürzung von 2,77 auf 2,0 Minuten kann kein Entscheidungskriterium für den Verspätungsabbau sein.

[2011-06-21_StZ_Vorgaben_irreal-1] 21.06.2011, stuttgarter-zeitung.de, "Bahn hält die Vorgaben für «irreal»"

[2] 29.07.2011, Stresstest-Präsentation, 13:54 Uhr, Werner Stohler: "[...] das Modell kennt gute Tage und schlechte Tage [...]"

[3] U. Martin et al., „Vergleich der Leistungsfähigkeiten und des Leistungsverhaltens des neuen Durchgangsbahnhofes (S21) und einer Variante umgestalteter Kopfbahnhof (K21)“. In: Landeshauptstadt Stuttgart (Hrsg.): Stuttgart 21 – Diskurs, Stuttgart 2007, S. 2287–2369 (das-neue-herz-europas.de, PDF).

[4] 06.04.2006, Verwaltungsgerichtshof Baden-Württemberg 5. Senat, Aktenzeichen 5 S 848/05 (landesrecht-bw.de)

[5] 30.11.2010, Schlichterspruch Heiner Geißlers, 17:22 Uhr

[6] 29.07.2011, Stresstest-Präsentation, 13:51 Uhr (s.a. 14:04 Uhr), Werner Stohler, CEO von SMA

[7] Dies belegt die nachträgliche Auswertung einer Folie der SMA aus den Prämissengesprächen, die für den Güterverkehr keine Kappung ausweist und bei deren Präsentation auch nicht die Bedeutung und vor allem die Auswirkung der Kappungsgrößen bei Fern- und Nahverkehr sowie S-Bahn erläutert wurde.

[8] 29.07.2011, Stresstest-Präsentation, .... Uhr, Boris Palmer (Stenogr. Protokoll: "Es ist also nicht so, dass da jetzt drei oder vier Minuten Reserve sind, sondern die Grenzen liegen im 30-Sekunden-Abstand oder in einem Abstand von einer Minute für die durchschnittlichen Verspätungen und den Verspätungsabbau.")

[9] 19.07.2011, 3. Prämissengespräch im Stuttgarter Rathaus, Protokoll. Thorsten Schaer, DB Netz, sinngemäß zu Chart 67 der Abschlussdokumentation: Die Haltezeitverkürzung von 2,77 auf 2,0 Minuten kann kein Entscheidungskriterium für den Verspätungsabbau sein.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]