Deutsche Bahn
Foto von Julian Hochgesang auf Unsplash

Vorstellung des Projektes Train Stats DE

Motivation

Die Anbindung an den öffentlichen Nah- und Fernverkehr ist für die Lebensqualität einer Region von großer Bedeutung. Dies gilt insbesondere vor dem Hintergrund der Herausforderung des Klimawandels und des Umwelschutzes im Allgemeinen. Aktuell wird vielfach die Elektromobilität als Lösung präsentiert, doch dieser im Kern rückwärtsgewandte und ineffiziente Ansatz ist unzureichend.

Das Ziel dieses Data-Science-Projektes ist es, den Personenverkehr der Deutschen Bahn mittels Graphentheorie zu analysieren. Dabei soll festgestellt werden, welche Orte gut angebunden sind – und bei welchen evtl. Handlungsbedarf besteht.

Die Eingangsdaten

Die Verbindungsdaten werden mittels der Timetables API der Deutschen Bahn abgerufen. Außerdem werden andere Datensätze des Open-Data-Portals der Deutschen Bahn verwendet, um mehr Informationen über die Bahnhöfe zu erhalten.

Stand des Projektes

Das Projekt steht noch relativ weit am Anfang.

  • Ich habe einen einfachen Algorithmus implementiert, welcher die Verbindungen aller relevanten Bahnhöfe mittels API abfragt. Dabei werden nur die Daten von etwa 10 % der Bahnhöfe angefragt, diese Stellen aber jeweils die Start- und Endpunkte der Linien dar. Da die API maximal 3600 Anfragen pro Stunde zulässt und es über 6000 Bahnhöfe in Deutschland gibt, ist dieser Effizienzgewinn bedeutend.
  • Die EVA-Nummer eines jeden Bahnhofes wird für die API-Abfrage benötigt. Es gibt meiner Kenntnis nach keinen Datensatz, der alle aktuellen Nummern umfasst. Ich verwende verschiedene Methoden, um die EVA-Nummer zu ermitteln, so dass ich nur im Ausnahmefall eine andere API der Bahn verwenden muss (hier sind die Anfragen pro Monat limitiert).
  • Die erhaltenen Informationen habe ich in Graphen überführt und einfache Metriken berechnet.

Agenda

    • Vorhersage der Bahnhhofskategorie anhand der Bedeutung im Graphen
    • Plotten des Netzes (Aufgrund der Vielzahl der Bahnhöfe ist es nicht trivial, eine übersichtliche informative Darstellung zu erzeugen)

    Kay Langhammer

    Data Scientist

    Kay Langhammer 2023