Titelbild von road-accidents-fr

Motivation

Jedes Jahr sterben ca. 1,3 Millionen Menschen infolge von Verkehrsunfällen (Quelle: WHO).

Das Ziel dieses Data-Science-Projektes ist es, die Einflüsse auf das Vorkommen und die Schwere von Unfällen zu untersuchen. Das so gewonnenen Erkenntnisse können Entscheidungsträgern bei ihren Entscheidungen helfen und somit tödliche Unfälle verhindern.

Die Eingangsdaten

Die Rohdaten werden von www.data.gouv.fr bereitgestellt. Dort gibt es Informationen zu jedem Verkehrsunfall mit Personenschaden seit 2005.

Eine Einschränkung des Datensatzes ist, dass nicht alle erhobenen Daten freigegeben werden (z. B. Alkoholpegel der beteiligten Personen). Eine wichtige Variable, die naturgemäß nicht vorliegt, wäre zudem die Geschwindigkeit der Fahrzeuge vor dem Unfall.

Stand des Projektes

Der inhaltliche Stand des Projektes ist bisher in 4 Jupyter Notebooks gefasst:

  • In Notebook 1 importiere und bereinige ich die Daten
  • In Notebook 2 visualisier ich einige Zusammenhänge zwischen den Variablen und die geografische Verteilung der Unfälle
  • In Notebook 3 trainiere ich verschiedene Modelle des Ensemlbe Learnings, um die Schwere von Verkehrsunfällen vorherzusagen (XGBoost, Random Forest). Die Modelle werden interpretiert bezüglich der Frage, welche Variablen besonders bedeutend für die Schwere von Unfällen sind.
    • künstliche neuronale Netze mit Tensorflow/Keras.
  • In Notebook 4 trainiere ich künstliche neuronale Netze mit Tensorflow/Keras und Coral-Ordinal

Darüber hinaus habe ich für die geographischen Plots eine Streamlit-App erstellt, die hier zu finden ist: App

Die Notebooks werden bei jedem Push auf GitHub mit einem Testlauf auf ihre Funktion getestet.

Agenda

  • Zeitreihenanalyse ab 2005
  • Identifizieren der Variablen, die die Anzahl der Unfälle in einer bestimmten Stadt / einem bestimmten Département beeinflussen

Kay Langhammer

Data Scientist

Kay Langhammer 2023