Es ist vermutlich kein Geheimnis, dass das vergangene Jahr 2022 das wohl verrückteste und aufregendste war, was ich bisher erlebt habe: Zusammen mit meinem Partner haben wir uns ein altes Segelboot gekauft und beschlossen darauf zu leben, um gemeinsam die Welt zu bereisen ⛵. Von daher lag es für mich nahe, dass mein erstes privates Datenanalyse-Projekt etwas mit meiner neuen Leidenschaft zu tun haben muss - dem Segeln! #sailingnerd🤓

Das Ziel dieser Datenalyse war es, den allgemeinen Datenanalyseprozess mit unseren Segel-Aufzeichnungen durchzugehen, statistische Methodiken anzuwenden und die Ergebnisse visuell darzustellen.

Zu dem Datenanalyseprozess

Egal ob es um die Auswertung von businessbezogenen Daten, industriespezifische Daten oder Segeldaten geht: Jeder Datenanalyseprozess durchläuft die selben sechs Phasen:

❓ Fragen

Im ersten Schritt wird definiert, welches mögliche Problem gelöst werden soll und was die Erwartungen sind. In diesem Projekt war das Ziel, alle Daten unserer Segelreise zusammen zu führen und statistische Merkmale zu erörtern, wie die absolute Distanz, durchschnittliche Geschwindigkeit, usw. Ein herkömmliches ‘Problem’ soll nicht gelöst werden.

📂 Vorbereiten

Als nächstes werden die zur Verfügung stehenden Daten gesammelt und bereitgestellt. In diesem Fall haben wir bei unserem martiemen Navagationskartenanbieter unsere gespeicherten Segelrouten heruntergeladen und lokal auf unseren Rechner gespeichert. Außerdem haben wir die Daten weiter angereichert, um die zusätzliche Information der aktuellen Geschwindigkeit zum Zeitpunkt der Aufzeichnung und die zurückgelegte Strecke.

⚙️ Verarbeiten

Danach wird der Datensatz untersucht, nach Fehlern wie zum Beispiel fehlende Daten, falsches Datenformat, Redundanz oder Ausreißern in Messpunkten. Dieser Schritt wird auch als ‘Säuberung’ (engl. cleaning) der Daten bezeichnet, bevor die eigentliche Auswertung beginnt.

🔎 Analysieren

Bei der Analyse werden nun die Daten transformiert, ausgewertet und Bewertungen erbracht. Neben der gesamten Betrachtung der Aufzeichnung, wurde auch erarbeitet, welche Routen untereinander die schnellsten oder die längsten Segeletappen waren.

📈 Präsentieren/Teilen

Nach der Analyse geht es darum, seine Ergebnisse den zuständigen Interessenvertretern zu präsentieren. Hierbei ist die Visualisierung sehr entscheidend. Mit Hilfe von Diagrammen und Bildern werden komplexe Zusammenhänge dargestellt, sodass sie einfacher nachvollziehbar werden. Anstelle einer Tabelle von zig Positionsdaten, werden diese zum Beispiel als Route in einer Karte gezeigt. Zusätzlich wird farblich angezeigt, wie schnell wir wo auf unserer Route gesegelt sind.

🎯 Handeln

In der letzten Phase sollen nun anhand der Erkenntnissen Maßnahmen abgeleitet werden, die zuvor aus den Daten gewonnen werden konnten, um seine Businessziele zu erreichen. In meinem Fall wurde aber kein Problem zu Beginn definiert, wodurch auch keine Maßnahmen die Folgen sind… Außer vielleicht im neuen Jahr versuchen einen besseren Geschwindigkeitsdurchschnitt zu erzielen😉

Schau dir meine Analyse zur Segelroute 2022 an!

Haben Sie Interesse sich mein Jupyter Notebook zur Datenanlyse unserer Segelroute anzuschauen? Dann können Sie sich meine Ergebnisse im GitHub repo genauer anschauen.

Oder schauen Sie sich hier die interaktive Karte zu unserer Segelroute 2022 direkt an 🗺️.

notebook-github-repo GPX Tracking Sail Analysis notebook repository

Und wenn auch Sie hilfe benötigen bei der Analyse Ihrer Daten, kontaktieren Sie uns einfach unter info@nola-ventures.com.