NYC

Cabs

Leah Doellmann, Ekaterina Oreshnikova,
Daniel Martin, Denys Ivanchenko

Die zunehmende Globalisierung der letzten Jahre brachte dem öffentlichen Verkehr stetigen Aufschwung. Das lässt sich gerade in Großstädten wie New York beobachten, welche Massen an Touristen anziehen. Vor allem die ikonischen Taxen in NYC bergen eine große Menge unentdeckter Daten - vielseitige, faszinierende und außergewöhnliche Geschichten, die NYCCabs zum Vorschein bringt. Steig ein und entdecke das Universum der mehr als 325.000 Taxifahrten, die jeden Tag stattfinden.

Data

Die Taxi and Limousine Commission in New York, welche den Taxiverkehr koordiniert, stellt jedes Jahr die erhobenen Daten zur freien Verfügung. Dazu zählen neben den klassischen Yellow Cabs auch die Green Cabs, welche den Verkehr in der Innenstadt entlasten sollen und nur nördlich der W 110 St/E 96th St in Manhattan und den restlichen vier Boroughs fahren dürfen. Auch die Daten der FHV (For-Hire-Vehicles), zu denen zum Beispiel Limousinen zählen, wurden erhoben, für unsere Datenvisualisierung aufgrund der Konzentration auf die Dynamik zwischen Green und Yellow Cabs aber nicht weiter beachtet.

Taxi-Lokationen werden von der TLC nicht in genauen geographischen Koordinaten aufgezeichnet, stattdessen besteht ganz New York aus Feldern, sogenannten Zonen. Davon gibt es 263, mit Zone 264 & 265 für Fahrten außerhalb des Stadtgebietes. Neben dieser Pick-Up und Drop-Off Location sind die Zeiten im Datensatz enthalten, die Passagieranzahl, Mautgebühren, Trinkgelder, Bar oder Kartenzahlung, die Gesamtgebühr sowie die Distanz.

Um die Menge der Fahrten besser greifen zu können, konzentrierten wir uns auf den Datensatz eines zufällig ausgewählten Tages. An einem Tag gibt es etwa 260.000 Fahrten mit den Yellow Cabs und 21.000 Fahrten der Green Cabs.

Alle Taxifahrten eines Tages

Alle Taxifahrten einer Stunde

Die Taxifahrten eines Tages von oder zu Flughäfen

Taxifahrten eines Tages innerhalb Manhattans

Process

Durch die Menge an Daten gab es von Anfang an viele unterschiedliche Richtungen, die wir mit unserer Datenvisualisierung austesten wollten – sollte es ein Tool zur Unterstützung der Verkehrsplanung werden, um Staus und Überlastung zu vermeiden, eine Informationsquelle für die TLC um Taxi-Standorte umzusiedeln und den Service zu verbessern oder doch den Taxifahrern selbst helfen, ihre Route zu planen und die für sich profitabelste Arbeitsweise herauszufiltern?

Nach vielen Interaktions-Runden stellte sich heraus, dass wir in jedem Fall eine Grundlage zur Erfassung der Daten des Betrachters brauchten, eine Verortung der Fahrten durch Lokation und Zeit. Durch Anraten von Boris konzentrierten wir uns nun vorerst auf die Auseinandersetzung mit den realen Daten, nicht den Parametern, wie sie in unserer Vorstellung existierten. Wir untersuchten den Hintergrund der Daten, beispielsweise was einem der Parameter des Trinkgeldes konkret vermitteln sollte.

Überraschenderweise stoßen wir auf viele unerwartete Einzelfahrten, Maxima und Minima in den Daten, welche Geschichten erzählten. Wir entscheiden uns dafür, diese Geschichten vorrangig in den Vordergrund zu rücken, die bei einer einfachen Betrachtung der Daten nicht ans Licht gekommen wären. NYCCabs ist somit ein Explorationstool, welches dem User Geschichten aus der Taxi-Welt New Yorks erzählt und dabei einige Eigenheiten der Stadt aufdeckt.

Die Entscheidung, uns von einer geographisch korrekten Darstellung zu lösen und anhand der Zonen zu einer übersichtlichen Struktur mit geographischem Bezug zu finden, bei der zu jeder Zeit noch deutlich wird, wo sich welcher Ort befindet, brachte uns der schlussendlichen Gestaltung einen großen Schritt näher. Mithilfe von Binning der Datengrößen gelang es uns, der Größe der Zone stets einen Wert zuzuschreiben – sei es die Fahrtenanzahl oder die Fahrtkosten. So lassen sich bereits durch die sich verändernde visuelle Darstellung datenbasierte Informationen vermitteln. Diese Methode ist zum Kernpunkt unserer Datenvisualisierung geworden.

Skizzen 1

Skizzen 2

Skizze 3

Skizze 4

Skizze 5

Skizze 6

Structure

Der User wird durch eine zeitbasierte Visualisierung der einzelnen Taxifahrten am Tag in New York in das Interface eingeführt. Hier wird ein Gesamteindruck der Situation geschaffen und für die nachfolgenden Daten sensibilisiert. Schnell wird einem klar, welche Unmengen an Einzelfahrten pro Tag stattfinden und wie schwierig es ist, diese Menge zu erfassen. Der Zeitablauf stellt dabei in stündlichen Abständen die Fahrten innerhalb dieser Stunde dar. Es ist die Möglichkeit gegeben, die Animation anzuhalten und den zeitlichen Ablauf selber zu kontrollieren, um einzelne Zeitfenster im Detail zu betrachten.

Die Infotexte, welche nacheinander eingeblendet werden, geben einen allgemeinen Einblick in die Situation der Taxis in New York. Dank Ihnen fällt es unwissenden Betrachtern leichter, die Daten nicht nur zu sehen, sondern auch zu verarbeiten.

Die Ansicht erlaubt es dem Betrachter, den Taxiverlauf innerhalb eines Tages, einer Stunde oder mit Fixierung auf die Flughäfen zu verfolgen. Die Ansicht kann dabei variabel zwischen dreidimensionaler Ansicht und einem Draufblick angepasst werden.

Gesamtübersicht 24 Stunden

Gesamtübersicht eine Stunde

Über die Navigationsleiste kann man tiefer in die Visualisierung und somit die Datenstruktur eintauchen. Da wir unseren Fokus auf ein exploratives Tool gelegt haben, ist es hier möglich, unterschiedliche Parameter selbst zu untersuchen und zwischen Zeiträumen und Taxiart zu vergleichen. Dabei werden die Fahrten einzelner Zonen geclustert. Die Größe des Zonenpunktes spiegelt somit entweder die Anzahl der Fahrten (Aktivität), der Passagieranzahl oder der Kosten wider. Unterteilt werden die Parameter zur besseren Übersicht nochmals in Pick-Ups (begonnene Fahrten), Drop-Offs (der Endpunkt), Standard-Taxi und Großraumtaxi, sowie Fahrtkosten und Trinkgelder. Auch hier lässt sich das Interface über die Zeitslots selbstbestimmt steuern. Die Legende weist auf die Unterscheidung zwischen Green und Yellow Cabs und das Größenverhältnis der Zonen hin. Eine weitere Möglichkeit ist es, bei großem Eigeninteresse eine einzelne Zone auszuwählen und von diesem Punkt aus die Fahrten nachzuverfolgen.

Zur besseren Orientierung im Interface bleiben die ursprünglichen Zonenkerne erhalten. Durch Hovern lassen sich konkrete Informationen zu der Zone und den Fahrtinformationen erfassen.

Das Prinzip des Weiterklingen von Slides zieht sich durch das gesamte Interface. Auch hier lassen sich so Informationen zu den Daten entdecken und erläutern, die nicht auf den ersten Blick ersichtlich sind.

Clustering nach Pick-Ups

Clustering nach Passagieranzahl

Alle Ziele ausgehen von einer ausgewählten Zone

Zur besseren Orientierung im Interface bleiben die ursprünglichen Zonenkerne erhalten. Durch Hovern lassen sich konkrete Informationen zu der Zone und den Fahrtinformationen erfassen.

Das Prinzip des Weiterklicken von Slides zieht sich durch das gesamte Interface. Auch hier lassen sich so Informationen zu den Daten entdecken und erläutern, die nicht auf den ersten Blick ersichtlich sind.

Clustering nach Gesamtkosten

Clustering nach Rentabilität

Clustering der teuersten Fahrten

Clustering nach Trinkgeldern

Stories

Durch die dritte Ebene wird es dem Betrachter möglich, tief in das Taxiuniversum einzutauchen und in der Unmenge an Daten versteckte Data Stories zu entdecken. Unter verschiedenen Aspekten werden dabei Hintergrundinformationen beleuchtet, die ein klares Bild der Stadt New York in Bezug auf Taxis abzeichnen. Wir haben uns auf sechs Stories konzentriert, die Lost Places (unbefahrene Zonen), Early Birds (Frühaufsteher), Party People (Nachtfahrer), Lazy or Not (die kürzesten Strecken), Tourist Trap (touristische Ziele ausgehend von den Flughäfen) und der Golden Ride (unter der Prämisse, das jeden Tag eine besonders verrückte/ungewöhnliche/interessante Fahrt stattfindet).

Lost Places

Staten Island

Durch Anwendung des Slideprinzips lassen sich spezifizierte Informationen einblenden. Auf diese Data Stories lässt sich einerseits über die Navigationsleiste zurückgreifen, andererseits lassen sie sich über Erzählsternchen im Interface verteilt an relevanten geographischen Positionen wiederfinden, die dazu einladen, versteckte Geschichten zu entdecken.

Early Birds

Party People

Lazy or Not

Tourist Trap

Prototype

Der Prototyp kombiniert verschiedene Tools. Die Gesamtansicht ist mit der 3D Software Houdini prozedural generiert und animiert worden. Das Clustering ist in Processing programmiert worden. Die Interfaceelemente entstanden in Figma und wurden mit Principle animiert. Die einzelnen Elemente wurden in After Effects zu einem Videoprototypen zusammengebaut.