Was ist die mCLOUD?
Die mCLOUD ist eine Rechercheplattform zu offenen Daten aus dem Bereich Mobilität und angrenzender Themen. Das BMVI stellt mit der mCLOUD einen zentralen Zugangspunkt zu allen offenen Daten seines Geschäftsbereiches zur Verfügung und öffnet das Portal auch für private Anbieter aus dem Mobilitätsbereich, um ihre Daten dort anzubieten.
Die mCLOUD soll in erster Linie Entwicklern in Unternehmen, Forschung und Verwaltung einen direkten Zugang zu Daten bieten und soll damit die Entwicklung neuer Ideen fördern. Der Datenschatz, der über die mCLOUD zugänglich gemacht wird, soll stetig erweitert werden. Auch die Funktionalitäten der Plattform werden schrittweise verbessert.
Welche Daten lassen sich in der mCLOUD recherchieren?
In der mCLOUD sind Daten aus den Themenbereichen Straßen-, Bahn- und Luftverkehr, Klima und Wetter sowie Gewässer und Wasserstraßen zu finden. Die Daten sind über Schlagworte recherchierbar und direkt zum Download oder zur dynamischen Einbindung in eigene Anwendungen verlinkt. Die Daten selbst liegen nicht in der mCLOUD. Stattdessen verweist die mCLOUD auf Datenschnittstellen und Download-Links der bereitstellenden Behörden und Unternehmen.
Derzeit sind nur solche Daten in der mCLOUD enthalten, die folgenden Open-Data-Ansprüchen genügen:
- Geldleistungsfreiheit
- Leichter Zugang (d.h. keine technischen Hürden, wie Benutzeranmeldung)
- Maschinenlesbarkeit (d.h. keine Dokumente, wie z.B. PDFs)
Wer stellt Daten über die mCLOUD bereit?
In der mCLOUD sind derzeit vor allem Daten aus dem Geschäftsbereich des BMVI recherchierbar. Aber auch Unternehmen können die Infrastruktur nutzen und ihre Daten hierüber anbieten. Es ist beabsichtigt, auch weitere offene Daten rund um das Thema Mobilität aus Behörden weiterer Verwaltungsebenen (Länder, Kommunen) einzubinden.
Entstehen Kosten durch die Nutzung von Daten, die über die mCLOUD zur Verfügung gestellt werden?
Die mCLOUD verweist derzeit nur auf Daten, die geldleistungsfrei bereitgestellt werden. Bei der Weiterverwendung der Daten gilt es, die spezifischen Lizenzbedingungen und Nutzungshinweise zu beachten (z.B. Anbringen eines Quellenvermerkes bei Veröffentlichungen).
Welche Möglichkeiten gibt es, um auf die Datenquellen zuzugreifen (Kategorien „Art der Quelle“)?
API
Eine API (application programming interface) ist eine Programmierschnittstelle, die den direkten Zugriff auf ein Programmteil (z.B. eine Datenbank) aus einem anderen Programm ermöglicht. Hier werden insbesondere Webservices darunter verstanden, die im Gegensatz bspw. zur FTP-Schnittstelle (s.u.) das direkte Einbinden sich dynamisch verändernder Daten in eigene Anwendungen und die interaktive Auswahl unterschiedlicher Parameter ermöglichen. Daten müssen dank einer solchen Schnittstelle nicht heruntergeladen und weiterverarbeitet werden. Häufige Schnittstellen und Datenaustauschformate solcher Web-APIs sind:
- JSON: Javascript Object Notation (JSON) ist ein einfaches Datenaustauschformat. Das Format dient der Kommunikation von Anwendungen untereinander. Die Struktur von JSON Dateien ist jedoch auch einfach für den Menschen erfassbar und lesbar.
- REST: Das Representational State Transfer (REST) ist ein Programmierparadigma für Webservices und verwendet v.a. http-Methoden.
- SOAP: Das Simple Object Access Protocol (SOAP) ist ein Netzwerkprotokoll zum Datenaustausch.
- WSDL: Die Webservice Description Language (WSDL) ist eine Beschreibungssprache zum Austausch von Informationen auf Basis von XML.
- XML: Die Extensible Markup Language (XML) ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten.
- YAML: Die vereinfachte Auszeichnungssprache YAML (YAML Ain’t Markup Language) dient dazu, komplexere Datenstrukturen zu serialisieren. Damit ist sie wesentlich leichter für Menschen lesbar, als bspw. XML, und dient der vereinfachten Weiterverarbeitung von Daten.
Atom Feed
Ein Atom Feed ist ein Datenformat zum Austausch von Informationen, in diesem Fall von Datensätzen. Die Funktionsweise entspricht der von RSS Feeds. Innerhalb der Atom Feed finden sich Informationen zu den Datensätzen sowie Links für das Herunterladen der Daten.
Dateidownload
Ein Dateidownload ist die einfachste Form einer Datenquelle in der mCLOUD. Hier wird ein einfacher Link zur Datei angegeben, die den entsprechenden Datensatz enthält (z.B. eine Excel-Tabelle). Wenn auf einer Webseite mehrere Dateien verlinkt sind (z.B. zu unterschiedlichen Jahresstatistiken), ist hier nur der Link auf die übergeordnete Website angegeben.
FTP
Das File Transfer Protocol (FTP) ist eine Schnittstelle zum Herunterladen von Dateien aus dem Internet. Im Browser stellt es sich in Form von Ordnerstrukturen - ähnlich denen im Windows Explorer - dar. Dateien können durch einfaches Aufrufen von Links heruntergeladen werden, entweder im Browser, einem FTP-Client oder direkt aus einer Anwendung heraus.
Portal
Portale sind Datenquellen, in denen der beschriebene Datensatz bereits aufbereitet verfügbar ist. Zumeist handelt es sich hierbei um Geoportale oder Kartenviewer, in denen die entsprechenden Geodaten visualisiert dargestellt werden, oder um andere Open-Data-Portale.
SOS
Sensor Observation Service (SOS) ist ein Webservice zur Abfrage von Sensordaten, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. Mit Hilfe dieses Dienstes können Echtzeit-Sensordaten interaktiv abgefragt werden.
WCS
Web Coverage Service (WCS) ist ein Geodatendienst-Standard, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. WCS-Dienste dienen der Bereitstellung von Geodaten in Rasterformaten. Über verschiedene Operationen können die Daten heruntergeladen werden.
WFS
Web Feature Service (WFS) ist ein Geodatendienst-Standard, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. WFS Dienste dienen der Bereitstellung von Geodaten in Vektorformaten. Über verschiedene Operationen können die Daten heruntergeladen werden.
WMS / WMTS
Web Map Service (WMS) ist ein Geodatendienst-Standard, der durch das Open Geospatial Consortium (OGC) spezifiziert wird. WMS Dienste dienen der Bereitstellung von Geodaten als Karten. Über verschiedene Operationen können Karten sowie Informationen zu den Karteninhalten heruntergeladen werden. Beim Web Map Tile Service (WMTS) werden die Geodaten kachelbasiert angeboten, was für viele Anwendungen die Performanz erhöht.
Was bedeutet der Hinweis auf die Verfügbarkeit in der Detailansicht der Datensätze?
Datendienst & Darstellungsdienst
Die bestmögliche Kategorie für die Verfügbarkeit eines Datensatzes stellt das Vorhandensein eines Datendienstes sowie eines Darstellungsdienstes dar. Ein Datendienst verfügt über standardisierte Schnittstellen für den Zugriff auf spezifische Datenmengen aus einem Datensatz. Durch einen Darstellungsdienst werden Möglichkeiten der Visualisierung des Datensatzes standardisiert bereitgestellt, damit sich der Nutzer ein Bild vom Datensatzinhalt machen kann, ohne auf die Daten selbst zugreifen zu müssen.
Datendienst
Ein Datendienst verfügt über standardisierte Schnittstellen für den Zugriff auf spezifische Datenmengen aus einem Datensatz.
Datei-Download & Darstellungsdienst
Ein Datei-Download alleine bietet dem Nutzer keine differenzierten Möglichkeiten auf einen Datensatz zuzugreifen. Er ermöglicht lediglich den Download des gesamten Datensatzes ohne Möglichkeiten der Einschränkung der Datenmengen, wie dies durch eine Datendienstschnittstelle gegeben wäre. Durch einen Darstellungsdienst werden Möglichkeiten der Visualisierung des Datensatzes standardisiert bereitgestellt damit sich der Nutzer ein Bild vom Datensatzinhalt machen kann, ohne auf die Daten selbst zuzugreifen.
Darstellungsdienst
Durch einen Darstellungsdienst werden Möglichkeiten der Visualisierung des Datensatzes standardisiert bereitgestellt damit sich der Nutzer ein Bild vom Datensatzinhalt machen kann, ohne auf die Daten selbst zugreifen zu müssen. Wird nur ein Darstellungsdienst angeboten, fehlt der direkte Zugriff auf die bereitgestellten Daten, wie er durch eine Datendienst-Schnittstelle oder einen Datei-Download gegeben wäre.
Datei-Download
Ein Datei-Download alleine bietet dem Nutzer keine differenzierten Möglichkeiten auf einen Datensatz zuzugreifen. Er ermöglicht lediglich den Download des gesamten Datensatzes ohne Möglichkeiten der Einschränkung der Datenmengen, wie dies durch eine Datendienstschnittstelle gegeben wäre. Auch fehlt die Bereitstellung eines Darstellungsdienstes zur Visualisierung.
Was sind häufige Datenformate, die über die mCLOUD heruntergeladen werden können?
In der Übersicht findet sich hinter jedem Datensatz, der als Dateidownload oder per FTP-Verbindung angeboten wird, ein Symbol mit der Bezeichnung eines Datenformates. Dieses Symbol gibt einen Hinweis auf das Format, in dem die Daten vorliegen. Häufige Datenformate sind:
ASCII
ASCII (American Standard Code for Information Interchange)-Dateien beinhalten eine einfache Zeichenkodierung und sind letztlich einfache Textdateien mit darstellbaren Zeichen. Oft sind Reihen von Messdaten in dieser Form kodiert.
CSV
Das Dateiformat CSV (Comma-separated values) beschreibt den Aufbau einer Text / ASCII-Datei zur Speicherung von Daten. Insbesondere Tabellen und Listen werden im CSV-Format abgebildet.
Shapefile
Ein von der Firma ESRI entwickeltes Dateiformat für Geodaten.
Excel
Von Microsoft entwickeltes Dateiformat zur Speicherung von Daten aus Tabellenkalkulations- und Datenbankprogrammen.
GeoJSON
Offener Datenstandard zum Austausch von Geodaten.
GML
Die Geography Markup Language (GML) basiert auf der Auszeichnungssprache XML und erlaubt den Austausch geografischer Objekte mit Attributen, Relationen und Geometrien. Internetfähige Geräte können hierüber einen direkten Zugriff auf geobezogene Daten erhalten.
netCDF
Das binäre Datenformat netCDF (Network Common Data Format) dient insb. dem Austausch wissenschaftlicher Daten und wird vor allem in der Klimatologie und im Geoinformationswesen verwendet.
TIFF
Das Tagged Image File Format (TIFF) ist ein Dateiformat zur Speicherung von Bilddaten.
TXT
Textdateien sind Dateien, die darstellbare Zeichen enthalten (im Gegensatz zu Binärdateien).
XML
Die Extensible Markup Language (XML) ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten.
Was bedeuten die Angaben zum Zeitraum?
Jahr (z.B. 2016)
Daten entsprechen dem Stand eines bestimmten Jahres.
Monat Jahr (z.B. April 2006)
Daten entsprechen dem Stand eines bestimmten Monats in einem Jahr.
Jahr/Jahr (z.B. 2006/2008)
Daten setzen sich aus Informationen aus verschiedenen Jahren zusammen.
Monat Jahr, Monat Jahr (Oktober 2015, März 2016)
Es liegen Daten aus (unregelmäßig) aufeinanderfolgenden Zeitpunkten vor.
Jahr – Jahr (z.B. 1959-2014)
Daten entsprechen einer (regelmäßigen) Zeitreihe.
Modellrechnung
Daten sind Ergebnis einer Modellierung und sind nicht an einen bestimmten (Erhebungs-)Zeitpunkt geknüpft.
Heute (gestern, vorgestern)
Die Daten gelten für den heutigen (gestrigen, vorgestrigen) Tag.
Echtzeit
Es handelt sich um Echtzeitdaten, die regelmäßig (oder unregelmäßig) aktualisiert werden.