Dominik Fries zeigt in diesem Vortrag wie große Datenmengen auf Hadoop im Schnellverfahren – unter Berücksichtigung von Auflagen für den Schutz von personenbezogenen Daten – für Ad-Hoc Analysen aufbereitet werden.

Diese Daten werden im darauffolgenden Schritt mit Webnotebooks exploriert, um die Basis für operationalisierte Machine Learning Algorithmen zu legen. Auch Operationalisierung und der Datenexport für Self-Service-BI-Tools wie Tableau sind ein Thema.