Stefan Papp zeigt in diesem Vortrag wie große Datenmengen auf Hadoop im Schnellverfahren – unter Berücksichtigung von Auflagen für den Schutz von personenbezogenen Daten – für Ad-Hoc Analysen aufbereitet werden. Diese Daten werden im darauffolgenden Schritt im Workshop mit Webnotebooks exploriert, um die Basis für operationalisierte Machine Learning Algorithmen zu legen. Auch Operationalisierung und der Datenexport für Self-Service-BI-Tools wie Tableau sind ein Thema.