Dieser Workshop bietet eine praktische Einführung in die Programmiersprache R, die auf S und Scheme aufbaut.

Zu Beginn wird R vorgestellt, der Unterschied zu anderen Statistik-Programmen herausgearbeitet und Vor- und Nachteile der Sprache aufgezeigt.

Anschließend arbeiten die Teilnehmer mit R-Studio. Es werden vorab die Installation, das Importieren von Daten in R-Studio, aber auch die Ausnutzung von Schnittstellen zu verschiedenen Datenbanksystemen besprochen.

Anhand einer beispielhaften Kundendatenbank werden den Teilnehmern einige statistische Auswertungsmöglichkeiten in R-Studio vermittelt:

      -Kumulieren von Daten
      -Beschreibung der Daten (Merkmale der Kunden): Merkmalsausprägungen, Skalierungen
      -Berechnung von relativen und bedingten, relativen Häufigkeiten
      -Beschreibung der Häufigkeitsverteilungen durch Bestimmung von Lage- und Streumaße (Mittelwert, Median, Modi, Varianz, Standardabweichung, Interquartilsabstände, Schiefe, etc.)
      -Grafische Darstellung und statistische Interpretation der Daten durch Histogramme, Box-Plots, Scatterplots, etc.
      -Berechnung von Kennwerten zur Bestimmung von monotonen und/oder linearen Zusammenhängen zwischen Kundenmerkmalen
              -Grafische Darstellung der Zusammenhänge

Im Anschluss soll kurz auf weitere Anwendungsbereiche, wie zum Beispiel in Microsofts Machine Learning Umgebung, eingegangen werden.

 

Anforderungen für Teilnehmer:
Notebooks mit vorinstallierter R-Software und R-Studio mitbringen.

Wichtig ist die Reihenfolge der Installation:
Zuerst: R-3.2.2 (gibt es für Windows, Linux und OS X) https://cran.r-project.org
Danach: R-Studio (die Desktopversion ist ausreichend) https://www.rstudio.com

Falls es dabei Probleme gibt, kann das auch während des Workshops besprochen/behoben werden.