Zum Inhalt springenZur Suche springen

Interaktive Statistik mit R – ein problembasierter Ansatz


Ausgangssituation und Gründe für den Einsatz von eLearning

Die empirische Auswertung von Datensätzen ist in der Informationswissenschaft von großer Bedeutung. Insbesondere der angemessene Umgang mit statistischen Methoden und die Nutzung von entsprechender Statistiksoftware sind dafür essenziell. Zur Vor- und Nachbereitung der Lerninhalte, ist es notwendig, sich sowohl mit der Theorie als auch der Software zu beschäftigen. Dazu eignen sich insbesondere eLearning-Angebote, welche die interaktive Auseinandersetzung mit statistischen Problemstellungen fördern. Die eLearning-Inhalte können außerdem beim Verfassen von Haus- und Abschlussarbeiten als Nachschlagewerk verwendet werden und sind somit zeit- und ortsunabhängig nutzbar.

Ziele & Zielgruppen

Das Modul Statistik des Wahlpflichtbereichs empfiehlt sich für Studierende des Masters Informationswissenschaft und Sprachtechnologie, die Grundkenntnisse der (deskriptiven) Statistik erwerben möchten, welche insbesondere für empirische Abschlussarbeiten notwendig sind. Das Modul besteht aus zwei Seminaren (4 SWS + 2 SWS), wobei das Projekt die Veranstaltung im Umfang von 4 SWS abbildet.  Neben theoretischen Grundlagen der Statistik lehrt das Modul auch die Benutzung von Statistiksoftware wie SPSS oder R. Da für Masterarbeiten in der Informationswissenschaft die eigenständige Analyse experimenteller Daten von großer Bedeutung ist, liegt das Hauptziel darin, den Studierenden den Erwerb statistischer Grundkenntnisse zeit- und ortsunabhängig mit der freien Software R zu ermöglichen. Dabei kommen reale Beispiele und Datensätze aus dem Bereich der Informationswissenschaft zum Einsatz, welche die Studierenden auf Problemstellungen in Abschlussarbeiten vorbereiten. Der Fokus liegt dabei auf der Durchführung von Auswertung und der Methodik und weniger auf den konkreten Ergebnissen in diesen Fällen. Durch die Verwendung verschiedener Beispiele für die betrachteten Methoden soll eine Grundlage für Transferleistungen auf eigene Problemstellungen gelegt werden.

Umsetzung

Für die statistischen Analysen wird die Software RStudio verwendet, welche ebenfalls unter freier Lizenz verfügbar ist und eine integrierte Umgebung zur Betrachtung, Verarbeitung, grafischen Darstellung, Auswertung und zum Export von Daten zur Verfügung stellt. Die Lehrveranstaltung wurde derart gestaltet, dass sich Präsenzveranstaltung und eLearning-Inhalte sinnvoll ergänzen. Das eLearning-Angebot besteht aus zwei Teilen: (1) der Erstellung von Screencasts zur Nachbereitung der theoretischen Inhalte sowie der Erklärung der Software R und den Umgang mit RStudio, und (2) der Bereitstellung interaktiver Module, mithilfe derer Studierende Problemstellungen eigenständig mit der Software R bearbeiten können.

(1) Die Inhalte des Seminars wurden in den Videos noch einmal aufgegriffen. Dabei wurden sowohl theoretische Grundlagen wiederholt und mit weiteren Beispielen erläutert, als auch die Verwendung der Software R und die dafür nötigen Befehle in Form von Screencasts aufgenommen.

(2) Für R existiert eine Erweiterung namens „swirl“, welches das Durchlaufen interaktiver Module ermöglicht. Dadurch ist ein Rahmen für die Erstellung eigener Inhalte gegeben, welche an die eigenen Bedürfnisse angepasst werden können. Im Rahmen dieses Projekts wurden entsprechend swirl-Inhalte erstellt und zur Verfügung gestellt, anhand derer die Abläufe des Seminars noch einmal Schritt für Schritt - inklusive Prüfung der Ergebnisse - durchgeführt werden konnten.

Für beide eLearning-Elemente stand jeweils eine wissenschaftliche Hilfskraft zur Verfügung, welche die Umsetzung federführend geplant und durchgeführt hat.

Ergebnisse und Ausblick

Während der Erstellung der Inhalte für swirl hat sich gezeigt, dass die zu diesem Zeitpunkt aktuelle Version einige Schwierigkeiten für die Verarbeitung aufweist. So wurden Sprungmarken im Ablauf teilweise nicht korrekt verwendet und die automatisierte Verarbeitung von Eingaben in R-Code funktionierte nicht zuverlässig bei komplexeren Eingaben. Diese Probleme traten insbesondere erst zu einem späteren Zeitpunkt in der Veranstaltung auf. Es wurde daher beschlossen, eine andere Möglichkeit für die interaktive Bearbeitung der Lerninhalte zu verwenden. Die Wahl fiel dabei auf die Plattform DataCamp, welche neben eigenen Kursen zu verschiedenen Inhalten in den Bereichen Programmierung und Statistik auch die kostenfreie Erstellung eigener Kurse mit selbst erstellten Inhalten ermöglicht. Zur Nutzung sind lediglich die kostenfreie Anmeldung und Erstellung eines Nutzerkontos nötig. Die für swirl erstellten Inhalte konnten so mit wenig Aufwand übernommen und mit den Mechaniken der DataCamp-Plattform aufbereitet werden.

Aufgrund der Verzögerungen durch den Wechsel der Plattform bei den interaktiven Lektionen war eine Evaluation dieser im laufenden Seminarbetrieb nicht mehr möglich. Im Anschluss an das Semester war die Befragung einzelner Studierender möglich, welche jedoch nur qualitativ wiedergegeben werden können:

- Interaktive Arbeit an Aufgaben direkt im Browser hat gut gefallen

- Hinweise auf der Plattform und schrittweise Erarbeitung von Inhalten sind gut gelöst

- Plattform wirkt modern, Gamification-Elemente spornen bei der Nutzung an

Die Qualität der Videos wurde durch Umfragen im Seminar evaluiert. Dabei wurde Folgendes festgestellt:

- Videos eignen sich gut, die grundlegenden Inhalte und Zusammenhänge noch einmal zu erfahren

- Verbindung von Grundlagen und Umsetzung in R kann noch einmal gut nachvollzogen werden

- Vor- und Zurückspulen möglich, daher eigenes Tempo einstellbar

- Umfang jedoch auf wenige Themen begrenzt

Verantwortlichkeit: