Big Data in der Bildungsforschung

Mit zunehmender Digitalisierung von Schulen und Hochschulen nimmt der Datenreichtum von Bildungseinrichtungen und angeschlossener staatlicher Einrichtungen, wie Landes- und Bundesämter, zunehmend zu. Mit diesen nun vorliegenden administrativen Daten ergeben sich neue Möglichkeiten der Datenanalyse. Als besonders auf große Datenmengen zugeschnittene Methoden bieten sich Methoden des maschinellen Lernens an. Maschinelle Methoden lassen sich in "unsupervised" (clustering) und "supervised" (predicting & classification) learning unterscheiden.

In dem Workshop werden die verschiedenen Methoden des maschinellen Lernens vorgestellt und dezidiert der Prozess des maschinellen Lernens erläutert: Rohdatengewinnung, Datenbereinigung, feature engineering (Operationalisierung von Variablen), Lernphase und Anwendung trainierter Systeme. Dabei wird der Datenbereinigung und feature engineering besondere Aufmerksamkeit zukommen und weniger der Modifikation bestehender Lernalgorithmen. Im Anschluss wird ein Testdatensatz von Studierendendaten durch die Teilnehmer selbst aufbereitet, in maschinenlesbare Form umgewandelt, mittels verschiedener Lernalgorithmen analysiert und einfache Studienereignisse (wie Studienabbrüche oder die Aufnahme eines Studiums) prognostiziert.

Zur Teilnahme ist ein eigener Laptop mit Microsoft Office sowie den frei zugänglichen Programmen "WEKA 3.8" und "membrain 11.01" empfehlenswert.

Verbindliche Anmeldung per E-Mail an Dr. Christian Spoden: spoden@die-bonn.de

Referent: Johannes Berens, Bergische Universität Wuppertal

Von
Bis
Ort
DIE Bonn, Heinemannstr. 12-14, 53175 Bonn