
Anmeldezeitraum Losverfahren: 14.04.25 (12 Uhr) – 17.04.25 (12 Uhr)

Bei freien Plätzen – Anmeldung möglich bis: 13.05.25 07:00 UHR
Nach einer Einführung in die grundlegenden Konzepte und Funktionalitäten von R werden wir im Kurs einen prototypischen Datenanalyse-Workflow durchlaufen: Import, Wrangling (Transformation und Cleaning), Exploration, (grundlegende) explorative Analyse und Visualisierung, Reporting. Ergänzend dazu wird in den Kurs ein Modul zur Nutzung und lokalen Ausführung von kostenlosen Sprachmodellen (LLMs) in R integriert. Dies umfasst unter anderem die Nutzung von lokalen und kostenlosen LLMs in R (z. B. mit llama.cpp, GPT4All oder ollama) und ihre Anwendungsfälle.
Jedes Thema des Kurses wird zunächst vorgestellt und anschließend mit einer Reihe von (hands-on) Übungen erarbeitet.
Lernziele:
Sie sind
- in der Lage, Ihre Daten mit R zu importieren, zu verarbeiten und zu untersuchen.
- in der Lage, grundlegende Visualisierungen und Analysen Ihrer Daten mit R durchzuführen.
- in der Lage, reproduzierbare Forschungsberichte mit R Markdown zu erstellen.
- in der Lage, lokale und kostenlose Sprachmodelle in R zu nutzen, um Texte zu generieren, zu analysieren und zu verarbeiten.
- in der Lage, lokal laufende Sprachmodelle auf Ihrem eigenen Rechner zu installieren und auszuführen.
Voraussetzungen:
- Studierende bringen ihren eigenen Laptop zur aktiven Teilnahme am Workshop mit
- Installation von RStudio (z.B. version 4.3.2, https://www.rstudio.com/)
- Ggf. Installation einer LaTeX version (install.packages(‚tinytex‘))
Arbeitsaufwand für ECTS:
2 ECTS: Aktive Teilnahme am Workshop, schriftlicher Reflexionsbericht und Data Challenge mit RMarkdown
Dozentin:
Veronika Batzdorfer ist Post-Doc Researcher am ITZ am KIT, wo sie im SoMe4Dem EU-Projekt arbeitet. Ihre Arbeit konzentriert sich auf die Verknüpfung digitaler Spurendaten mit anderen Datentypen sowie auf Techniken der natürlichen Sprachverarbeitung (NLP). Des Weiteren beschäftigt sie sich mit der Modellierung zeitlicher Dynamiken auf Social Media Plattformen und Themen wie die Reproduzierbarkeit von Analysepipelines und Causal Inference mit Textdaten (DAGs).
23.05.2025 12:00 Uhr – 23.05.2025 17:00 Uhr (30.96 Seminarraum 104 (1. OG))
24.05.2025 12:00 Uhr – 24.05.2025 17:00 Uhr (30.96 Seminarraum 104 (1. OG))
23.06.2025 12:00 Uhr – 23.06.2025 17:00 Uhr (11.40 Seminarraum 214)
24.06.2025 12:00 Uhr – 24.06.2025 17:00 Uhr (11.40 Seminarraum 214)
25.06.2025 12:00 Uhr – 25.06.2025 17:00 Uhr (11.40 Seminarraum 214)