Arbeiten mit Text
Herzlich Willkommen zur neunten inhaltlichen Sitzung in unserem Kurs “R Lernen - Der Datenkurs von und für die Zivilgesellschaft”!
Nachdem wir uns mit den Methoden der Datenmtransformation und -visualisierung beschäftigt haben, richten wir heute unseren Fokus auf einen speziellen, aber oft herausfordernden Datentyp: Textdaten. Texte begegnen uns in vielen Bereichen – von Namen und Adressen in Datensätzen bis hin zu umfangreichen Textanalysen in der Forschung oder Sozialen Medien.
In dieser Sitzung lernen wir, wie wir Textdaten identifizieren, bereinigen und transformieren können. Dabei werden wir erste Einblicke in das Prinzip der regulären Ausdrücke (Regex) gewinnen – ein mächtiges Werkzeug, das uns hilft, Muster in Texten zu erkennen und gezielt zu verändern.
Die Lernziele für die heutige Sitzung sind:
- Verständnis dafür, was Textdaten sind und welche Herausforderungen sie mit sich bringen.
- Kennenlernen verschiedener Methoden zur Verarbeitung von Textdaten in R, insbesondere mit dem Paket
stringr
.
- Erster Einblick in reguläre Ausdrücke (Regex) und wie sie genutzt werden können, um Texte effizient zu durchsuchen, zu bereinigen und zu transformieren.
Obwohl der Umgang mit Textdaten und regulären Ausdrücken zunächst ungewohnt erscheinen mag, lohnt es sich, diese Techniken zu verstehen – sie können uns helfen, große Textmengen gezielt zu analysieren und zu strukturieren.
Lasst uns gemeinsam in die Welt der Textverarbeitung eintauchen! ✨