R - Strings: A Beginner's Guide

Hallo daar, zukünftige R-Programmierer! Heute machen wir uns auf eine aufregende Reise in die Welt der Zeichenketten in R. Machen Sie sich keine Sorgen, wenn Sie noch nie eine Zeile Code geschrieben haben - ich werde Ihr freundlicher Guide sein, und wir werden dies Schritt für Schritt durchgehen. Am Ende dieses Tutorials werden Sie Zeichenketten wie ein Profi manipulieren können!

R - Strings

Was sind Zeichenketten?

Bevor wir eintauchen, lassen Sie uns mit den Grundlagen beginnen. In der Programmierung ist eine Zeichenkette einfach eine Abfolge von Zeichen. Es könnte ein Wort, ein Satz oder sogar ein ganzer Absatz sein. In R erstellen wir Zeichenketten, indem wir Text in einfache Anführungszeichen ('') oder doppelte Anführungszeichen ("") einbetten.

Lassen Sie uns unsere erste Zeichenkette erstellen:

meine_erste_zeichenkette <- "Hallo, Welt!"
print(meine_erste_zeichenkette)

Wenn Sie diesen Code ausführen, werden Sie sehen:

[1] "Hallo, Welt!"

Glückwunsch! Sie haben gerade Ihre erste Zeichenkette in R erstellt und ausgegeben. Das Symbol <- ist die Art und Weise, wie wir Werte zu Variablen in R zuweisen. Denken Sie daran als das Einlegen der Zeichenkette "Hallo, Welt!" in eine Schachtel mit der Aufschrift meine_erste_zeichenkette.

Regeln für die Erstellung von Zeichenketten

Nun, da wir unsere Füße ins Wasser getaucht haben, lassen uns einige Regeln für die Erstellung von Zeichenketten in R erkunden.

1. Einfache vs. doppelte Anführungszeichen

In R können Sie sowohl einfache als auch doppelte Anführungszeichen zur Erstellung einer Zeichenkette verwenden:

zeichenkette1 <- 'Ich bin eine Zeichenkette'
zeichenkette2 <- "Ich bin auch eine Zeichenkette"
print(zeichenkette1)
print(zeichenkette2)

Beide funktionieren hervorragend. Es gibt jedoch einen coolen Trick: Wenn Sie Anführungszeichen in Ihrer Zeichenkette einbetten möchten, können Sie das entgegengesetzte Anführungszeichen zur Einbettung verwenden:

anfuhrungszeichen_zeichenkette <- "Sie sagte, 'R ist großartig!'"
print(anfuhrungszeichen_zeichenkette)

2. Escape-Zeichen

Manchmal möchten Sie spezielle Zeichen in Ihrer Zeichenkette einbetten. Hierfür verwenden wir Escape-Zeichen, die immer mit einem Backslash () beginnen.

Hier sind einige häufige Escape-Zeichen:

Escape-Zeichen Bedeutung
\n Neue Zeile
\t Tabulator
\" Doppelter Anführer
\' Einfacher Anführer
\\ Backslash

Sehen wir uns sie in Aktion an:

escaped_zeichenkette <- "Dies ist eine Zeile.\nDies ist eine neue Zeile.\tDies ist ein Tabulator."
cat(escaped_zeichenkette)

Ausgabe:

Dies ist eine Zeile.
Dies ist eine neue Zeile.   Dies ist ein Tabulator.

Die cat()-Funktion ist großartig zum Ausgeben von Zeichenketten mit Escape-Zeichen, da sie diese korrekt interpretiert.

3. Rohe Zeichenketten

Wenn Sie mit vielen Backslashes arbeiten (wie Pfaden unter Windows), können Sie rohe Zeichenketten verwenden. Diese werden mit r vorangestellt und behandeln Backslashes als Literale:

normale_zeichenkette <- "C:\\Users\\IhrName\\Dokumente"
rohe_zeichenkette <- r"(C:\Users\IhrName\Documents)"
print(normale_zeichenkette)
print(rohe_zeichenkette)

Sie werden sehen, dass die normale Zeichenkette die Backslashes als Escape-Zeichen interpretiert, während die rohe Zeichenkette sie so belässt.

Zeichenkettenmanipulation

Nun, da wir wissen, wie man Zeichenketten erstellt, lernen wir, wie man sie manipuliert!

1. Verkettung

Verkettung ist einfach ein schicker Ausdruck für das Zusammenfügen von Zeichenketten. In R verwenden wir die paste()- oder paste0()-Funktion dafür:

vorname <- "John"
nachname <- "Doe"
voll_name <- paste(vorname, nachname)
print(voll_name)

# `paste0()` ist ähnlich, fügt jedoch keine Leerzeichen zwischen Elementen ein
voll_name_ohne_leerzeichen <- paste0(vorname, nachname)
print(voll_name_ohne_leerzeichen)

Ausgabe:

[1] "John Doe"
[1] "JohnDoe"

2. Extrahieren von Teilzeichenketten

Oft möchte man einen Teil einer Zeichenkette extrahieren. Wir können dies mit eckigen Klammern [] tun:

meine_zeichenkette <- "R ist fantastisch!"
print(meine_zeichenkette[1:5])  # Die ersten 5 Zeichen erhalten

Ausgabe:

[1] "R ist "

3. Länge der Zeichenkette

Um herauszufinden, wie lang eine Zeichenkette ist, verwenden wir die nchar()-Funktion:

meine_zeichenkette <- "Wie lang bin ich?"
print(nchar(meine_zeichenkette))

Ausgabe:

[1] 15

4. Ändern der Groß- und Kleinschreibung

R bietet Funktionen zur Änderung der Groß- und Kleinschreibung von Zeichenketten:

gemischte_schreibung <- "ThIs Is MiXeD cAsE"
print(toupper(gemischte_schreibung))  # Alles groß
print(tolower(gemischte_schreibung))  # Alles klein

Ausgabe:

[1] "THIS IS MIXED CASE"
[1] "this is mixed case"

5. Suchen und Ersetzen

Die gsub()-Funktion ist großartig zum Finden und Ersetzen von Teilen einer Zeichenkette:

satz <- "Der schnelle braune Fuchs springt über den faulen Hund"
neuer_satz <- gsub("Fuchs", "Katze", satz)
print(neuer_satz)

Ausgabe:

[1] "Der schnelle braune Katze springt über den faulen Hund"

Schlussfolgerung

Wow, wir haben heute viel Boden gewonnen! Vom Erstellen Ihrer ersten Zeichenkette bis hin zur Manipulation wie ein Profi, Sie haben Ihre ersten Schritte in die wundervolle Welt der R-Programmierung gemacht. Denken Sie daran, dass Übung den Meister macht, also fürchten Sie sich nicht, mit diesen Konzepten zu experimentieren.

Hier ist eine kleine Herausforderung für Sie: Versuchen Sie, eine Zeichenkette mit Ihrem Namen zu erstellen, extrahieren Sie Ihre Initialen daraus und drucken Sie sie in Großbuchstaben aus. Wenn Sie das können, sind Sie auf dem besten Weg, ein Meister der R-Zeichenketten zu werden!

Weiter codieren, weiter lernen und vor allem: Viel Spaß! Die Reise von tausend Meilen beginnt mit einem einzigen Schritt, und Sie haben gerade Ihren ersten in der R-Programmierung gemacht. Bis zum nächsten Mal, fröhliches Coden!

Credits: Image by storyset