R - CSV-Dateien: Ein Anfängerleitfaden
Hallo da draußen, zukünftige R-Programmierer! Heute machen wir uns auf eine aufregende Reise in die Welt der CSV-Dateien in R. Machen Sie sich keine Sorgen, wenn Sie noch nie eine Zeile Code geschrieben haben - ich werde Ihr freundlicher Guide an jedem Schritt des Weges sein. Am Ende dieses Tutorials werden Sie CSV-Dateien wie ein Profi handhaben!
Was ist eine CSV-Datei?
Bevor wir eintauchen, lassen Sie uns mit den Grundlagen beginnen. CSV steht für "Komma-getrennte Werte". Es ist ein einfaches Dateiformat zur Speicherung von tabellarischen Daten, wie zum Beispiel in Tabellenkalkulationen oder Datenbanken. Jede Zeile in einer CSV-Datei represents eine Datenreihe, und jedes Feld wird durch ein Komma getrennt. Einfach, oder?
Arbeitsverzeichnis festlegen
Wenn Sie mit Dateien in R arbeiten, ist es entscheidend zu verstehen, wo R nach diesen Dateien sucht. Dieser Ort wird als "Arbeitsverzeichnis" bezeichnet.
Aktuelles Arbeitsverzeichnis überprüfen
Um Ihr aktuelles Arbeitsverzeichnis herauszufinden, verwenden Sie diesen Befehl:
getwd()
Wenn Sie diesen Befehl ausführen, wird R Ihnen den aktuellen Pfad anzeigen. Zum Beispiel könnte er folgendes zurückgeben:
[1] "C:/Users/IhrName/Dokumente"
Neues Arbeitsverzeichnis festlegen
Wenn Sie Ihr Arbeitsverzeichnis ändern möchten, verwenden Sie die Funktion setwd()
:
setwd("C:/Pfad/Zu/Ihrem/Gewünschten/Verzeichnis")
Erinnern Sie sich daran, in Ihrem Pfad Schrägstriche (/) oder doppelte Backslashes (\) zu verwenden, selbst unter Windows!
CSV-Datei als Eingabe
Nun, da wir wissen, wo R nach Dateien sucht, lassen Sie uns über das Einlesen von Daten aus einer CSV-Datei sprechen.
Eine CSV-Datei lesen
R macht es super einfach, CSV-Dateien mit der Funktion read.csv()
zu lesen. So verwenden Sie sie:
data <- read.csv("your_file.csv")
Dieser Befehl liest die CSV-Datei namens "your_file.csv" und speichert sie in einer Variable namens data
.
Angenommen, wir haben eine CSV-Datei namens "students.csv" mit Informationen über Schüler. So lesen wir sie:
students <- read.csv("students.csv")
Nachdem Sie diesen Befehl ausgeführt haben, wird students
ein Datenrahmen sein, der alle Informationen aus der CSV-Datei enthält.
Daten ansehen
Um einen Blick auf Ihre neu importierten Daten zu werfen, können Sie diese praktischen Funktionen verwenden:
head(students) # Zeigt die ersten 6 Zeilen
str(students) # Zeigt die Struktur der Daten
summary(students) # Gibt eine Zusammenfassung jeder Spalte
CSV-Datei analysieren
Jetzt, da wir unsere Daten in R haben, lassen Sie uns einige grundlegende Analysen durchführen!
Spalten abrufen
Sie können individuelle Spalten mit dem $
-Symbol abrufen:
students$age # Gibt alle Werte in der 'age'-Spalte zurück
Grundlegende Statistiken
R hat viele integrierte Funktionen für statistische Analysen:
mean(students$age) # Berechnet das Durchschnittsalter
median(students$age) # Findet das Medianalter
max(students$age) # Findet das maximale Alter
min(students$age) # Findet das minimale Alter
Daten filtern
Sie können Ihre Daten auch basierend auf Bedingungen filtern:
honor_students <- students[students$gpa > 3.5, ]
Dies erstellt einen neuen Datenrahmen honor_students
, der nur Schüler mit einem GPA über 3.5 enthält.
In eine CSV-Datei schreiben
genau wie wir aus CSV-Dateien lesen können, können wir auch in sie schreiben. Dies ist nützlich, wenn Sie Ihre Daten manipuliert haben und die Ergebnisse speichern möchten.
Um einen Datenrahmen in eine CSV-Datei zu schreiben, verwenden Sie die Funktion write.csv()
:
write.csv(honor_students, "honor_students.csv")
Dieser Befehl erstellt eine neue Datei namens "honor_students.csv" in Ihrem Arbeitsverzeichnis, die die Daten aus dem honor_students
-Datenrahmen enthält.
Wichtige Optionen für write.csv()
Hier sind einige nützliche Optionen, die Sie mit write.csv()
verwenden können:
Option | Beschreibung |
---|---|
row.names = FALSE |
Schließt die Zeilennummern von der Ausgabe aus |
quote = FALSE |
Verhindert das Zitieren von Zeichenketten |
na = "NA" |
Legt fest, wie fehlende Werte dargestellt werden |
Zum Beispiel:
write.csv(honor_students, "honor_students.csv", row.names = FALSE)
Dies schreibt die CSV-Datei ohne Zeilennummern.
Schlussfolgerung
Glückwunsch! Sie haben gerade die Grundlagen des Umgangs mit CSV-Dateien in R gelernt. Vom Lesen von Dateien bis hin zur Datenanalyse und dem Schreiben neuer Dateien haben Sie jetzt die grundlegenden Fähigkeiten, um Ihre Datenanalyse-Reise zu beginnen.
Erinnern Sie sich daran, dass Übung den Meister macht. Versuchen Sie, mit verschiedenen CSV-Dateien zu arbeiten, experimentieren Sie mit verschiedenen Funktionen und haben Sie keine Angst vor Fehlern - das ist, wie wir lernen!
Frohes Coden und möge Ihre Daten immer sauber sein und Ihre Analysen einsichtig!
Credits: Image by storyset