R - CSV 파일: 초보자 가이드

안녕하세요, 미래의 R 프로그래머 여러분! 오늘 우리는 R에서 CSV 파일의 세계로 흥미로운 여정을 떠납니다. 코드를 한 줄도 작성해본 적이 없더라도 걱정하지 마세요 - 나는 여러분의 친절한 안내자가 될 것입니다. 이 튜토리얼의 끝을 맺을 때, 여러분은 CSV 파일을 마치 프로처럼 다룰 수 있을 것입니다!

R - CSV Files

CSV 파일이란?

들어가기 전에, 기본 개념을了解一下みましょう. CSV는 "Comma-Separated Values"의 약자로, 스프레드시트나 데이터베이스와 같은 표 형식의 데이터를 저장하는 간단한 파일 형식입니다. CSV 파일의 각 줄은 데이터의 행을 나타내며, 각 필드는 쉼표로 구분됩니다. 간단하죠?

작업 디렉토리 설정 및 확인

R에서 파일을 처리할 때, R이 파일을 찾는 위치를 이해하는 것이 매우 중요합니다. 이 위치를 "작업 디렉토리"라고 합니다.

현재 작업 디렉토리 확인

현재 작업 디렉토리를 확인하려면 다음 명령어를 사용하세요:

getwd()

이 명령어를 실행하면 R은 사용하고 있는 현재 경로를 알려줍니다. 예를 들어, 다음과 같은 것을 반환할 수 있습니다:

[1] "C:/Users/YourName/Documents"

새로운 작업 디렉토리 설정

작업 디렉토리를 변경하고 싶다면 setwd() 함수를 사용하세요:

setwd("C:/Path/To/Your/Desired/Directory")

경로에서 전방 슬래시 (/)나 이중 백슬래시 (\)를 사용하세요, 윈도우에서도 마찬가지입니다!

CSV 파일 입력

이제 R이 파일을 찾는 위치를 알고 있으므로, CSV 파일에서 데이터를 가져오는 방법에 대해 이야기해 보겠습니다.

CSV 파일 읽기

R은 read.csv() 함수를 사용하여 CSV 파일을 매우 쉽게 읽을 수 있습니다. 다음은 사용 방법입니다:

data <- read.csv("your_file.csv")

이 명령어는 "your_file.csv"라는 이름의 CSV 파일을 읽어와 data라는 변수에 저장합니다.

가령 "students.csv"라는 CSV 파일이 학생들의 정보를 담고 있다면, 다음과 같이 읽을 수 있습니다:

students <- read.csv("students.csv")

이 명령어를 실행하면 students는 CSV 파일의 모든 정보를 포함한 데이터 프레임이 됩니다.

데이터 보기

새로운 데이터를 확인하려면 다음 유용한 함수를 사용할 수 있습니다:

head(students)  # 첫 6개의 행을 표시
str(students)   # 데이터 구조를 표시
summary(students)  # 각 열에 대한 요약을 제공

CSV 파일 분석

이제 데이터가 R에 있으므로, 기본적인 분석을 해보겠습니다!

열 접근

개별 열에 접근하려면 $ 기호를 사용할 수 있습니다:

students$age  # 'age' 열의 모든 값을 반환

기본 통계

R은 많은 통계 분석 기능을 내장하고 있습니다:

mean(students$age)    # 평균 나이 계산
median(students$age)  # 중앙값 나이 찾기
max(students$age)     # 최대 나이 찾기
min(students$age)     # 최소 나이 찾기

데이터 필터링

조건에 따라 데이터를 필터링할 수도 있습니다:

honor_students <- students[students$gpa > 3.5, ]

이는 GPA가 3.5 이상인 학생들만 포함하는 새로운 데이터 프레임 honor_students를 생성합니다.

CSV 파일 쓰기

CSV 파일에서 데이터를 읽는 것과 마찬가지로, 데이터를 쓰는 것도 가능합니다. 데이터를 조작한 후 결과를 저장하고 싶을 때 유용합니다.

데이터 프레임을 CSV 파일로 쓰기 위해 write.csv() 함수를 사용하세요:

write.csv(honor_students, "honor_students.csv")

이 명령어는 작업 디렉토리에 "honor_students.csv"라는 새로운 파일을 생성하고, honor_students 데이터 프레임의 데이터를 포함합니다.

write.csv()의 중요한 옵션

다음은 write.csv()에서 사용할 수 있는 유용한 옵션입니다:

옵션 설명
row.names = FALSE 행 이름을 출력에서 제외
quote = FALSE 문자열의 인용을 방지
na = "NA" 누락된 값을 나타내는 방법 지정

예를 들어:

write.csv(honor_students, "honor_students.csv", row.names = FALSE)

이는 행 이름을 포함하지 않고 CSV 파일을 작성합니다.

결론

축하합니다! 지금까지 R에서 CSV 파일을 다루는 기본을 배웠습니다. 파일 읽기에서 데이터 분석再到 새로운 파일 작성까지, 데이터 분석 여정을 시작할 수 있는 기본 기술을 습득했습니다.

기억하시오, 연습이 완성을 낳습니다. 다양한 CSV 파일을 사용해 연습해 보세요, 다양한 함수를 실험해 보세요, 실수를 두려워 말아세요 - 그것이 우리가 배우는 방법입니다!

기쁜 코딩과 데이터가 항상 깨끗하고 분석이 깊이 있기를 바랍니다!

Credits: Image by storyset