R - Histograms: A Beginner's Guide

Halo sana, para ahli data yang sedang berkembang! Hari ini, kita akan memulai perjalanan yang menarik ke dunia histogram menggunakan R. Jangan khawatir jika Anda belum pernah menulis satu baris kode sebelumnya - saya akan menjadi panduan yang ramah bagi Anda, dan kita akan mengambil langkah ini satu demi satu. Pada akhir panduan ini, Anda akan dapat membuat histogram yang indah seperti seorang profesional!

R - Histograms

Apa Itu Histogram?

Sebelum kita masuk ke R, mari mengerti apa itu histogram. Bayangkan Anda seorang guru (seperti saya!) dan Anda ingin melihat bagaimana siswa Anda menunjukkan performa dalam tes. Histogram adalah seperti grafik batang yang menunjukkan distribusi data Anda. It mengelompokkan data Anda ke dalam "bins" atau rentang dan menunjukkan berapa banyak titik data yang jatuh ke dalam setiap bin.

Memulai dengan R

Pertama-tama, mari kita mulai R! Jika Anda belum menginstal R, kunjungi situs proyek R dan ikuti petunjuk instalasi untuk sistem operasi Anda.

Setelah Anda menginstal dan menjalankan R, Anda akan melihat konsol tempat Anda dapat mengetik perintah. Ini tempat dimana magik terjadi!

Membuat Histogram Pertama Anda

Mari kita mulai dengan contoh sederhana. Kita akan membuat histogram dari beberapa skor tes.

# Membuat vektor skor tes
scores <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)

# Membuat histogram
hist(scores)

Ketika Anda menjalankan kode ini, Anda akan melihat histogram dasar muncul. cukup menarik, kan? Mari kitauraikan apa yang kita lakukan:

  1. Kita membuat vektor bernama scores dengan beberapa skor tes.
  2. Kita menggunakan fungsi hist() untuk membuat histogram dari skor ini.

R secara otomatis menentukan berapa banyak bins dan apa rentang setiap bin. Tetapi apa jika kita ingin lebih banyak kontrol atas histogram kita? Itu tempat dimana keajaiban R benar-benar bersinar!

Menyesuaikan Histogram Anda

Menentukan Jumlah Bins

Kami dapat memberitahu R tepat berapa banyak bins kita inginkan:

hist(scores, breaks = 5)

Ini akan membuat histogram dengan 5 bins. Mainkan dengan angka yang berbeda dan lihat bagaimana itu mengubah penampilan histogram Anda!

Menambah Judul dan Label

Marilah kita membuat histogram kita lebih informatif:

hist(scores,
main = "Distribusi Skor Tes",
xlab = "Skor",
ylab = "Frekuensi",
col = "skyblue",
border = "darkblue")

Ini apa yang setiap parameter baru lakukan:

  • main: Menambahkan judul ke histogram
  • xlab dan ylab: Melabeli sumbu x dan y
  • col: Mengatur warna batang histogram
  • border: Mengatur warna batas batang

Mengatur Rentang X dan Y

kadang-kadang, Anda mungkin ingin fokus pada rentang nilai tertentu atau mengatur skala histogram Anda. Mari kita lihat bagaimana kita dapat melakukan itu:

hist(scores,
xlim = c(60, 100),  # Mengatur rentang sumbu x
ylim = c(0, 5),     # Mengatur rentang sumbu y
breaks = seq(60, 100, by = 5))  # Membuat bins dari 60 ke 100, setiap 5 poin

Kode ini mengatur sumbu x untuk menunjukkan skor dari 60 ke 100, mengatur sumbu y untuk mencapai 5, dan membuat bins setiap 5 poin.

Teknik Histogram Tingkat Lanjut

Sekarang Anda sudah mendapat dasar-dasar, mari kita jelajahi beberapa teknik tingkat lanjut!

Menambah Kurva Densitas

Kurva densitas dapat membantu visualisasi distribusi data Anda:

hist(scores,
probability = TRUE,  # Menampilkan densitas bukan frekuensi
main = "Distribusi Skor Tes dengan Kurva Densitas")

# Menambah kurva densitas
lines(density(scores), col = "red", lwd = 2)

Kode ini pertama-tama membuat histogram yang menunjukkan densitas probabilitas, kemudian menambahkan kurva densitas halus di atasnya.

Membuat Beberapa Histogram

Apa jika Anda ingin membandingkan distribusi? Mari kita buat histogram untuk dua kelas berdampingan:

par(mfrow = c(1, 2))  # Mengatur 1x2 grid untuk plot

# Skor Kelas A
scores_A <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)
hist(scores_A, main = "Skor Kelas A", col = "lightblue")

# Skor Kelas B
scores_B <- c(60, 65, 70, 75, 80, 85, 90, 95, 100, 85)
hist(scores_B, main = "Skor Kelas B", col = "lightgreen")

Kode ini mengatur perbandingan dua histogram, memungkinkan Anda mudah membandingkan distribusi.

Fungsi Histogram yang Berguna

Berikut adalah tabel fungsi yang kita gunakan, beserta beberapa lainnya yang Anda mungkin temukan berguna:

Fungsi Deskripsi
hist() Membuat histogram dasar
breaks Menentukan jumlah bins atau tepi bin
main Mengatur judul utama histogram
xlab, ylab Melabeli sumbu x dan y
col Mengatur warna batang histogram
border Mengatur warna batas batang
xlim, ylim Mengatur rentang sumbu x dan y
density() Menghitung estimasi densitas kernel
lines() Menambahkan garis ke plot yang sudah ada
par() Mengatur atau menanyakan parameter grafik

Kesimpulan

Selamat! Anda baru saja mengambil langkah pertama ke dunia visualisasi data dengan histogram R. Ingat, membuat visualisasi yang efektif adalah seni serta ilmu. Jangan khawatir untuk mencoba parameter yang berbeda dan lihat bagaimana mereka mengubah histogram Anda.

Sekarang Anda teruskan perjalanan Anda dalam R, Anda akan menemukan bahwa histogram hanya adalah permulaan saat ini. Tetapi mereka adalah titik awal yang bagus, dan keterampilan yang Anda pelajari di sini akan membantu Anda saat Anda menjelajahi topik yang lebih tingkat lanjut.

Terus latihan, tetap curiga, dan selamat coding! Sebelum Anda mengetahui, Anda akan menjadi orang yang mengajarkan orang lain tentang keajaiban R dan visualisasi data.

Credits: Image by storyset