R - Histograms: A Beginner's Guide
Halo sana, para ahli data yang sedang berkembang! Hari ini, kita akan memulai perjalanan yang menarik ke dunia histogram menggunakan R. Jangan khawatir jika Anda belum pernah menulis satu baris kode sebelumnya - saya akan menjadi panduan yang ramah bagi Anda, dan kita akan mengambil langkah ini satu demi satu. Pada akhir panduan ini, Anda akan dapat membuat histogram yang indah seperti seorang profesional!
Apa Itu Histogram?
Sebelum kita masuk ke R, mari mengerti apa itu histogram. Bayangkan Anda seorang guru (seperti saya!) dan Anda ingin melihat bagaimana siswa Anda menunjukkan performa dalam tes. Histogram adalah seperti grafik batang yang menunjukkan distribusi data Anda. It mengelompokkan data Anda ke dalam "bins" atau rentang dan menunjukkan berapa banyak titik data yang jatuh ke dalam setiap bin.
Memulai dengan R
Pertama-tama, mari kita mulai R! Jika Anda belum menginstal R, kunjungi situs proyek R dan ikuti petunjuk instalasi untuk sistem operasi Anda.
Setelah Anda menginstal dan menjalankan R, Anda akan melihat konsol tempat Anda dapat mengetik perintah. Ini tempat dimana magik terjadi!
Membuat Histogram Pertama Anda
Mari kita mulai dengan contoh sederhana. Kita akan membuat histogram dari beberapa skor tes.
# Membuat vektor skor tes
scores <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)
# Membuat histogram
hist(scores)
Ketika Anda menjalankan kode ini, Anda akan melihat histogram dasar muncul. cukup menarik, kan? Mari kitauraikan apa yang kita lakukan:
- Kita membuat vektor bernama
scores
dengan beberapa skor tes. - Kita menggunakan fungsi
hist()
untuk membuat histogram dari skor ini.
R secara otomatis menentukan berapa banyak bins dan apa rentang setiap bin. Tetapi apa jika kita ingin lebih banyak kontrol atas histogram kita? Itu tempat dimana keajaiban R benar-benar bersinar!
Menyesuaikan Histogram Anda
Menentukan Jumlah Bins
Kami dapat memberitahu R tepat berapa banyak bins kita inginkan:
hist(scores, breaks = 5)
Ini akan membuat histogram dengan 5 bins. Mainkan dengan angka yang berbeda dan lihat bagaimana itu mengubah penampilan histogram Anda!
Menambah Judul dan Label
Marilah kita membuat histogram kita lebih informatif:
hist(scores,
main = "Distribusi Skor Tes",
xlab = "Skor",
ylab = "Frekuensi",
col = "skyblue",
border = "darkblue")
Ini apa yang setiap parameter baru lakukan:
-
main
: Menambahkan judul ke histogram -
xlab
danylab
: Melabeli sumbu x dan y -
col
: Mengatur warna batang histogram -
border
: Mengatur warna batas batang
Mengatur Rentang X dan Y
kadang-kadang, Anda mungkin ingin fokus pada rentang nilai tertentu atau mengatur skala histogram Anda. Mari kita lihat bagaimana kita dapat melakukan itu:
hist(scores,
xlim = c(60, 100), # Mengatur rentang sumbu x
ylim = c(0, 5), # Mengatur rentang sumbu y
breaks = seq(60, 100, by = 5)) # Membuat bins dari 60 ke 100, setiap 5 poin
Kode ini mengatur sumbu x untuk menunjukkan skor dari 60 ke 100, mengatur sumbu y untuk mencapai 5, dan membuat bins setiap 5 poin.
Teknik Histogram Tingkat Lanjut
Sekarang Anda sudah mendapat dasar-dasar, mari kita jelajahi beberapa teknik tingkat lanjut!
Menambah Kurva Densitas
Kurva densitas dapat membantu visualisasi distribusi data Anda:
hist(scores,
probability = TRUE, # Menampilkan densitas bukan frekuensi
main = "Distribusi Skor Tes dengan Kurva Densitas")
# Menambah kurva densitas
lines(density(scores), col = "red", lwd = 2)
Kode ini pertama-tama membuat histogram yang menunjukkan densitas probabilitas, kemudian menambahkan kurva densitas halus di atasnya.
Membuat Beberapa Histogram
Apa jika Anda ingin membandingkan distribusi? Mari kita buat histogram untuk dua kelas berdampingan:
par(mfrow = c(1, 2)) # Mengatur 1x2 grid untuk plot
# Skor Kelas A
scores_A <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)
hist(scores_A, main = "Skor Kelas A", col = "lightblue")
# Skor Kelas B
scores_B <- c(60, 65, 70, 75, 80, 85, 90, 95, 100, 85)
hist(scores_B, main = "Skor Kelas B", col = "lightgreen")
Kode ini mengatur perbandingan dua histogram, memungkinkan Anda mudah membandingkan distribusi.
Fungsi Histogram yang Berguna
Berikut adalah tabel fungsi yang kita gunakan, beserta beberapa lainnya yang Anda mungkin temukan berguna:
Fungsi | Deskripsi |
---|---|
hist() |
Membuat histogram dasar |
breaks |
Menentukan jumlah bins atau tepi bin |
main |
Mengatur judul utama histogram |
xlab , ylab
|
Melabeli sumbu x dan y |
col |
Mengatur warna batang histogram |
border |
Mengatur warna batas batang |
xlim , ylim
|
Mengatur rentang sumbu x dan y |
density() |
Menghitung estimasi densitas kernel |
lines() |
Menambahkan garis ke plot yang sudah ada |
par() |
Mengatur atau menanyakan parameter grafik |
Kesimpulan
Selamat! Anda baru saja mengambil langkah pertama ke dunia visualisasi data dengan histogram R. Ingat, membuat visualisasi yang efektif adalah seni serta ilmu. Jangan khawatir untuk mencoba parameter yang berbeda dan lihat bagaimana mereka mengubah histogram Anda.
Sekarang Anda teruskan perjalanan Anda dalam R, Anda akan menemukan bahwa histogram hanya adalah permulaan saat ini. Tetapi mereka adalah titik awal yang bagus, dan keterampilan yang Anda pelajari di sini akan membantu Anda saat Anda menjelajahi topik yang lebih tingkat lanjut.
Terus latihan, tetap curiga, dan selamat coding! Sebelum Anda mengetahui, Anda akan menjadi orang yang mengajarkan orang lain tentang keajaiban R dan visualisasi data.
Credits: Image by storyset