R - Boxplot: Panduan untuk Pemula dalam Visualisasi Distribusi Data
Halo sana, para ahli data yang sedang belajar! Hari ini, kita akan melangsungkan perjalanan menarik ke dunia boxplot menggunakan R. Jangan khawatir jika Anda belum pernah mengkode sebelumnya - saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini satu per satu. Pada akhir panduan ini, Anda akan dapat membuat boxplot yang indah seperti seorang profesional!
Apa Itu Boxplot?
Sebelum kita masuk ke kode, mari kita pahami apa itu boxplot. Bayangkan Anda mencoba untuk meng-ringkaskan tinggi semua murid di kelas Anda. Boxplot adalah seperti sebuah kotak kecil yang menunjukkan penyebaran data Anda dalam pandangan sekejap. Ini adalah cara yang bagus untuk melihat median, kuartil, dan outliers dalam data Anda.
Membuat Boxplot Pertama Anda
Menyiapkan Lingkungan R Anda
Pertama-tama, pastikan kita sudah siap dengan R. Jika Anda belum menginstal R, kunjungi situs resmi R dan ikuti instruksi instalasi untuk sistem operasi Anda.
Setelah Anda menginstal R, buka konsol R atau RStudio jika Anda menggunakan itu. Kita siap untuk membuat beberapa boxplot!
Sintaks Boxplot Dasar
Sintaks dasar untuk membuat boxplot di R mengejutkan mudah. Ini adalah seperti ini:
boxplot(data)
Mari kita coba ini dengan beberapa data nyata. Kita akan menggunakan dataset bawaan mtcars
, yang berisi informasi tentang berbagai model mobil.
# Membuat boxplot dasar untuk mileage mobil
boxplot(mtcars$mpg)
Ketika Anda menjalankan kode ini, Anda akan melihat boxplot muncul. Mari kitauraikan apa yang Anda lihat:
- Garis hitam tebal di tengah kotak adalah median.
- Bagian bawah kotak mewakili kuartil pertama (25% data berada di bawah titik ini).
- Bagian atas kotak mewakili kuartil ketiga (75% data berada di bawah titik ini).
- Whiskers (garis yang memanjang dari kotak) menunjukkan rentang data.
- Setiap titik di luar whiskers dianggap sebagai outliers.
Menambah Warna dan Label
Sekarang, mari kita membuat boxplot kita sedikit lebih informatif dan menarik secara visual:
# Membuat boxplot lebih detil
boxplot(mtcars$mpg,
main="Distribusi Mileage Mobil",
ylab="Miles Per Gallon",
col="lightblue",
border="darkblue")
Dalam contoh ini:
-
main
menambahkan judul ke plot kita. -
ylab
memberi label ke sumbu y. -
col
mengisi kotak dengan warna biru muda. -
border
membuat garis pinggir kotak biru gelap.
Membandingkan Beberapa Grup
Salah satu kekuatan boxplot adalah kemampuan untuk membandingkan grup yang berbeda side by side. Mari kita bandingkan mileage mobil dengan jumlah silinder yang berbeda:
# Membandingkan mileage untuk jumlah silinder yang berbeda
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"))
Di sini, kita menggunakan notasi formula mpg ~ cyl
, yang memberitahu R untuk membuat boxplot mpg
untuk setiap nilai unik dalam cyl
. Kita juga menambahkan warna yang berbeda untuk setiap grup.
Boxplot dengan Notch
Sekarang kita telah menguasai dasar-dasar, mari kita tambahkan sedikit keangusan ke boxplot kita dengan notches.
Apa Itu Notch?
Notch adalah lubang kecil di sisi kotak. Itu bukan hanya untuk penampilan - itu sebenarnya membantu kita membandingkan median antar grup. Jika notch dari dua kotak tidak bersentuhan, itu adalah bukti kuat bahwa median mereka berbeda.
Membuat Boxplot Bert notch
Mari kita modifikasi contoh sebelumnya untuk mencakup notches:
# Membuat boxplot bert notch
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)
Parameter baru di sini adalah notch=TRUE
. Penambahan ini memberikan notches informasi.
Menginterpretasi Boxplot Bert notch
Perhatikan notches dengan seksama. Jika notch dari dua kotak tidak bersentuhan, kita dapat yakin bahwa median sebenarnya berbeda. Ini adalah cara visual cepat untuk melihat perbedaan signifikan antar grup!
Menyesuaikan Boxplot Anda
Sekarang Anda telah menguasai dasar-dasar, mari kita lihat beberapa cara untuk membuat boxplot Anda lebih informatif dan menarik secara visual.
Menambahkan Titik Data Individu
kadang-kadang, itu membantu untuk melihat titik data aktual di sepanjang boxplot. Kita dapat melakukan ini dengan fungsi jitter
:
# Boxplot dengan titik individu
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)
# Menambahkan titik berjitter
stripchart(mpg ~ cyl, data=mtcars,
method="jitter",
vertical=TRUE,
add=TRUE,
pch=20,
col="darkgray")
Kode ini terlebih dahulu membuat boxplot, kemudian menimpa titik data. Parameter pch=20
membuat titik menjadi lingkaran kecil, dan col="darkgray"
memberikan warna abu-abu gelap.
Mengubah Penampilan Outlier
Secara default, outliers dalam boxplot ditampilkan sebagai titik sederhana. Kita dapat mengubah penampilannya:
# Penampilan outlier yang disesuaikan
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil menurut Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE,
outpch=8, # Titik outlier berbentuk bintang
outcol="red") # Outlier merah
Di sini, outpch=8
mengubah titik outlier menjadi bintang, dan outcol="red"
memberikan warna merah.
Kesimpulan
Selamat! Anda baru saja belajar membuat dan menyesuaikan boxplot di R. Dari plot dasar hingga perbandingan bert notch dan menambahkan titik data individu, Anda sekarang memiliki alat kuat dalam kitab visualisasi data Anda.
Ingat, kunci untuk menguasai boxplot (dan R secara umum) adalah latihan. Cobalah membuat boxplot dengan berbagai dataset, eksperimen dengan warna dan gaya, dan terutama, nikmati prosesnya!
Berikut adalah tabel referensi cepat dari parameter boxplot yang kita diskusikan:
Parameter | Deskripsi | Contoh |
---|---|---|
main |
Judul utama plot | main="My Boxplot" |
xlab |
Label sumbu x | xlab="Groups" |
ylab |
Label sumbu y | ylab="Values" |
col |
Warna isian kotak | col="lightblue" |
border |
Warna pinggir kotak | border="darkblue" |
notch |
Tambah notch ke kotak | notch=TRUE |
outpch |
Bentuk titik outlier | outpch=8 |
outcol |
Warna titik outlier | outcol="red" |
Selamat menggambar, dan semoga data Anda selalu terbungkus indah!
Credits: Image by storyset