Pandangan Awal Mengenai Boxplot: Panduan untuk Pemula dalam Visualisasi Distribusi Data
Hai teman-teman yang bersemangat dalam dunia data! Hari ini, kita akan memulai perjalanan menarik ke dalam dunia boxplot menggunakan R. Jangan khawatir jika Anda belum pernah mengkode sebelumnya - saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini secara bertahap. Pada akhir panduan ini, Anda akan mampu membuat boxplot yang indah seperti seorang ahli!
Apa Itu Boxplot?
Sebelum kita masuk ke dalam kode, mari kitaahui apa itu boxplot. Bayangkan Anda mencoba untuk menyummaris tinggi semua siswa di kelas Anda. Boxplot adalah seperti sebuah kotak kecil yang menunjukkan penyebaran data Anda dalam pandangan sekejap. Ini adalah cara bagus untuk melihat median, kuartil, dan outliers di data Anda.
Membuat Boxplot Pertama Anda
Menyiapkan Lingkungan R Anda
Pertama-tama, pastikan kita siapkan R untuk digunakan. Jika Anda belum menginstal R, kunjungi situs web resmi R dan ikuti petunjuk instalasi untuk sistem operasi Anda.
Setelah Anda menginstal R, buka konsol R atau RStudio jika Anda menggunakan itu. Kita siap untuk membuat beberapa boxplot!
Sintaksis Dasar Boxplot
Sintaksis dasar untuk membuat boxplot di R mengejutkan mudah. Ini adalah apa yang tampak seperti:
boxplot(data)
Mari kita coba ini dengan beberapa data nyata. Kita akan menggunakan dataset bawaan mtcars
, yang berisi informasi tentang berbagai model mobil.
# Membuat boxplot dasar untuk mileage mobil
boxplot(mtcars$mpg)
Ketika Anda menjalankan kode ini, Anda akan melihat boxplot muncul. Mari kitauraikan apa yang Anda lihat:
- Garis hitam tebal di tengah kotak adalah median.
- Bagian bawah kotak mewakili kuartil pertama (25% data jatuh dibawah titik ini).
- Bagian atas kotak mewakili kuartil ketiga (75% data jatuh dibawah titik ini).
- Whiskers (garis yang diperpanjang dari kotak) menunjukkan rentang data.
- Setiap titik di luar whiskers dianggap sebagai outliers.
Menambah Warna dan Label
Sekarang, mari kita membuat boxplot kita sedikit lebih informatif dan menarik secara visual:
# Membuat boxplot lebih detil
boxplot(mtcars$mpg,
main="Distribusi Mileage Mobil",
ylab="Miles Per Gallon",
col="lightblue",
border="darkblue")
Dalam contoh ini:
-
main
menambahkan judul ke dalam plot. -
ylab
memberi label ke sumbu y. -
col
mengisi kotak dengan warna biru muda. -
border
membuat garis tepi kotak biru gelap.
Membandingkan Beberapa Grup
Salah satu kekuatan boxplot adalah kemampuannya untuk membandingkan kelompok yang berbeda berdampingan. Mari kita bandingkan mileage mobil dengan jumlah silinder yang berbeda:
# Membandingkan mileage untuk jumlah silinder yang berbeda
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"))
Di sini, kita menggunakan notasi formula mpg ~ cyl
, yang memberitahu R untuk membuat boxplot mpg
untuk setiap nilai unik di cyl
. Kita juga menambahkan warna yang berbeda untuk setiap kelompok.
Boxplot dengan Notch
Sekarang kita telah menguasai dasar-dasar, mari kita tambahkan sedikit kesopanan ke boxplot kita dengan notches.
Apa Itu Notch?
Notch adalah lubang kecil di sisi kotak. Itu tidak hanya untuk penampilan - itu benar-benar membantu kita membandingkan median antar kelompok. Jika notches dua kotak tidak berselisih, ini adalah bukti kuat bahwa median mereka berbeda.
Membuat Boxplot dengan Notch
Mari kita modifikasi contoh sebelumnya untuk menambah notches:
# Membuat boxplot dengan notch
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)
Parameter baru di sini adalah notch=TRUE
. Penambahan sederhana ini memberikan kita notches yang informatif.
Menginterpretasi Boxplot dengan Notch
Perhatikan notches dengan seksama. Jika notches dua kotak tidak berselisih, kita dapat yakin bahwa median (nilai tengah) kelompok ini berbeda. Ini adalah cara visual cepat untuk melihat perbedaan signifikan antar kelompok!
Menyesuaikan Boxplot Anda
Sekarang Anda telah menguasai dasar-dasar, mari kita lihat beberapa cara untuk membuat boxplot Anda lebih informatif dan menarik secara visual.
Menambahkan Titik Data Individu
kadang-kadang itu membantu untuk melihat titik data aktual di samping boxplot. Kita dapat melakukan ini dengan fungsi jitter
:
# Boxplot dengan titik data individu
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE)
# Menambahkan titik data yang dijitter
stripchart(mpg ~ cyl, data=mtcars,
method="jitter",
vertical=TRUE,
add=TRUE,
pch=20,
col="darkgray")
Kode ini pertama membuat boxplot, kemudian menimpa titik data. Parameter pch=20
membuat titik berupa lingkaran kecil, dan col="darkgray"
memberikan warna abu-abu gelap.
Mengubah Penampilan Outliers
Secara default, outliers di boxplot ditampilkan sebagai titik sederhana. Kita dapat mengubah penampilannya:
# Penampilan outliers yang disesuaikan
boxplot(mpg ~ cyl, data=mtcars,
main="Distribusi Mileage Mobil Berdasarkan Jumlah Silinder",
xlab="Jumlah Silinder",
ylab="Miles Per Gallon",
col=c("lightgreen", "lightblue", "pink"),
notch=TRUE,
outpch=8, # Titik outliers berbentuk bintang
outcol="red") # Outliers merah
Di sini, outpch=8
mengubah titik outliers menjadi bintang, dan outcol="red"
memberikan warna merah.
Kesimpulan
Selamat! Anda baru saja belajar membuat dan menyesuaikan boxplot di R. Dari plot dasar hingga perbandingan notched dan bahkan menambahkan titik data individu, Anda sekarang memiliki alat kuat dalam kotak visualisasi data Anda.
Ingat, kunci untuk menguasai boxplot (dan R secara umum) adalah latihan. Cobalah membuat boxplot dengan dataset yang berbeda, eksperimen dengan warna dan gaya, dan terutama, bersenang-senang dengan itu!
Berikut adalah tabel referensi cepat dari parameter boxplot yang kita bahas:
Parameter | Deskripsi | Contoh |
---|---|---|
main |
Judul utama plot | main="My Boxplot" |
xlab |
Label untuk sumbu x | xlab="Groups" |
ylab |
Label untuk sumbu y | ylab="Values" |
col |
Warna isi kotak | col="lightblue" |
border |
Warna tepi kotak | border="darkblue" |
notch |
Tambahkan notches ke kotak | notch=TRUE |
outpch |
Bentuk titik outliers | outpch=8 |
outcol |
Warna titik outliers | outcol="red" |
Selamat mencoba, dan semoga data Anda selalu tampak indah di dalam kotak!
Credits: Image by storyset