Pandangan Awal Mengenai Histogram: Panduan untuk Pemula
Hai sana, para ahli data yang sedang belajar! Hari ini, kita akan memulai perjalanan menarik ke dunia histogram menggunakan R. Jangan khawatir jika Anda belum pernah menulis baris kode sebelumnya – saya akan menjadi panduan ramah Anda, dan kita akan melakukan ini secara bertahap. Pada akhir panduan ini, Anda akan mampu membuat histogram yang indah seperti seorang ahli!
Apa Itu Histogram?
Sebelum kita mendalami R, mari kita mengerti apa itu histogram. Bayangkan Anda adalah seorang guru (seperti saya!) dan Anda ingin melihat bagaimana murid-murid Anda memperoleh nilai dalam tes. Histogram adalah seperti grafik batang yang menunjukkan distribusi data Anda. Itu mengelompokkan data Anda ke dalam "bin" atau rentang dan menunjukkan berapa banyak titik data yang jatuh ke dalam setiap bin.
Memulai dengan R
Pertama-tama, mari kita mulai R! Jika Anda belum menginstal R, kunjungi situs Proyek R dan ikuti petunjuk instalasi untuk sistem operasi Anda.
Setelah Anda menginstal dan menjalankan R, Anda akan melihat konsol tempat Anda dapat mengetik perintah. Ini adalah tempat dimana keajaiban terjadi!
Membuat Histogram Pertama Anda
Mari kita mulai dengan contoh sederhana. Kita akan membuat histogram dari beberapa nilai tes.
# Buat vektor nilai tes
scores <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)
# Buat histogram
hist(scores)
Ketika Anda menjalankan kode ini, Anda akan melihat histogram dasar muncul. Bagus, kan? Mari kitauraikan apa yang kita lakukan:
- Kita membuat vektor bernama
scores
dengan beberapa nilai tes. - Kita menggunakan fungsi
hist()
untuk membuat histogram dari nilai ini.
R secara otomatis menentukan berapa banyak bin yang digunakan dan apa rentang setiap bin. Tetapi apa jika kita ingin lebih banyak mengontrol histogram kita? Itu tempat keajaiban R benar-benar bersinar!
Menyesuaikan Histogram Anda
Menentukan Jumlah Bin
Kita dapat memberitahu R betapa banyak bin yang kita inginkan:
hist(scores, breaks = 5)
Ini akan membuat histogram dengan 5 bin. Mainkan dengan angka yang berbeda dan lihat bagaimana itu mengubah penampilan histogram Anda!
Menambah Judul dan Label
Marilah kita membuat histogram kita lebih informatif:
hist(scores,
main = "Distribusi Nilai Tes",
xlab = "Nilai",
ylab = "Frekuensi",
col = "skyblue",
border = "darkblue")
Berikut apa yang dilakukan setiap parameter baru ini:
-
main
: Menambah judul ke histogram -
xlab
danylab
: Melabelkan sumbu x dan y -
col
: Mengatur warna batang histogram -
border
: Mengatur warna batas batang
Mengatur Rentang X dan Y
kadang-kadang, Anda mungkin ingin fokus pada rentang nilai tertentu atau mengatur skala histogram Anda. Mari kita lihat bagaimana kita dapat melakukan itu:
hist(scores,
xlim = c(60, 100), # Set rentang sumbu x
ylim = c(0, 5), # Set rentang sumbu y
breaks = seq(60, 100, by = 5)) # Buat bin dari 60 ke 100, setiap 5 poin
Kode ini mengatur sumbu x untuk menunjukkan nilai dari 60 ke 100, menetapkan sumbu y untuk mencapai 5, dan membuat bin setiap 5 poin.
Teknik Histogram Tingkat Lanjut
Sekarang Anda sudah menguasai dasar-dasar, mari kita jelajahi beberapa teknik tingkat lanjut!
Menambah Kurva Densitas
Kurva densitas dapat membantu visualisasi distribusi data Anda:
hist(scores,
probability = TRUE, # Tunjukkan densitas bukan frekuensi
main = "Distribusi Nilai Tes dengan Kurva Densitas")
# Tambah kurva densitas
lines(density(scores), col = "red", lwd = 2)
Kode ini pertama-tama membuat histogram yang menunjukkan densitas probabilitas, kemudian menambah kurva densitas ramping di atasnya.
Membuat Banyak Histogram
Apa jika Anda ingin membandingkan distribusi? Mari kita buat histogram untuk dua kelas berdampingan:
par(mfrow = c(1, 2)) # Setel grid plot 1x2
# Nilai Kelas A
scores_A <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)
hist(scores_A, main = "Nilai Kelas A", col = "lightblue")
# Nilai Kelas B
scores_B <- c(60, 65, 70, 75, 80, 85, 90, 95, 100, 85)
hist(scores_B, main = "Nilai Kelas B", col = "lightgreen")
Kode ini mensetel perbandingan histogram berdampingan, memungkinkan Anda mudah membandingkan distribusi.
Fungsi Histogram Berguna
Berikut adalah tabel yang praktis dari fungsi yang kita gunakan, beserta beberapa yang Anda mungkin temukan berguna:
Fungsi | Deskripsi |
---|---|
hist() |
Membuat histogram dasar |
breaks |
Menentukan jumlah bin atau tepi bin |
main |
Menetapkan judul utama histogram |
xlab , ylab
|
Melabelkan sumbu x dan y |
col |
Mengatur warna batang histogram |
border |
Mengatur warna batas batang |
xlim , ylim
|
Mengatur rentang sumbu x dan y |
density() |
Menghitung estimasi densitas kernel |
lines() |
Menambah garis ke plot yang sudah ada |
par() |
Mengatur atau meminta parameter grafik |
Kesimpulan
Selamat! Anda baru saja mengambil langkah pertama ke dunia visualisasi data dengan histogram R. Ingat, membuat visualisasi efektif adalah hal yang sama pentingnya dengan ilmu dan seni. Jangan khawatir untuk mencoba parameter yang berbeda dan lihat bagaimana mereka mempengaruhi histogram Anda.
Sekarang Anda teruskan perjalanan Anda dalam R, Anda akan menemukan bahwa histogram hanya merupakan permulaan dari visualisasi data. Tetapi mereka adalah titik awal yang bagus, dan keterampilan yang Anda pelajari di sini akan membantu Anda sangat baik saat Anda menjelajahi topik yang lebih tingkat lanjut.
Teruslatih, tetap curiga, dan selamat berkoding! Sebelum Anda sadar, Anda akan menjadi orang yang mengajarkan orang lain tentang keajaiban R dan visualisasi data.
Credits: Image by storyset