Pandangan Awal Mengenai Histogram: Panduan untuk Pemula

Hai sana, para ahli data yang sedang belajar! Hari ini, kita akan memulai perjalanan menarik ke dunia histogram menggunakan R. Jangan khawatir jika Anda belum pernah menulis baris kode sebelumnya – saya akan menjadi panduan ramah Anda, dan kita akan melakukan ini secara bertahap. Pada akhir panduan ini, Anda akan mampu membuat histogram yang indah seperti seorang ahli!

R - Histograms

Apa Itu Histogram?

Sebelum kita mendalami R, mari kita mengerti apa itu histogram. Bayangkan Anda adalah seorang guru (seperti saya!) dan Anda ingin melihat bagaimana murid-murid Anda memperoleh nilai dalam tes. Histogram adalah seperti grafik batang yang menunjukkan distribusi data Anda. Itu mengelompokkan data Anda ke dalam "bin" atau rentang dan menunjukkan berapa banyak titik data yang jatuh ke dalam setiap bin.

Memulai dengan R

Pertama-tama, mari kita mulai R! Jika Anda belum menginstal R, kunjungi situs Proyek R dan ikuti petunjuk instalasi untuk sistem operasi Anda.

Setelah Anda menginstal dan menjalankan R, Anda akan melihat konsol tempat Anda dapat mengetik perintah. Ini adalah tempat dimana keajaiban terjadi!

Membuat Histogram Pertama Anda

Mari kita mulai dengan contoh sederhana. Kita akan membuat histogram dari beberapa nilai tes.

# Buat vektor nilai tes
scores <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)

# Buat histogram
hist(scores)

Ketika Anda menjalankan kode ini, Anda akan melihat histogram dasar muncul. Bagus, kan? Mari kitauraikan apa yang kita lakukan:

  1. Kita membuat vektor bernama scores dengan beberapa nilai tes.
  2. Kita menggunakan fungsi hist() untuk membuat histogram dari nilai ini.

R secara otomatis menentukan berapa banyak bin yang digunakan dan apa rentang setiap bin. Tetapi apa jika kita ingin lebih banyak mengontrol histogram kita? Itu tempat keajaiban R benar-benar bersinar!

Menyesuaikan Histogram Anda

Menentukan Jumlah Bin

Kita dapat memberitahu R betapa banyak bin yang kita inginkan:

hist(scores, breaks = 5)

Ini akan membuat histogram dengan 5 bin. Mainkan dengan angka yang berbeda dan lihat bagaimana itu mengubah penampilan histogram Anda!

Menambah Judul dan Label

Marilah kita membuat histogram kita lebih informatif:

hist(scores,
main = "Distribusi Nilai Tes",
xlab = "Nilai",
ylab = "Frekuensi",
col = "skyblue",
border = "darkblue")

Berikut apa yang dilakukan setiap parameter baru ini:

  • main: Menambah judul ke histogram
  • xlab dan ylab: Melabelkan sumbu x dan y
  • col: Mengatur warna batang histogram
  • border: Mengatur warna batas batang

Mengatur Rentang X dan Y

kadang-kadang, Anda mungkin ingin fokus pada rentang nilai tertentu atau mengatur skala histogram Anda. Mari kita lihat bagaimana kita dapat melakukan itu:

hist(scores,
xlim = c(60, 100),  # Set rentang sumbu x
ylim = c(0, 5),     # Set rentang sumbu y
breaks = seq(60, 100, by = 5))  # Buat bin dari 60 ke 100, setiap 5 poin

Kode ini mengatur sumbu x untuk menunjukkan nilai dari 60 ke 100, menetapkan sumbu y untuk mencapai 5, dan membuat bin setiap 5 poin.

Teknik Histogram Tingkat Lanjut

Sekarang Anda sudah menguasai dasar-dasar, mari kita jelajahi beberapa teknik tingkat lanjut!

Menambah Kurva Densitas

Kurva densitas dapat membantu visualisasi distribusi data Anda:

hist(scores,
probability = TRUE,  # Tunjukkan densitas bukan frekuensi
main = "Distribusi Nilai Tes dengan Kurva Densitas")

# Tambah kurva densitas
lines(density(scores), col = "red", lwd = 2)

Kode ini pertama-tama membuat histogram yang menunjukkan densitas probabilitas, kemudian menambah kurva densitas ramping di atasnya.

Membuat Banyak Histogram

Apa jika Anda ingin membandingkan distribusi? Mari kita buat histogram untuk dua kelas berdampingan:

par(mfrow = c(1, 2))  # Setel grid plot 1x2

# Nilai Kelas A
scores_A <- c(65, 70, 80, 85, 90, 95, 75, 80, 85, 90)
hist(scores_A, main = "Nilai Kelas A", col = "lightblue")

# Nilai Kelas B
scores_B <- c(60, 65, 70, 75, 80, 85, 90, 95, 100, 85)
hist(scores_B, main = "Nilai Kelas B", col = "lightgreen")

Kode ini mensetel perbandingan histogram berdampingan, memungkinkan Anda mudah membandingkan distribusi.

Fungsi Histogram Berguna

Berikut adalah tabel yang praktis dari fungsi yang kita gunakan, beserta beberapa yang Anda mungkin temukan berguna:

Fungsi Deskripsi
hist() Membuat histogram dasar
breaks Menentukan jumlah bin atau tepi bin
main Menetapkan judul utama histogram
xlab, ylab Melabelkan sumbu x dan y
col Mengatur warna batang histogram
border Mengatur warna batas batang
xlim, ylim Mengatur rentang sumbu x dan y
density() Menghitung estimasi densitas kernel
lines() Menambah garis ke plot yang sudah ada
par() Mengatur atau meminta parameter grafik

Kesimpulan

Selamat! Anda baru saja mengambil langkah pertama ke dunia visualisasi data dengan histogram R. Ingat, membuat visualisasi efektif adalah hal yang sama pentingnya dengan ilmu dan seni. Jangan khawatir untuk mencoba parameter yang berbeda dan lihat bagaimana mereka mempengaruhi histogram Anda.

Sekarang Anda teruskan perjalanan Anda dalam R, Anda akan menemukan bahwa histogram hanya merupakan permulaan dari visualisasi data. Tetapi mereka adalah titik awal yang bagus, dan keterampilan yang Anda pelajari di sini akan membantu Anda sangat baik saat Anda menjelajahi topik yang lebih tingkat lanjut.

Teruslatih, tetap curiga, dan selamat berkoding! Sebelum Anda sadar, Anda akan menjadi orang yang mengajarkan orang lain tentang keajaiban R dan visualisasi data.

Credits: Image by storyset