Panduan Normal Distribution dalam R: Panduan Ramah untuk Pemula
Hai sana, para ahli R masa depan! ? Hari ini, kita akan melihat dunia menarik distribusi normal dalam R. Jangan khawatir jika Anda belum pernah memrogram sebelumnya – saya akan menjadi panduan ramah Anda dalam perjalanan ini, dan kita akan mengambil langkah-langkah perlahan. Pada akhir panduan ini, Anda akan terkejut atas apa yang Anda bisa lakukan hanya dengan beberapa baris kode!
Apa Itu Distribusi Normal?
Sebelum kita masuk ke R, mari kita bicarakan sedikit tentang apa itu distribusi normal. Bayangkan Anda mengukur tinggi semua siswa di sekolah Anda. Anda mungkin akan menemukan bahwa sebagian besar orang memiliki tinggi yang rata-rata, dengan lebih sedikit orang yang sangat tinggi atau sangat pendek. Jika Anda menggambar ini di grafik, itu akan terlihat seperti kurva lonceng. Itu adalah distribusi normal!
Dalam statistik, kita menggunakan distribusi normal secara berkala, dan R memiliki beberapa fungsi yang menakjubkan untuk membantu kita bekerja dengannya. Mari kita jelajahi fungsi-fungsi ini satu per satu.
Fungsi Distribusi Normal di R
R menyediakan empat fungsi utama untuk bekerja dengan distribusi normal. Berikut adalah overview singkat:
Fungsi | Tujuan |
---|---|
dnorm() | Menghitung kepadatan (tinggi) distribusi normal di titik tertentu |
pnorm() | Menghitung probabilitas kumulatif (luas di bawah kurva) hingga titik tertentu |
qnorm() | Mencari nilai (kuantil) yang sesuai dengan probabilitas tertentu |
rnorm() | Menghasilkan bilangan acak dari distribusi normal |
Sekarang, mari kita masuk ke masing-masing fungsi ini dan lihat bagaimana mereka bekerja!
dnorm(): Fungsi Kepadatan
Fungsi dnorm()
membantu kita menemukan tinggi kurva distribusi normal di titik mana saja. Itu seperti bertanya, "Berapa kemungkinan nilai ini tertentu?"
mari cobalah contoh ini:
# Hitung kepadatan di x = 0 untuk distribusi normal standar
result <- dnorm(0)
print(result)
Ketika Anda menjalankan kode ini, Anda akan melihat:
[1] 0.3989423
Ini berarti bahwa tinggi kurva distribusi normal standar di x = 0 adalah sekitar 0.3989.
Tapi apa kalau kita ingin mengubah rata-rata atau simpangan baku? Tak ada masalah! mari cobalah:
# Hitung kepadatan di x = 1 untuk distribusi normal dengan mean = 2 dan sd = 0.5
result <- dnorm(1, mean = 2, sd = 0.5)
print(result)
Hasil:
[1] 0.1079819
Lihat betapa mudah itu? Kita hanya mengatakan ke R bahwa kita ingin distribusi normal dengan rata-rata 2 dan simpangan baku 0.5, lalu meminta kepadatan di x = 1.
pnorm(): Fungsi Probabilitas Kumulatif
Sekarang, mari kita pindah ke pnorm()
. Fungsi ini menghitung probabilitas mendapatkan nilai kurang dari atau sama dengan titik tertentu. Itu seperti bertanya, "Berapa peluang mendapatkan nilai ini rendah atau lebih rendah?"
Ini adalah contoh:
# Hitung probabilitas mendapatkan nilai kurang dari atau sama dengan 1.96
# dalam distribusi normal standar
result <- pnorm(1.96)
print(result)
Hasil:
[1] 0.9750021
Ini memberitahu kita bahwa ada sekitar 97.5% peluang mendapatkan nilai kurang dari atau sama dengan 1.96 dalam distribusi normal standar.
Catatan menarik: Ini adalah sebab mengapa 1.96 sering digunakan dalam statistik untuk interval kepercayaan 95%!
Mari cobalah contoh lain dengan rata-rata dan simpangan baku yang berbeda:
# Hitung probabilitas mendapatkan nilai kurang dari atau sama dengan 70
# dalam distribusi normal dengan mean = 60 dan sd = 10
result <- pnorm(70, mean = 60, sd = 10)
print(result)
Hasil:
[1] 0.8413447
Ini berarti ada sekitar 84.1% peluang mendapatkan nilai kurang dari atau sama dengan 70 dalam distribusi ini.
qnorm(): Fungsi Kuantil
qnorm()
adalah seperti kebalikan dari pnorm()
. Daripada memberikan nilai dan meminta probabilitas, kita memberikan probabilitas dan meminta nilai. Itu seperti mengatakan, " Mana nilai yang akan memberikan saya probabilitas ini tertentu?"
mari cobalah ini:
# Temukan nilai yang memberikan probabilitas kumulatif 0.95
# dalam distribusi normal standar
result <- qnorm(0.95)
print(result)
Hasil:
[1] 1.644854
Ini memberitahu kita bahwa 95% nilai dalam distribusi normal standar berada di bawah 1.645.
Kita juga dapat menggunakan rata-rata dan simpangan baku yang berbeda:
# Temukan nilai yang memberikan probabilitas kumulatif 0.99
# dalam distribusi normal dengan mean = 100 dan sd = 15
result <- qnorm(0.99, mean = 100, sd = 15)
print(result)
Hasil:
[1] 134.8745
Jadi, dalam distribusi ini, 99% nilai berada di bawah 134.87.
rnorm(): Menghasilkan Bilangan Acak
Terakhir namun tidak terpenting, kita memiliki rnorm()
. Fungsi ini seperti generator nomor ajaib yang mengikuti aturan distribusi normal. Itu sangat berguna untuk simulasi dan membuat data tes.
Ini adalah cara menggunakannya:
# Generate 5 bilangan acak dari distribusi normal standar
random_numbers <- rnorm(5)
print(random_numbers)
Hasil (nomor Anda akan berbeda):
[1] -0.56047565 -0.23017749 1.55870831 0.07050839 0.12928774
Kita juga dapat menentukan rata-rata dan simpangan baku yang berbeda:
# Generate 5 bilangan acak dari distribusi normal dengan mean = 50 dan sd = 10
random_numbers <- rnorm(5, mean = 50, sd = 10)
print(random_numbers)
Hasil (nomor Anda akan berbeda):
[1] 52.39086 46.08371 47.92569 62.36229 45.45923
Apakah itu menakjubkan? Dengan hanya satu baris kode, kita bisa menghasilkan sebanyak bilangan acak yang kita inginkan, mengikuti distribusi normal mana saja kita tentukan!
Penutup
Dan begitu saja, teman-teman! Kita telah berpergian melalui dunia distribusi normal di R, mengunjungi empat fungsi yang kuat di sepanjang jalan. Ingat, latihan membuat sempurna, jadi jangan khawatir untuk mencoba fungsi-fungsi ini. Cobalah nilai yang berbeda, gambarkan hasilnya, dan lihat apa yang terjadi!
Ini adalah tantangan kecil untuk Anda: Cobalah menggunakan rnorm()
untuk generate 1000 bilangan acak, kemudian gunakan hist()
untuk menggambar histogram dari bilangan-bilangan itu. Anda akan melihat distribusi normal hidup di depan mata Anda!
Selamat coding, dan maya distribusi normal selalu bersama Anda! ???
Credits: Image by storyset