Panduan Normal Distribution dalam R: Panduan Ramah untuk Pemula

Hai sana, para ahli R masa depan! ? Hari ini, kita akan melihat dunia menarik distribusi normal dalam R. Jangan khawatir jika Anda belum pernah memrogram sebelumnya – saya akan menjadi panduan ramah Anda dalam perjalanan ini, dan kita akan mengambil langkah-langkah perlahan. Pada akhir panduan ini, Anda akan terkejut atas apa yang Anda bisa lakukan hanya dengan beberapa baris kode!

R - Normal Distribution

Apa Itu Distribusi Normal?

Sebelum kita masuk ke R, mari kita bicarakan sedikit tentang apa itu distribusi normal. Bayangkan Anda mengukur tinggi semua siswa di sekolah Anda. Anda mungkin akan menemukan bahwa sebagian besar orang memiliki tinggi yang rata-rata, dengan lebih sedikit orang yang sangat tinggi atau sangat pendek. Jika Anda menggambar ini di grafik, itu akan terlihat seperti kurva lonceng. Itu adalah distribusi normal!

Dalam statistik, kita menggunakan distribusi normal secara berkala, dan R memiliki beberapa fungsi yang menakjubkan untuk membantu kita bekerja dengannya. Mari kita jelajahi fungsi-fungsi ini satu per satu.

Fungsi Distribusi Normal di R

R menyediakan empat fungsi utama untuk bekerja dengan distribusi normal. Berikut adalah overview singkat:

Fungsi Tujuan
dnorm() Menghitung kepadatan (tinggi) distribusi normal di titik tertentu
pnorm() Menghitung probabilitas kumulatif (luas di bawah kurva) hingga titik tertentu
qnorm() Mencari nilai (kuantil) yang sesuai dengan probabilitas tertentu
rnorm() Menghasilkan bilangan acak dari distribusi normal

Sekarang, mari kita masuk ke masing-masing fungsi ini dan lihat bagaimana mereka bekerja!

dnorm(): Fungsi Kepadatan

Fungsi dnorm() membantu kita menemukan tinggi kurva distribusi normal di titik mana saja. Itu seperti bertanya, "Berapa kemungkinan nilai ini tertentu?"

mari cobalah contoh ini:

# Hitung kepadatan di x = 0 untuk distribusi normal standar
result <- dnorm(0)
print(result)

Ketika Anda menjalankan kode ini, Anda akan melihat:

[1] 0.3989423

Ini berarti bahwa tinggi kurva distribusi normal standar di x = 0 adalah sekitar 0.3989.

Tapi apa kalau kita ingin mengubah rata-rata atau simpangan baku? Tak ada masalah! mari cobalah:

# Hitung kepadatan di x = 1 untuk distribusi normal dengan mean = 2 dan sd = 0.5
result <- dnorm(1, mean = 2, sd = 0.5)
print(result)

Hasil:

[1] 0.1079819

Lihat betapa mudah itu? Kita hanya mengatakan ke R bahwa kita ingin distribusi normal dengan rata-rata 2 dan simpangan baku 0.5, lalu meminta kepadatan di x = 1.

pnorm(): Fungsi Probabilitas Kumulatif

Sekarang, mari kita pindah ke pnorm(). Fungsi ini menghitung probabilitas mendapatkan nilai kurang dari atau sama dengan titik tertentu. Itu seperti bertanya, "Berapa peluang mendapatkan nilai ini rendah atau lebih rendah?"

Ini adalah contoh:

# Hitung probabilitas mendapatkan nilai kurang dari atau sama dengan 1.96
# dalam distribusi normal standar
result <- pnorm(1.96)
print(result)

Hasil:

[1] 0.9750021

Ini memberitahu kita bahwa ada sekitar 97.5% peluang mendapatkan nilai kurang dari atau sama dengan 1.96 dalam distribusi normal standar.

Catatan menarik: Ini adalah sebab mengapa 1.96 sering digunakan dalam statistik untuk interval kepercayaan 95%!

Mari cobalah contoh lain dengan rata-rata dan simpangan baku yang berbeda:

# Hitung probabilitas mendapatkan nilai kurang dari atau sama dengan 70
# dalam distribusi normal dengan mean = 60 dan sd = 10
result <- pnorm(70, mean = 60, sd = 10)
print(result)

Hasil:

[1] 0.8413447

Ini berarti ada sekitar 84.1% peluang mendapatkan nilai kurang dari atau sama dengan 70 dalam distribusi ini.

qnorm(): Fungsi Kuantil

qnorm() adalah seperti kebalikan dari pnorm(). Daripada memberikan nilai dan meminta probabilitas, kita memberikan probabilitas dan meminta nilai. Itu seperti mengatakan, " Mana nilai yang akan memberikan saya probabilitas ini tertentu?"

mari cobalah ini:

# Temukan nilai yang memberikan probabilitas kumulatif 0.95
# dalam distribusi normal standar
result <- qnorm(0.95)
print(result)

Hasil:

[1] 1.644854

Ini memberitahu kita bahwa 95% nilai dalam distribusi normal standar berada di bawah 1.645.

Kita juga dapat menggunakan rata-rata dan simpangan baku yang berbeda:

# Temukan nilai yang memberikan probabilitas kumulatif 0.99
# dalam distribusi normal dengan mean = 100 dan sd = 15
result <- qnorm(0.99, mean = 100, sd = 15)
print(result)

Hasil:

[1] 134.8745

Jadi, dalam distribusi ini, 99% nilai berada di bawah 134.87.

rnorm(): Menghasilkan Bilangan Acak

Terakhir namun tidak terpenting, kita memiliki rnorm(). Fungsi ini seperti generator nomor ajaib yang mengikuti aturan distribusi normal. Itu sangat berguna untuk simulasi dan membuat data tes.

Ini adalah cara menggunakannya:

# Generate 5 bilangan acak dari distribusi normal standar
random_numbers <- rnorm(5)
print(random_numbers)

Hasil (nomor Anda akan berbeda):

[1] -0.56047565 -0.23017749  1.55870831  0.07050839  0.12928774

Kita juga dapat menentukan rata-rata dan simpangan baku yang berbeda:

# Generate 5 bilangan acak dari distribusi normal dengan mean = 50 dan sd = 10
random_numbers <- rnorm(5, mean = 50, sd = 10)
print(random_numbers)

Hasil (nomor Anda akan berbeda):

[1] 52.39086 46.08371 47.92569 62.36229 45.45923

Apakah itu menakjubkan? Dengan hanya satu baris kode, kita bisa menghasilkan sebanyak bilangan acak yang kita inginkan, mengikuti distribusi normal mana saja kita tentukan!

Penutup

Dan begitu saja, teman-teman! Kita telah berpergian melalui dunia distribusi normal di R, mengunjungi empat fungsi yang kuat di sepanjang jalan. Ingat, latihan membuat sempurna, jadi jangan khawatir untuk mencoba fungsi-fungsi ini. Cobalah nilai yang berbeda, gambarkan hasilnya, dan lihat apa yang terjadi!

Ini adalah tantangan kecil untuk Anda: Cobalah menggunakan rnorm() untuk generate 1000 bilangan acak, kemudian gunakan hist() untuk menggambar histogram dari bilangan-bilangan itu. Anda akan melihat distribusi normal hidup di depan mata Anda!

Selamat coding, dan maya distribusi normal selalu bersama Anda! ???

Credits: Image by storyset