Distribusi Normal: Panduan Ramah untuk Pemula

Hai teman-teman masa depan para ahli R! ? Hari ini, kita akan mendalam ke dunia yang menarik dari distribusi normal dalam R. Jangan khawatir jika Anda belum pernah mengprogram sebelumnya - saya akan menjadi panduan ramah Anda dalam perjalanan ini, dan kita akan berjalan langkah demi langkah. Pada akhir tutorial ini, Anda akan terkesan dengan apa yang Anda bisa lakukan hanya dengan beberapa baris kode!

R - Normal Distribution

Apa Itu Distribusi Normal?

Sebelum kita masuk ke R, mari kita bicarakan singkat tentang apa itu distribusi normal. Bayangkan Anda mengukur tinggi semua siswa di sekolah Anda. Anda mungkin akan menemukan bahwa sebagian besar orang berada di sekitar tinggi rata-rata, dengan lebih sedikit orang yang sangat tinggi atau sangat pendek. Jika Anda menggambar ini di grafik, itu akan tampak seperti kurva lonceng. Itu adalah distribusi normal!

Dalam statistik, kita menggunakan distribusi normal secara berkala, dan R memiliki beberapa fungsi yang fantastik untuk membantu kita bekerja dengannya. Mari kita jelajahi fungsi-fungsi ini satu per satu.

Fungsi Distribusi Normal di R

R menyediakan empat fungsi utama untuk bekerja dengan distribusi normal. Berikut adalah overview singkat:

Fungsi	Tujuan
dnorm()	Menghitung kepadatan (tinggi) distribusi normal di titik yang diberikan
pnorm()	Menghitung probabilitas kumulatif (luas di bawah kurva) hingga titik yang diberikan
qnorm()	Menemukan nilai (kwantil) yang sesuai dengan probabilitas yang diberikan
rnorm()	Menghasilkan bilangan acak dari distribusi normal

Sekarang, mari kita masuk ke masing-masing fungsi ini dan lihat bagaimana mereka bekerja!

dnorm(): Fungsi Kepadatan

Fungsi dnorm() membantu kita menemukan tinggi kurva distribusi normal di titik mana pun. Itu seperti bertanya, "Berapa kemungkinan nilai ini khususnya?"

mari coba contoh:

# Menghitung kepadatan di x = 0 untuk distribusi normal standar
result <- dnorm(0)
print(result)

Ketika Anda menjalankan kode ini, Anda akan melihat:

[1] 0.3989423

Ini berarti bahwa tinggi kurva distribusi normal standar di x = 0 adalah sekitar 0.3989.

Tapi apa jika kita ingin mengubah rata-rata atau simpangan baku? Tak ada masalah! Mari coba:

# Menghitung kepadatan di x = 1 untuk distribusi normal dengan mean = 2 dan sd = 0.5
result <- dnorm(1, mean = 2, sd = 0.5)
print(result)

Output:

[1] 0.1079819

Lihat betapa mudah itu? Kita hanya mengatakan ke R bahwa kita ingin distribusi normal dengan rata-rata 2 dan simpangan baku 0.5, lalu meminta kepadatan di x = 1.

pnorm(): Fungsi Probabilitas Kumulatif

Sekarang, mari kita pindah ke pnorm(). Fungsi ini menghitung probabilitas mendapatkan nilai kurang dari atau sama dengan titik yang diberikan. Itu seperti bertanya, "Berapa peluang mendapatkan nilai ini rendah atau lebih rendah?"

mari coba contoh:

# Menghitung probabilitas mendapatkan nilai kurang dari atau sama dengan 1.96
# dalam distribusi normal standar
result <- pnorm(1.96)
print(result)

Output:

[1] 0.9750021

Ini memberitahu kita bahwa ada sekitar 97.5% peluang mendapatkan nilai kurang dari atau sama dengan 1.96 dalam distribusi normal standar.

Catatan menarik: Ini adalah sebab mengapa 1.96 sering digunakan dalam statistik untuk interval kepercayaan 95%!

Mari coba contoh lain dengan rata-rata dan simpangan baku yang berbeda:

# Menghitung probabilitas mendapatkan nilai kurang dari atau sama dengan 70
# dalam distribusi normal dengan mean = 60 dan sd = 10
result <- pnorm(70, mean = 60, sd = 10)
print(result)

Output:

[1] 0.8413447

Ini berarti ada sekitar 84.1% peluang mendapatkan nilai kurang dari atau sama dengan 70 dalam distribusi ini.

qnorm(): Fungsi Kwantil

qnorm() seperti kebalikan dari pnorm(). Daripada memberikan nilai dan meminta probabilitas, kita memberikan probabilitas dan meminta nilai. Itu seperti mengatakan, " Mana nilai yang akan memberikan probabilitas ini?"

mari cobalah:

# Menemukan nilai yang memberikan probabilitas kumulatif 0.95
# dalam distribusi normal standar
result <- qnorm(0.95)
print(result)

Output:

[1] 1.644854

Ini memberitahu kita bahwa 95% nilai dalam distribusi normal standar berada di bawah 1.645.

Kita juga bisa menggunakan rata-rata dan simpangan baku yang berbeda:

# Menemukan nilai yang memberikan probabilitas kumulatif 0.99
# dalam distribusi normal dengan mean = 100 dan sd = 15
result <- qnorm(0.99, mean = 100, sd = 15)
print(result)

Output:

[1] 134.8745

Jadi, dalam distribusi ini, 99% nilai berada di bawah 134.87.

rnorm(): Menghasilkan Bilangan Acak

Terakhir namun tidak kurang penting, kita punya rnorm(). Fungsi ini seperti generator bilangan acak yang mengikuti aturan distribusi normal. Itu sangat berguna untuk simulasi dan membuat data tes.

mari lihat bagaimana menggunakannya:

# Menghasilkan 5 bilangan acak dari distribusi normal standar
random_numbers <- rnorm(5)
print(random_numbers)

Output (nomor Anda akan berbeda):

[1] -0.56047565 -0.23017749  1.55870831  0.07050839  0.12928774

Kita juga bisa menentukan rata-rata dan simpangan baku yang berbeda:

# Menghasilkan 5 bilangan acak dari distribusi normal dengan mean = 50 dan sd = 10
random_numbers <- rnorm(5, mean = 50, sd = 10)
print(random_numbers)

Output (nomor Anda akan berbeda):

[1] 52.39086 46.08371 47.92569 62.36229 45.45923

Apakah itu menarik? Dengan hanya satu baris kode, kita bisa menghasilkan sebanyak bilangan acak yang kita inginkan, mengikuti distribusi normal mana pun yang kita tentukan!

Penutup

Dan itu adalah dia, teman-teman! Kita telah berpergian melalui negeri distribusi normal di R, mengunjungi empat fungsi yang kuat sepanjang jalan. Ingat, latihan membuat sempurna, jadi jangan takut untuk mencoba fungsi-fungsi ini. Cobalah nilai yang berbeda, gambarkan hasilnya, dan lihat apa yang terjadi!

Berikut adalah tantangan kecil untuk Anda: Cobalah menggunakan rnorm() untuk menghasilkan 1000 bilangan acak, lalu gunakan hist() untuk menggambar histogram dari bilangan-bilangan itu. Anda akan melihat distribusi normal hidup di depan mata Anda!

Selamat belajar, dan maya distribusi normal selalu menyertainya! ???

Credits: Image by storyset

Tutorial Sebelumnya:

R - Regresi Logistik

Tutorial Selanjutnya:

R - Distribusi Binomial