R - Regresi Ganda: Panduan untuk Pemula
Halo sana, para programer R masa depan! Hari ini, kita akan memulai perjalanan menarik ke dunia regresi ganda menggunakan R. Jangan khawatir jika Anda belum pernah menulis baris kode sebelumnya - saya akan menjadi panduan ramah Anda di setiap langkah. Pada akhir tutorial ini, Anda akan terkejut dengan apa yang Anda dapat capai hanya dengan beberapa baris kode R!
Apa Itu Regresi Ganda?
Sebelum kita masuk ke kode, mari kita pahami apa itu regresi ganda. Bayangkan Anda mencoba untuk memprediksi harga sebuah rumah. Anda mungkin akan berpikir tentang ukurannya, tapi itu bukanlah satu-satunya faktor, kan? Jumlah kamar tidur, lingkungan sekitar, dan bahkan umur rumah juga bisa mempengaruhi hal itu. Regresi ganda adalah teknik statistik yang membantu kita memahami bagaimana beberapa faktor (kami sebut mereka variabel bebas) mempengaruhi hasil (variabel dependen) kita.
Fungsi lm(): Teman Baru Anda
Dalam R, kita menggunakan fungsi lm()
untuk melakukan regresi ganda. "lm" berarti "model linear", dan ini akan menjadi teman baru Anda di dunia statistik. Mari kitauraikan bagaimana cara menggunakannya:
model <- lm(dependent_variable ~ independent_variable1 + independent_variable2 + ..., data = your_dataset)
Mungkin terlihat agak menakutkan pada awalnya, tapi mari kitauraikan:
-
model
adalah hanya nama yang kita berikan untuk menyimpan hasil regresi kita. -
dependent_variable
adalah apa yang kita coba prediksi. -
~
adalah seperti mengatakan "diungkapkan oleh" dalam bahasa R. -
independent_variable1
,independent_variable2
, dll., adalah pem prediksi kita. -
data = your_dataset
memberitahu R di mana mencari variabel kita.
Contoh Langkah demi Langkah
Mari kita jelajahi contoh nyata bersama. Kita akan menggunakan dataset bawaan di R yang disebut mtcars
(singkatan dari Motor Trend Car Road Tests). Ini adalah dataset tentang berbagai model mobil dan karakteristiknya.
Langkah 1: Mengeksplor Data
Pertama-tama, mari kita lihat sedikit data kita:
head(mtcars)
Ini akan menampilkan beberapa baris pertama dataset. Anda akan melihat kolom seperti mpg
(miles per gallon), cyl
(jumlah silinder), disp
(displacement), dan hp
(horsepower).
Langkah 2: Membuat Model
katakanlah kita ingin memprediksi miles per gallon (mpg) mobil berdasarkan bobotnya (wt
) dan horsepower (hp
). Berikut cara kita melakukannya:
car_model <- lm(mpg ~ wt + hp, data = mtcars)
Langkah 3: Mengerti Hasil
Sekarang, mari kita lihat apa yang model kita katakan:
summary(car_model)
Perintah ini akan memberikan kita banyak informasi. Jangan khawatir jika beberapa hal terlihat seperti bahasa koding - kita akan fokus pada bagian penting:
- Koefisien: Ini memberitahu kita bagaimana setiap variabel mempengaruhi mpg. Nilai negatif berarti bahwa jika variabel meningkat, mpg menurun.
- R-kuadrat: Ini memberitahu kita seberapa baik model kita memasak data. Nilainya berada di antara 0 dan 1, dengan 1 adalah pasak sempurna.
- Nilai p: Ini memberitahu kita apakah hasil kita statistik significant. Biasanya, kita mencari nilai kurang dari 0,05.
Langkah 4: Membuat Prediksi
Sekarang, mari kita gunakan model kita untuk memprediksi mpg untuk mobil dengan bobot 3000 lbs dan 150 horsepower:
new_car <- data.frame(wt = 3, hp = 150)
predict(car_model, new_car)
Dan voilà! Anda baru saja membuat prediksi menggunakan regresi ganda.
Visualisasi Hasil
Gambar senyap mengatakan seribu kata, terutama dalam ilmu data. Mari kita buat plot sederhana untuk visualisasi model kita:
plot(mtcars$wt, mtcars$mpg, main = "Weight vs MPG", xlab = "Weight", ylab = "Miles Per Gallon")
abline(lm(mpg ~ wt, data = mtcars), col = "red")
Ini membuat scatter plot dari bobot vs mpg dan menambahkan garis regresi kita dalam warna merah.
Metode Umum dalam Regresi Ganda
Berikut adalah tabel metode umum yang Anda mungkin gunakan dengan model regresi Anda:
Metode | Deskripsi |
---|---|
summary() | Memberikan ringkasan detil model regresi |
coefficients() | Mengembalikan koefisien model |
residuals() | Menampilkan perbedaan antara nilai observasi dan nilai diprediksi |
predict() | Membuat prediksi menggunakan model |
plot() | Membuat berbagai plot diagnostik |
anova() | Melakukan analisis varian pada model |
Kesimpulan
Selamat! Anda baru saja mengambil langkah pertama ke dunia regresi ganda dengan R. Ingat, seperti belajar keterampilan baru, latihan membuat sempurna. Jangan khawatir untuk mencoba dataset dan variabel yang berbeda.
Saat kita menutup, saya teringat dari seorang siswa yang pernah mengatakan kepadaku, "Saya tidak pernah berpikir bahwa saya akan dapat memprediksi sesuatu dengan matematika!" Well, sekarang Anda tidak hanya dapat memprediksi hal-hal, tetapi Anda juga dapat melakukannya dengan beberapa faktor sekaligus. Bagaimana itu untuk kekuatan super?
Terus coding, terus belajar, dan terutama, terus bersenang-senang dengan R!
Credits: Image by storyset