R - Regresi Linear: Panduan untuk Pemula

Halo sana, calon ilmuwan data! Hari ini, kita akan memulai perjalanan menarik ke dunia regresi linear menggunakan R. Jangan khawatir jika Anda belum pernah memprogram sebelumnya - saya akan bersama Anda, menjelaskan setiap langkah secara rinci. Pada akhir panduan ini, Anda akan terkejut dengan apa yang Anda dapat capai hanya dengan beberapa baris kode!

R - Linear Regression

Apa Itu Regresi Linear?

Sebelum kita masuk ke kode R, mari kita pahami apa itu regresi linear. Bayangkan Anda mencoba memprediksi berapa banyak es krim Anda akan menjual berdasarkan suhu di luar ruangan. Anda mungkin melihat bahwa saat suhu meningkat, penjualan es krim Anda juga meningkat. Regresi linear membantu kita menemukan dan menjelaskan hubungan ini secara matematika.

Langkah untuk Menetapkan Regresi

Sekarang, mari kita pecah proses melakukan regresi linear di R menjadi langkah-langkah yang mudah:

1. Persiapkan Data Anda

Pertama-tama, kita butuh beberapa data untuk bekerja. Di R, kita dapat membuat dataset sendiri atau mengimpor satu. Mari kita buat dataset sederhana tentang suhu dan penjualan es krim:

temperature <- c(20, 22, 25, 27, 30, 32, 35)
ice_cream_sales <- c(50, 55, 65, 70, 80, 85, 95)

# Kombinasikan ke dalam data frame
ice_cream_data <- data.frame(temperature, ice_cream_sales)

# Lihat data
print(ice_cream_data)

Ketika Anda menjalankan kode ini, Anda akan melihat tabel yang rapih dengan data suhu dan penjualan es krim kami. Bagus, kan?

2. Visualisasikan Data Anda

Sebelum kita mulai analisis apa pun, selalu baik untuk melihat data kita. R membuat ini sangat mudah dengan fungsi plotting-nya:

plot(ice_cream_data$temperature, ice_cream_data$ice_cream_sales,
main = "Penjualan Es Krim vs Suhu",
xlab = "Suhu (°C)", ylab = "Penjualan Es Krim",
pch = 19, col = "blue")

Kode ini akan membuat scatter plot dari data kita. Argumen main menentukan judul, xlab dan ylab melabeli sumbu, pch = 19 membuat titik bulat, dan col = "blue" memberikan warna biru. Mainkan dengan opsi ini - buatnya sesuai dengan keinginan Anda!

3. Lakukan Regresi Linear

Sekarang, mari kita masuk ke bagian menarik - melakukan regresi linear. Di R, kita menggunakan fungsi lm(), yang berarti "model linear":

ice_cream_model <- lm(ice_cream_sales ~ temperature, data = ice_cream_data)

Baris ini mungkin terlihat sederhana, tapi di belakang layar, itu melakukan banyak pekerjaan. Itu menemukan garis yang paling cocok melalui titik data kita.

4. Periksa Hasil

Mari kita lihat apa yang ditemukan model kita:

summary(ice_cream_model)

Perintah ini akan memberikan Anda ringkasan detil model Anda. Jangan khawatir jika beberapa bagian terlihat menakutkan - kita akan fokus pada bagian utama:

  • Bagian Koefisien menunjukkan kemiringan dan intercept garis kita.
  • Nilai R-kuadrat mengatakanberapa baik model kita memasak data.

5. Visualisasikan Garis Regresi

Sekarang, mari kita tambahkan garis regresi ke plot kita:

plot(ice_cream_data$temperature, ice_cream_data$ice_cream_sales,
main = "Penjualan Es Krim vs Suhu",
xlab = "Suhu (°C)", ylab = "Penjualan Es Krim",
pch = 19, col = "blue")

abline(ice_cream_model, col = "red")

Fungsi abline() menambahkan garis regresi ke plot. Apakah ini menyenangkan untuk melihat garis itu melewati titik kita?

Fungsi lm(): Teman Baru Anda

Kami sudah menggunakan fungsi lm() sebelumnya, tapi mari kita masuk lebih dalam. Fungsi ini adalah hati regresi linear di R. Berikut adalah struktur dasar nya:

lm(formula, data)
  • formula: Ini menentukan hubungan antara variabel Anda. Dalam kasus kita, itu adalah ice_cream_sales ~ temperature.
  • data: Ini adalah dataset yang Anda gunakan.

Simbol ~ dalam formula dibaca sebagai "di modelkan sebagai fungsi dari". Jadi formula kita membaca "penjualan es krim di modelkan sebagai fungsi dari suhu".

Fungsi predict(): Membuat Prediksi

Sekarang kita memiliki model, kita dapat menggunakannya untuk membuat prediksi. Itu di mana fungsi predict() berguna:

new_temperatures <- data.frame(temperature = c(23, 28, 33))
predicted_sales <- predict(ice_cream_model, newdata = new_temperatures)
print(predicted_sales)

Kode ini memprediksi penjualan es krim untuk suhu 23°C, 28°C, dan 33°C. Sangat keren, kan?

Tabel Referensi Fungsi Berguna

Berikut ini adalah tabel referensi singkat dari fungsi utama yang kita gunakan:

Fungsi Tujuan Contoh
lm() Lakukan regresi linear lm(y ~ x, data)
summary() Dapatkan ringkasan model detil summary(model)
plot() Buat scatter plot plot(x, y)
abline() Tambahkan garis regresi ke plot abline(model)
predict() Buat prediksi predict(model, newdata)

Ingat, latihan membuat sempurna! Jangan takut untuk mencoba fungsi ini dan mencobanya pada dataset yang berbeda. Sebelum Anda tahu, Anda akan menjadi ahli regresi linear!

Akhir kata, regresi linear adalah alat yang kuat untuk memahami hubungan antara variabel dan membuat prediksi. Dengan R, Anda memiliki semua alat yang Anda butuhkan di ujung jari Anda. Terus eksplorasi, terus belajar, dan terutama, bersenang-senang dengannya!

Credits: Image by storyset