R - Regresi Poisson: Panduan untuk Pemula
Hai sana, para data scientist yang sedang belajar! Hari ini, kita akan memulai sebuah perjalanan menarik ke dunia Regresi Poisson menggunakan R. Jangan khawatir jika Anda belum pernah memrogram sebelumnya - saya akan menjadi panduan yang ramah, dan kita akan mengambil langkah ini satu per satu. Pada akhir tutorial ini, Anda akan terkejut dengan apa yang Anda capai!
Apa Itu Regresi Poisson?
Sebelum kita masuk ke kode, mari kita mengerti apa itu Regresi Poisson. Bayangkan Anda menghitung jumlah email yang Anda terima setiap hari. Ada hari Anda mungkin mendapat 5, lainnya 10, atau bahkan 20. Jenis data ini sering kali mengikutiapa yang kita sebut distribusi Poisson, dan Regresi Poisson membantu kita memodelkan dan memprediksi data jenis hitungan ini.
Memulai dengan R
Pertama-tama, kita perlu mengatur lingkungan R kita. Jika Anda belum menginstal R, kunjungi situs Proyek R dan unduhnya. Setelah terinstal, buka RStudio (antarmuka yang ramah untuk R) jika Anda memilikinya, atau hanya buka R saja.
Membuat Model Regresi Poisson
Sekarang, mari kita meraba-raba dengan beberapa kode yang nyata!
Langkah 1: Menyiapkan Data
Kita akan mulai dengan membuat beberapa data contoh. mari katakan kita sedang mempelajari jumlah es krim yang terjual berdasarkan suhu.
# Membuat data contoh
temperature <- c(20, 22, 25, 28, 30, 32, 35)
ice_cream_sales <- c(10, 15, 20, 30, 40, 50, 60)
# Gabungkan ke dalam data frame
ice_cream_data <- data.frame(temperature, ice_cream_sales)
# Lihat data
print(ice_cream_data)
Ketika Anda menjalankan kode ini, Anda akan melihat dataset kita dicetak. Menarik, kan? Kita baru saja membuat data frame pertama kita di R!
Langkah 2: Membangun Model Regresi Poisson
Sekarang, mari kita buat model Regresi Poisson kita:
# Buat model Regresi Poisson
poisson_model <- glm(ice_cream_sales ~ temperature,
family = poisson(link = "log"),
data = ice_cream_data)
# Lihat ringkasan model
summary(poisson_model)
mari kitauraikan ini:
-
glm()
berarti Generalized Linear Model, dimana Regresi Poisson adalah jenisnya. -
ice_cream_sales ~ temperature
memberitahu R bahwa kita ingin memprediksi penjualan es krim berdasarkan suhu. -
family = poisson(link = "log")
menentukan bahwa kita menggunakan Regresi Poisson.
Fungsi summary()
akan memberikan Anda banyak informasi tentang model Anda. Jangan khawatir jika itu terlihat menakutkan - kita hanya akan fokus pada bagian penting.
Langkah 3: Menginterpretasi Hasil
Cari bagian "Coefficients" di output ringkasan. Anda akan melihat sesuatu seperti ini:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.123456 0.123456 9.999 <2e-16 ***
temperature 0.098765 0.004321 22.857 <2e-16 ***
"Estimate" untuk suhu memberitahu kita seberapa banyak log penjualan es krim meningkat untuk setiap derajat peningkatan suhu. Jika itu positif (seperti dalam contoh kita), itu berarti penjualan es krim meningkat dengan suhu - masuk akal, kan?
Langkah 4: Membuat Prediksi
Sekarang, mari kita prediksi penjualan es krim untuk suhu baru:
# Prediksi penjualan es krim untuk suhu 27°C
new_temp <- data.frame(temperature = 27)
predicted_sales <- predict(poisson_model, newdata = new_temp, type = "response")
print(paste("Prediksi penjualan es krim di 27°C:", round(predicted_sales)))
Kode ini membuat titik data baru (27°C), menggunakan model kita untuk memprediksi penjualan, dan mencetak hasilnya.
Kesimpulan
Selamat! Anda baru saja membuat model Regresi Poisson pertama Anda di R. Kita telah meliputi banyak hal, dari menyiapkan data sampai membuat prediksi. Ingat, latihan membuat sempurna, jadi jangan takut untuk mencoba dengan dataset Anda sendiri.
Berikut ini adalah ringkasan metode yang kita gunakan:
Metode | Deskripsi |
---|---|
data.frame() |
Membuat data frame |
glm() |
Menyusun model generalized linear |
summary() |
Menyediakan ringkasan model |
predict() |
Membuat prediksi menggunakan model |
Terus eksplorasi, terus bertanya, dan yang paling penting, terus bersenang-senang dengan R! Siapa tahu, mungkin Anda akan memprediksi penjualan es krim untuk hidup satu hari nanti. ?
Selamat coding, para data scientist masa depan!
Credits: Image by storyset