R - Rezeksi Linear: Panduan Pemula

Hai sana, calon ahli data sains! Hari ini, kita akan memulakan sebuah perjalanan menarik ke dalam dunia rezeksi linear menggunakan R. Jangan bimbang jika anda belum pernah mengprogram sebelum ini - saya akan disini bersama anda, menjelaskan segala-galanya secara berperingkat. Pada akhir panduan ini, anda akan terkejut dengan apa yang anda boleh capai hanya dengan beberapa baris kod!

R - Linear Regression

Apa Itu Rezeksi Linear?

Sebelum kita masuk ke kod R, mari kita memahami apa itu rezeksi linear. Bayangkan anda cuba untuk menamakan berapa banyak ais krim anda akanjual berdasarkan suhu di luar. Anda mungkin perhatikan bahawa semakin tinggi suhu, penjualan ais krim anda juga meningkat. Rezeksi linear membantu kita mencari dan menjelaskan hubungan ini secara matematik.

Langkah-langkah untuk Menetapkan Rezeksi

Sekarang, mari kita pecahkan proses melakukan rezeksi linear di R ke dalam langkah-langkah yang dapat dikelola:

1. Persiapan Data

Pertama-tama, kita perlukan data untuk bekerja. Dalam R, kita boleh buat sendiri dataset atau mengimport satu. Mari kita buat dataset mudah tentang suhu dan penjualan ais krim:

temperature <- c(20, 22, 25, 27, 30, 32, 35)
ice_cream_sales <- c(50, 55, 65, 70, 80, 85, 95)

# Gabungkan ke dalam data frame
ice_cream_data <- data.frame(temperature, ice_cream_sales)

# Lihat data
print(ice_cream_data)

Bila anda jalankan kod ini, anda akan melihat tabel yang rapi dengan data suhu dan penjualan ais krim kami. Menarik, kan?

2. Visualisasikan Data

Sebelum kita mula membuat analisis, selalu baik untuk melihat data kita. R membuat ini sangat mudah dengan fungsi plotnya:

plot(ice_cream_data$temperature, ice_cream_data$ice_cream_sales,
main = "Penjualan Ais Krim vs Suhu",
xlab = "Suhu (°C)", ylab = "Penjualan Ais Krim",
pch = 19, col = "blue")

Kod ini akan membuat plot scatter dari data kita. Argumen main menetapkan tajuk, xlab dan ylab melabelkan sumbu, pch = 19 membuat titik bulat, dan col = "blue" memberikan warna biru. Mainkan dengan opsyen ini - jadikan ia milik anda!

3. Lakukan Rezeksi Linear

Sekarang, mari kita melakukan rezeksi linear yang menarik. Dalam R, kita menggunakan fungsi lm(), yang berarti "model linear":

ice_cream_model <- lm(ice_cream_sales ~ temperature, data = ice_cream_data)

Baris ini mungkin kelihatan mudah, tetapi ia melakukan banyak kerja di belakang layar. Ia mencari garis yang paling sesuai melalui titik data kita.

4. Semak Hasil

Mari kita lihat apa yang model kita temui:

summary(ice_cream_model)

Perintah ini akan memberikan anda ringkasan terperinci model anda. Jangan bimbang jika beberapa bahagian kelihatan menakutkan - kita akan fokus pada bahagian utama:

  • Seksyen Coefficients menunjukkan斜率 dan pemanasan garis kita.
  • Nilai R-squared memberitahu kita betapa baik model kita muat data.

5. Visualisasikan Garis Rezeksi

Sekarang, mari kita tambahkan garis rezeksi ke plot kita:

plot(ice_cream_data$temperature, ice_cream_data$ice_cream_sales,
main = "Penjualan Ais Krim vs Suhu",
xlab = "Suhu (°C)", ylab = "Penjualan Ais Krim",
pch = 19, col = "blue")

abline(ice_cream_model, col = "red")

Fungsi abline() menambah garis rezeksi ke plot. Adakahnya menyelesaikan untuk melihat garis ini melalui titik kita?

Fungsi lm(): Teman Baru Anda

Kami sudah menggunakan fungsi lm() sebelum ini, tetapi mari kita masuk lebih mendalam. Fungsi ini adalah hati rezeksi linear di R. Berikut adalah struktur asasnya:

lm(formula, data)
  • formula: Ini menentukan hubungan antara variabel anda. Dalam kes kami, ia adalah ice_cream_sales ~ temperature.
  • data: Ini adalah dataset yang anda gunakan.

Simbol ~ dalam formula dibaca sebagai "di modelkan sebagai fungsi dari". Jadi formula kami membaca "penjualan ais krim di modelkan sebagai fungsi suhu".

Fungsi predict(): Membuat Ramalan

Sekarang kita ada model, kita boleh menggunakannya untuk membuat ramalan. Itu di mana fungsi predict() menjadi berguna:

new_temperatures <- data.frame(temperature = c(23, 28, 33))
predicted_sales <- predict(ice_cream_model, newdata = new_temperatures)
print(predicted_sales)

Kod ini meramal penjualan ais krim untuk suhu 23°C, 28°C, dan 33°C. Menarik, kan?

Jadual Fungsi Berguna

Berikut adalah jadual rujukan cepat untuk fungsi utama yang kami gunakan:

Fungsi Tujuan Contoh
lm() Lakukan rezeksi linear lm(y ~ x, data)
summary() Dapatkan ringkasan model terperinci summary(model)
plot() Buat plot scatter plot(x, y)
abline() Tambah garis rezeksi ke plot abline(model)
predict() Buat ramalan predict(model, newdata)

Ingat, latihan membuat sempurna! Jangan takut untuk mencuba fungsi ini dan cuba mereka pada dataset lain. Sebelum anda tahu, anda akan menjadi ahli rezeksi linear!

Dalam kesimpulan, rezeksi linear adalah alat kuat untuk memahami hubungan antara variabel dan membuat ramalan. Dengan R, anda memiliki semua alat yang diperlukan di tangan anda. Terus jelajah, terus belajar, dan terutama, bersenang-senang dengannya!

Credits: Image by storyset