R - Rezeksi Linear: Panduan Pemula
Hai sana, calon ahli data sains! Hari ini, kita akan memulakan sebuah perjalanan menarik ke dalam dunia rezeksi linear menggunakan R. Jangan bimbang jika anda belum pernah mengprogram sebelum ini - saya akan disini bersama anda, menjelaskan segala-galanya secara berperingkat. Pada akhir panduan ini, anda akan terkejut dengan apa yang anda boleh capai hanya dengan beberapa baris kod!
Apa Itu Rezeksi Linear?
Sebelum kita masuk ke kod R, mari kita memahami apa itu rezeksi linear. Bayangkan anda cuba untuk menamakan berapa banyak ais krim anda akanjual berdasarkan suhu di luar. Anda mungkin perhatikan bahawa semakin tinggi suhu, penjualan ais krim anda juga meningkat. Rezeksi linear membantu kita mencari dan menjelaskan hubungan ini secara matematik.
Langkah-langkah untuk Menetapkan Rezeksi
Sekarang, mari kita pecahkan proses melakukan rezeksi linear di R ke dalam langkah-langkah yang dapat dikelola:
1. Persiapan Data
Pertama-tama, kita perlukan data untuk bekerja. Dalam R, kita boleh buat sendiri dataset atau mengimport satu. Mari kita buat dataset mudah tentang suhu dan penjualan ais krim:
temperature <- c(20, 22, 25, 27, 30, 32, 35)
ice_cream_sales <- c(50, 55, 65, 70, 80, 85, 95)
# Gabungkan ke dalam data frame
ice_cream_data <- data.frame(temperature, ice_cream_sales)
# Lihat data
print(ice_cream_data)
Bila anda jalankan kod ini, anda akan melihat tabel yang rapi dengan data suhu dan penjualan ais krim kami. Menarik, kan?
2. Visualisasikan Data
Sebelum kita mula membuat analisis, selalu baik untuk melihat data kita. R membuat ini sangat mudah dengan fungsi plotnya:
plot(ice_cream_data$temperature, ice_cream_data$ice_cream_sales,
main = "Penjualan Ais Krim vs Suhu",
xlab = "Suhu (°C)", ylab = "Penjualan Ais Krim",
pch = 19, col = "blue")
Kod ini akan membuat plot scatter dari data kita. Argumen main
menetapkan tajuk, xlab
dan ylab
melabelkan sumbu, pch = 19
membuat titik bulat, dan col = "blue"
memberikan warna biru. Mainkan dengan opsyen ini - jadikan ia milik anda!
3. Lakukan Rezeksi Linear
Sekarang, mari kita melakukan rezeksi linear yang menarik. Dalam R, kita menggunakan fungsi lm()
, yang berarti "model linear":
ice_cream_model <- lm(ice_cream_sales ~ temperature, data = ice_cream_data)
Baris ini mungkin kelihatan mudah, tetapi ia melakukan banyak kerja di belakang layar. Ia mencari garis yang paling sesuai melalui titik data kita.
4. Semak Hasil
Mari kita lihat apa yang model kita temui:
summary(ice_cream_model)
Perintah ini akan memberikan anda ringkasan terperinci model anda. Jangan bimbang jika beberapa bahagian kelihatan menakutkan - kita akan fokus pada bahagian utama:
- Seksyen Coefficients menunjukkan斜率 dan pemanasan garis kita.
- Nilai R-squared memberitahu kita betapa baik model kita muat data.
5. Visualisasikan Garis Rezeksi
Sekarang, mari kita tambahkan garis rezeksi ke plot kita:
plot(ice_cream_data$temperature, ice_cream_data$ice_cream_sales,
main = "Penjualan Ais Krim vs Suhu",
xlab = "Suhu (°C)", ylab = "Penjualan Ais Krim",
pch = 19, col = "blue")
abline(ice_cream_model, col = "red")
Fungsi abline()
menambah garis rezeksi ke plot. Adakahnya menyelesaikan untuk melihat garis ini melalui titik kita?
Fungsi lm(): Teman Baru Anda
Kami sudah menggunakan fungsi lm()
sebelum ini, tetapi mari kita masuk lebih mendalam. Fungsi ini adalah hati rezeksi linear di R. Berikut adalah struktur asasnya:
lm(formula, data)
-
formula
: Ini menentukan hubungan antara variabel anda. Dalam kes kami, ia adalahice_cream_sales ~ temperature
. -
data
: Ini adalah dataset yang anda gunakan.
Simbol ~
dalam formula dibaca sebagai "di modelkan sebagai fungsi dari". Jadi formula kami membaca "penjualan ais krim di modelkan sebagai fungsi suhu".
Fungsi predict(): Membuat Ramalan
Sekarang kita ada model, kita boleh menggunakannya untuk membuat ramalan. Itu di mana fungsi predict()
menjadi berguna:
new_temperatures <- data.frame(temperature = c(23, 28, 33))
predicted_sales <- predict(ice_cream_model, newdata = new_temperatures)
print(predicted_sales)
Kod ini meramal penjualan ais krim untuk suhu 23°C, 28°C, dan 33°C. Menarik, kan?
Jadual Fungsi Berguna
Berikut adalah jadual rujukan cepat untuk fungsi utama yang kami gunakan:
Fungsi | Tujuan | Contoh |
---|---|---|
lm() |
Lakukan rezeksi linear | lm(y ~ x, data) |
summary() |
Dapatkan ringkasan model terperinci | summary(model) |
plot() |
Buat plot scatter | plot(x, y) |
abline() |
Tambah garis rezeksi ke plot | abline(model) |
predict() |
Buat ramalan | predict(model, newdata) |
Ingat, latihan membuat sempurna! Jangan takut untuk mencuba fungsi ini dan cuba mereka pada dataset lain. Sebelum anda tahu, anda akan menjadi ahli rezeksi linear!
Dalam kesimpulan, rezeksi linear adalah alat kuat untuk memahami hubungan antara variabel dan membuat ramalan. Dengan R, anda memiliki semua alat yang diperlukan di tangan anda. Terus jelajah, terus belajar, dan terutama, bersenang-senang dengannya!
Credits: Image by storyset