Pada pembahasan kali ini kita akan membahas tentang
bagaimana melakukan uji Regresi Linear sederhana menggunakan Jupyter.
Apa itu Regresi Linear? Regresi pertama kali diteliti secara
mendalam oleh seorang ilmuwan bernama Sir Francis Galton diabad ke-19, yang juga seorang ahli statistika,
astronomer dan antroplogis. Beliau menemukan ilmu regresi saat meneliti
beberapa spesies tanaman dan hewan.
Regresi Linear Sederhana atau sering disingkat dengan SLR (
Simple Linear Regression ) juga merupakan salah satu Metode Statistik yang
dipergunakan dalam produksi untuk melakukan peramalan ataupun prediksi tentang karakteristik
kualitas maupun kuantitas.
Model Persamaan Regresi Linear Sederhana adalah seperti
berikut ini :
Y = a + bX
Dimana:
Y = Variabel Responseatau
Variabel Akibat (Dependent)
X = Variabel Predictor atau
Variabel Faktor Penyebab (Independent)
a = konstanta
b = koefisien regresi
(kemiringan/slope); besaran Response yang ditimbulkan oleh Predictor .
Adapun langkah-langkah yang perlu dilakukan untuk melakukan
analisis dan uji regresi linier sederhana adalah sebagai berikut:
1. Menentukan tujuan dari
Analisis Regresi Linear Sederhana
2. Mengidentifikasi variabel
predictor dan variabel response
3. Melakukan pengumpulan data
dalam bentuk tabel
4. Menghitung X², Y²,XY dan total
dari masing-masingnya
5. Menghitung a dan b menggunakan
rumus yang telah ditentukan
6. Melakukan prediksi terhadap
variabel predictor atau response
7. Uji korelasi
8. Membuat model Persamaan Garis
Regresi
Untuk penerapan Regresi Linear sederhana menggunakan Jupyter
sebagai berikut.
Sebagai contoh kita akan menganalisa banyaknya unit gadget
yang akan terjual dengan perbandingan jumlah biaya iklan.
Pertama kita memanggil library pandas dan matplotlib yang
akan kita gunakan untuk mengolah data dan membuat grafik.
Berikutnya kita akan menggunakan data dari 'http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv'
data tersebut berisikan 200 pengamatan
Variabel bebas/predictor?
• TV: iklan(dolar) yang
dihabiskan di TV untuk satu produkdi pasar tertentu(dalam ribuan dolar)
• Radio: uang iklan yang
dihabiskan untuk Radio
• Koran: uang iklan dihabiskan untuk
Koran
Variabel terikat/response?
• Penjualan: penjualan satu produkdi
pasar tertentu(dalam ribuan gadget)
Berikutnya kita dapat menampilkan sebaran grafik data
berdasarkan jenis iklannya menggunakan plot
Selanjutnya disini kita akan mengambil contoh penjualan
dengan iklan di TV untuk menentukan koefisien dengan menggunakan statsmodels
yang di dalamnya telah berisi formula
Selanjutnya Uji coba Melakukan prediksi terhadap variabel predictor
atau response dengan contoh
ada pasar baru di mana pengeluaran iklan TV adalah $ 50,000.
Apa yang akan diprediksi untuk Penjualan di pasar itu?
Dengan demikian, diperkirakan Penjualan sebanyak 9.409 unit
di pasar itu
Selanjutnya kita melakukan uji korelasi dengan dengan
rsquared dan memperoleh sekitar 61%
Tahap terakhir kita membuat persamaan garis regresi dengan predict dan memperoleh y awal 7.065869
dan y akhir 21.122454.
Demikian pembahasan tentang Regresi Linear sederhana menggunakan
Jupyter semoga bermanfaat.
.