Uji Regresi Linear Sederhana Menggunakan Jupyter


Pada pembahasan kali ini kita akan membahas tentang bagaimana melakukan uji Regresi Linear sederhana menggunakan Jupyter.

Apa itu Regresi Linear? Regresi pertama kali diteliti secara mendalam oleh seorang ilmuwan bernama Sir Francis Galton  diabad ke-19, yang juga seorang ahli statistika, astronomer dan antroplogis. Beliau menemukan ilmu regresi saat meneliti beberapa spesies tanaman dan hewan.
Regresi Linear Sederhana atau sering disingkat dengan SLR ( Simple Linear Regression ) juga merupakan salah satu Metode Statistik yang dipergunakan dalam produksi untuk melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun kuantitas.

Model Persamaan Regresi Linear Sederhana adalah seperti berikut ini : 



Y = a + bX 

Dimana:             
Y = Variabel Responseatau Variabel Akibat (Dependent)
X = Variabel Predictor atau Variabel Faktor Penyebab (Independent)
a = konstanta
b = koefisien regresi (kemiringan/slope); besaran Response yang ditimbulkan oleh Predictor .


Adapun langkah-langkah yang perlu dilakukan untuk melakukan analisis dan uji regresi linier sederhana adalah sebagai berikut:
1. Menentukan tujuan dari Analisis Regresi Linear Sederhana
2. Mengidentifikasi variabel predictor dan variabel response
3. Melakukan pengumpulan data dalam bentuk tabel
4. Menghitung X², Y²,XY dan total dari masing-masingnya
5. Menghitung a dan b menggunakan rumus yang telah ditentukan
6. Melakukan prediksi terhadap variabel predictor atau response
7. Uji korelasi
8. Membuat model Persamaan Garis Regresi
 



Untuk penerapan Regresi Linear sederhana menggunakan Jupyter sebagai berikut.
Sebagai contoh kita akan menganalisa banyaknya unit gadget yang akan terjual dengan perbandingan jumlah biaya iklan.


 


Pertama kita memanggil library pandas dan matplotlib yang akan kita gunakan untuk mengolah data dan membuat grafik.


 


Berikutnya kita akan menggunakan data dari 'http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv' data tersebut berisikan 200 pengamatan
Variabel bebas/predictor?
• TV: iklan(dolar) yang dihabiskan di TV untuk satu produkdi pasar tertentu(dalam ribuan dolar)
• Radio: uang iklan yang dihabiskan untuk Radio
• Koran: uang iklan dihabiskan untuk Koran
Variabel terikat/response?
• Penjualan: penjualan satu produkdi pasar tertentu(dalam ribuan gadget)


 


Berikutnya kita dapat menampilkan sebaran grafik data berdasarkan jenis iklannya menggunakan plot


 


Selanjutnya disini kita akan mengambil contoh penjualan dengan iklan di TV untuk menentukan koefisien dengan menggunakan statsmodels yang di dalamnya telah berisi formula


 

Selanjutnya Uji coba Melakukan prediksi terhadap variabel predictor atau response dengan contoh
ada pasar baru di mana pengeluaran iklan TV adalah $ 50,000. Apa yang akan diprediksi untuk Penjualan di pasar itu?
Dengan demikian, diperkirakan Penjualan sebanyak 9.409 unit di pasar itu
 


Selanjutnya kita melakukan uji korelasi dengan dengan rsquared dan memperoleh sekitar 61%

 


Tahap terakhir kita membuat persamaan garis  regresi dengan predict dan memperoleh y awal 7.065869 dan y akhir 21.122454.
Demikian pembahasan tentang Regresi Linear sederhana menggunakan Jupyter semoga bermanfaat.