Perbedaan Antara Regresi Linier dan Regresi Logistik - Perbedaan Antara

Perbedaan Antara Regresi Linier dan Regresi Logistik

Itu perbedaan utama antara regresi linier dan regresi logistik adalah bahwa regresi linier digunakan untuk memprediksi nilai kontinu sedangkan regresi logistik digunakan untuk memprediksi nilai diskrit.

Sistem pembelajaran mesin dapat memprediksi hasil di masa mendatang berdasarkan pelatihan input masa lalu. Ada dua jenis utama pembelajaran mesin yang disebut pembelajaran terawasi dan pembelajaran tanpa pengawasan. Regresi dan klasifikasi berada di bawah pembelajaran terawasi sedangkan pengelompokan jatuh di bawah pembelajaran tanpa pengawasan. Algoritma pembelajaran yang diawasi menggunakan data berlabel untuk melatih set data. Regresi linier dan regresi logistik adalah dua jenis algoritma pembelajaran terawasi. Regresi linier digunakan ketika variabel dependen kontinu, dan modelnya linier. Regresi logistik digunakan ketika variabel dependen diskrit, dan modelnya adalah nonlinier.

Bidang-bidang Utama yang Dicakup

1. Apa itu Regresi Linier
- Definisi, Fungsi
2. Apa itu Regresi Logistik
- Definisi, Fungsi
3. Perbedaan Antara Regresi Linier dan Regresi Logistik
- Perbandingan Perbedaan Kunci

Ketentuan Utama

Regresi Linier, Regresi Logistik, Pembelajaran Mesin


Apa itu Regresi Linier

Regresi linier menemukan hubungan antara variabel independen dan dependen. Keduanya berdekatan. Variabel independen adalah variabel yang tidak diubah oleh variabel lain. Ini dilambangkan dengan x. Bisa juga ada beberapa variabel independen seperti x1, x2, x3, dll. Variabel dependen berubah sesuai dengan variabel independen, dan dilambangkan dengan y.

Ketika ada satu variabel independen, persamaan regresi adalah sebagai berikut.

y = b0 + b1x

Misalnya, anggap x mewakili curah hujan dan y mewakili hasil panen.


Gambar 1: Regresi Linier

Dataset akan terlihat seperti di atas. Kemudian, garis yang mencakup sebagian besar titik data dipilih. Baris ini mewakili nilai prediksi.


Gambar 2: Jarak antara titik data aktual dan nilai prediksi

Kemudian, jarak dari setiap titik data ke garis ditemukan seperti yang ditunjukkan pada grafik di atas. Ini adalah jarak antara nilai aktual dan nilai prediksi. Jarak ini juga dikenal sebagai kesalahan atau residu. Baris paling pas harus memiliki jumlah kuadrat kesalahan terkecil. Ketika nilai curah hujan baru diberikan (x), dimungkinkan untuk menemukan hasil panen yang sesuai (y) menggunakan garis ini.

Di dunia nyata, mungkin ada beberapa variabel independen (x1, x2, x3 ...). Ini disebut regresi linier berganda. Persamaan regresi linier berganda adalah sebagai berikut.

Apa itu Regresi Logistik

Regresi logistik dapat digunakan untuk mengklasifikasikan dua kelas. Ia juga dikenal sebagai klasifikasi biner. Memeriksa apakah suatu email adalah spam atau tidak, meramalkan apakah seorang pelanggan akan membeli suatu produk atau tidak, memperkirakan apakah mungkin untuk mendapatkan promosi atau tidak adalah beberapa contoh regresi logistik lainnya.


Gambar 3: Regresi Logistik

Asumsikan bahwa jumlah jam yang dipelajari siswa per hari adalah variabel independen. Bergantung pada itu, probabilitas lulus ujian dihitung. Nilai 0,5 dianggap sebagai ambang batas. Ketika jumlah jam baru diberikan, dimungkinkan untuk menemukan probabilitas yang sesuai untuk lulus ujian menggunakan grafik ini. Jika probabilitas di atas 0,5, itu dianggap sebagai 1 atau lulus. Jika probabilitas di bawah 0,5, maka dianggap 0 atau gagal.

Menerapkan persamaan regresi linier ke fungsi sigmoid akan memberikan persamaan regresi logistik.

Fungsi sigmoid adalah


Poin penting lain yang perlu diperhatikan adalah bahwa regresi logistik hanya berlaku untuk mengklasifikasikan 2 kelas. Itu tidak digunakan untuk klasifikasi multi-kelas.

Perbedaan Antara Regresi Linier dan Regresi Logistik

Definisi

Regresi linier adalah pendekatan linier yang memodelkan hubungan antara variabel dependen dan satu atau lebih variabel independen. Sebaliknya, regresi logistik adalah model statistik yang memprediksi probabilitas hasil yang hanya dapat memiliki dua nilai.

Pemakaian

Sementara regresi linier digunakan untuk menyelesaikan masalah regresi, regresi logistik digunakan untuk menyelesaikan masalah klasifikasi (klasifikasi biner).

Metodologi

Regresi linier mengestimasi variabel dependen ketika ada perubahan dalam variabel independen. Regresi logistik menghitung kemungkinan suatu peristiwa terjadi. Ini adalah satu perbedaan penting antara regresi linier dan regresi logistik.

Nilai Output

Juga, dalam regresi linier, nilai output kontinu. Dalam regresi logistik, nilai output diskrit.

Model

Meskipun regresi linier menggunakan garis lurus, regresi logistik menggunakan kurva S atau fungsi sigmoid. Ini adalah perbedaan penting lainnya antara regresi linier dan regresi logistik.

Contohnya

Memprediksi PDB suatu negara, memprediksi harga produk, memprediksi harga jual rumah, prediksi skor adalah beberapa contoh regresi linier. Memprediksi apakah email itu spam atau bukan, memprediksi apakah transaksi kartu kredit itu penipuan atau tidak, memprediksi apakah pelanggan akan mengambil pinjaman atau tidak adalah beberapa contoh regresi logistik.

Kesimpulan

Perbedaan antara regresi linier dan regresi logistik adalah bahwa regresi linier digunakan untuk memprediksi nilai kontinu sedangkan regresi logistik digunakan untuk memprediksi nilai diskrit. Singkatnya, regresi linier digunakan untuk regresi sedangkan regresi logistik digunakan untuk klasifikasi.

Referensi:

1. Analisis Regresi Linier | Regresi Linier dengan Python | Algoritma Pembelajaran Mesin | Simplilearn, 26 Maret 2018,