Supervised Learning dan Unsupervised Learning
1. Supervised Learning
Supervised learning adalah salah satu pendekatan dalam pembelajaran mesin (machine learning) yang menggunakan data berlabel untuk melatih algoritma. Tujuannya adalah untuk membuat model yang dapat memprediksi hasil dan mengenali pola.
Supervised learning memiliki beberapa karakteristik, yaitu:
2. Algoritma mempelajari hubungan antara input dan output.
3. Hasil prediksi yang akurat karena adanya label/kelas yang sudah ditentukan.
4. Tujuan prediksi yang jelas dan terdefinisi.
Supervised learning banyak digunakan dalam berbagai industri dan bidang, seperti layanan kesehatan, pemasaran, jasa keuangan, dan lainnya. Beberapa contoh penggunaan supervised learning adalah:
2. Memilah email mana yang termasuk spam dan mana yang bukan.
3. Menemukan, memilah, dan mengategorikan gambar dari objek.
Jenis-jenis supervised learning :
Supervised learning dalam machine learning umumnya dibagi menjadi dua kategori: klasifikasi dan regresi.
1. Klasifikasi
Algoritma klasifikasi digunakan untuk mengelompokkan data dengan memprediksi label berkategori atau variabel output berdasarkan data input. Klasifikasi digunakan ketika variabel output bersifat kategoris, artinya memiliki dua kelas atau lebih.
Salah satu contoh paling umum penggunaan algoritma klasifikasi adalah filter spam di kotak masuk email Anda. Dalam kasus ini, model supervised learning dilatih untuk memprediksi apakah suatu email termasuk spam atau bukan dengan set data yang berisi contoh email spam dan email yang sah. Algoritma mengekstrak informasi tentang setiap email, termasuk pengirim, baris subjek, teks email, dan lainnya. Algoritma kemudian menggunakan semua informasi tersebut dan label output yang sesuai untuk mempelajari pola dan menetapkan skor yang menunjukkan apakah suatu email dianggap sah atau spam.
2. Regresi
Algoritma regresi digunakan untuk memprediksi nilai nyata atau kontinu, yang berarti algoritma mendeteksi hubungan antara dua variabel atau lebih.
Contoh umum dari tugas regresi adalah memprediksi gaji berdasarkan pengalaman kerja. Misalnya, algoritma supervised learning akan diberi input terkait pengalaman kerja (misalnya, lama bekerja, industri atau bidang, lokasi, dll.) dan jumlah gaji yang sesuai. Setelah dilatih, model tersebut dapat digunakan untuk memprediksi gaji rata-rata berdasarkan pengalaman kerja.
2. unsupervised Learning
Unsupervised learning adalah metode machine learning yang belajar dari data tanpa pengawasan manusia. Dalam unsupervised learning, algoritma machine learning diberi data yang tidak berlabel dan dibiarkan untuk menemukan pola dan hubungan dalam data.
Unsupervised learning berbeda dengan supervised learning yang menggunakan data pelatihan berlabel. Dalam supervised learning, model belajar dari contoh-contoh yang diberikan oleh guru, yaitu data yang sudah dilabeli dengan benar.
Unsupervised learning memiliki banyak aplikasi, di antaranya:
2. Deteksi anomaly, yaitu menemukan data yang tidak biasa dalam dataset secara otomatis. Contohnya, menemukan transaksi penipuan atau bagian hardware yang salah.
3. Sistem rekomendasi, yaitu memprediksi item yang sesuai dengan minat pengguna saat berbelanja.
4. Identifikasi email spam, yaitu mengelompokkan email-email yang diduga spam ke dalam folder.
5. Pencitraan medis, yaitu klasifikasi, deteksi gambar, dan segmentasi untuk mendiagnosis pasien secara cepat dan akurat.
Jenis-jenis unsupervised learning :
1. K-Means
K-Means Clustering adalah suatu metode penganalisaan data atau metode algoritma unsupervised yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan salah satu metode yang melakukan pengelompokan data dengan sistem partisi. Tujuan dari algoritma clustering K-Means adalah untuk mempartisi n pengamatan dalam data menjadi k cluster sehingga setiap pengamatan termasuk dalam cluster dengan mean terdekat. Ini berfungsi sebagai prototipe cluster.
Metode K-Means clustering mencoba untuk mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang berbeda. Dengan maksud metode ini bertujuan untuk meminimalisir variasi antar data yang ada dalam satu cluster dan memaksimalkan variasi data yang berada dalam cluster yang berbeda.
2. Hierarchical Clustering
Hierarchical Clustering adalah metode analisis kelompok yang berusaha untuk membentuk sebuah hirarki kelompok data dengan berdasarkan tingkatan tertentu sehingga menyerupai struktur pohon. Dengan demikian proses pengelompokannya dilakukan secara bertingkat atau bertahap. Pada umumnya, algoritma ini digunakan pada data yang jumlahnya tidak terlalu banyak dan jumlah cluster yang akan dibentuk belum diketahui.
Strategi Hierarchical Clustering terdiri dari 2 jenis strategi yaitu Agglomerative (Bottom-Up) dan Divisive (Top-Down). Agglomerative atau metode penggabungan adalah strategi pengelompokan hirarki yang dimulai dengan setiap objek dalam satu cluster yang terpisah kemudian membentuk cluster yang semakin membesar. Sehingga banyaknya cluster awal adalah sama dengan banyaknya objek. Berbeda dengan Divisive atau metode pembagian adalah strategi pengelompokan hirarki yang dimulai dari semua objek dikelompokkan menjadi cluster tunggal kemudian dipisah hingga setiap objek berada dalam cluster yang terpisah.
3. DBSCAN
Algoritma Density-based Spatial Clustering of Application with Noise (DBSCAN) merupakan metode clustering yang berbasis kepadatan atau density-based berdasarkan posisi data dengan prinsip mengelompokkan data yang relatif berdekatan. Metode ini mengelompokkan titik-titik yang diberikan dalam ruang dan menandai pencilan di wilayah dengan kepadatan rendah. DBSCAN sering diterapkan pada data yang banyak mengandung noise, hal ini dikarenakan DBSCAN tidak akan memasukkan data yang dianggap noise kedalam cluster manapun.

0 Response to "Supervised Learning dan Unsupervised Learning"
Posting Komentar