Pengertian YOLO (You only look once) Dan Contohnya, Lengkap! - Carakubisa
YOLO (You Only Look Once) menggunakan pembelajaran yang mendalam dan jaringan saraf convolutional (CNN) untuk deteksi objek, itu menonjol dari "pesaing" karena, seperti namanya menunjukkan itu hanya perlu "melihat" setiap gambar sekali. Ini memungkinkan YOLO menjadi salah satu algoritma deteksi tercepat (secara alami mengorbankan keakuratan). Berkat kecepatan ini, YOLO dapat mendeteksi objek dalam waktu nyata (hingga 30 FPS).





Untuk melakukan deteksi, gambar dibagi dalam kisi SxS (gambar kiri). Masing-masing sel akan memprediksi N kemungkinan "kotak pembatas" dan tingkat kepastian (atau probabilitas) masing-masing dari mereka (gambar di tengah), ini berarti kotak SxSxN dihitung. Sebagian besar dari kotak-kotak ini akan memiliki probabilitas yang sangat rendah, itulah sebabnya algoritma melanjutkan untuk menghapus kotak-kotak yang berada di bawah ambang batas probabilitas minimum tertentu. Kotak yang tersisa dilewatkan melalui "penindasan non-max" yang akan menghilangkan kemungkinan objek duplikat dan dengan demikian hanya meninggalkan yang paling tepat dari mereka (gambar di sebelah kanan).
Proses Iterasi Object Detection
Proese diatas merupakan proses komputasi rumit yang dilakukan oleh mesin atau komputer,proses ini sangat memakan kinerja GPU/CPU pengguna pada saat proses learning.

Algoritma YOLO

Ada beberapa algoritma berbeda untuk deteksi objek dan mereka dapat dibagi menjadi dua kelompok:

  1. Algoritma berdasarkan klasifikasi - mereka bekerja dalam dua tahap. Pada langkah pertama, kami memilih dari wilayah gambar yang menarik. Kemudian kami mengklasifikasikan wilayah tersebut menggunakan jaringan saraf convolutional. Solusi ini bisa sangat lambat karena kami harus menjalankan prediksi untuk setiap wilayah yang dipilih. Contoh paling dikenal dari jenis algoritma ini adalah jaringan saraf convolutional berbasis Wilayah (RCNN) dan sepupunya Fast-RCNN dan Faster-RCNN.
  2. Algoritma yang didasarkan pada regresi - alih-alih memilih bagian yang menarik dari suatu gambar, kami memprediksi kelas dan kotak pembatas untuk keseluruhan gambar dalam satu menjalankan algoritma. Contoh algoritma yang paling dikenal adalah YOLO (Anda hanya terlihat sekali) yang biasa digunakan untuk deteksi objek waktu-nyata (Real Time).
Sebelum kita masuk ke detail YOLO, kita harus tahu apa yang akan kita prediksi. Tugas kita adalah memprediksi kelas suatu objek dan kotak pembatas yang menentukan lokasi objek. Setiap kotak pembatas dapat dideskripsikan menggunakan empat deskriptor:
  •     center of a bounding box (bx by)
  •     width (bw)
  •     height (bh)
  •     value c is corresponding to a class of an object (f.e. car, traffic lights,…).

Seperti yang saya katakan sebelumnya dengan algoritma YOLO, kami tidak mencari daerah yang tertarik pada gambar kami yang dapat berisi beberapa objek. Alih-alih itu kita membagi gambar kita menjadi sel, biasanya grid 19x19. Setiap sel akan bertanggung jawab untuk memprediksi 5 kotak pembatas (kalau-kalau ada lebih dari satu objek di sel ini). Ini akan memberi kita 1805 kotak pembatas untuk gambar dan itu adalah jumlah yang sangat besar!

Sebagian besar sel dan kotak itu tidak akan memiliki objek di dalam dan ini adalah alasan mengapa kita perlu memprediksi pc. Pada langkah berikutnya, kami menghapus kotak dengan probabilitas objek rendah dan mengikat kotak dengan area bersama tertinggi dalam proses yang disebut penindasan non-maks.


Setelah itu ,barulah object terdeteksi sempurna,tapi ingat gunakanlah produk camera terbaik supaya hasil berjalan dengan lancar.

Sekian penjelasan tentang YOLO ,semoga bermanfaat.




Referensi :
1. https://github.com/pjreddie/darknet/wiki/YOLO:-Real-Time-Object-Detection
2. https://pjreddie.com/darknet/yolo/
3. https://appsilon.com/object-detection-yolo-algorithm/

Pengertian YOLO (You only look once) Dan Contohnya, Lengkap!

YOLO (You Only Look Once) menggunakan pembelajaran yang mendalam dan jaringan saraf convolutional (CNN) untuk deteksi objek, itu menonjol dari "pesaing" karena, seperti namanya menunjukkan itu hanya perlu "melihat" setiap gambar sekali. Ini memungkinkan YOLO menjadi salah satu algoritma deteksi tercepat (secara alami mengorbankan keakuratan). Berkat kecepatan ini, YOLO dapat mendeteksi objek dalam waktu nyata (hingga 30 FPS).





Untuk melakukan deteksi, gambar dibagi dalam kisi SxS (gambar kiri). Masing-masing sel akan memprediksi N kemungkinan "kotak pembatas" dan tingkat kepastian (atau probabilitas) masing-masing dari mereka (gambar di tengah), ini berarti kotak SxSxN dihitung. Sebagian besar dari kotak-kotak ini akan memiliki probabilitas yang sangat rendah, itulah sebabnya algoritma melanjutkan untuk menghapus kotak-kotak yang berada di bawah ambang batas probabilitas minimum tertentu. Kotak yang tersisa dilewatkan melalui "penindasan non-max" yang akan menghilangkan kemungkinan objek duplikat dan dengan demikian hanya meninggalkan yang paling tepat dari mereka (gambar di sebelah kanan).
Proses Iterasi Object Detection
Proese diatas merupakan proses komputasi rumit yang dilakukan oleh mesin atau komputer,proses ini sangat memakan kinerja GPU/CPU pengguna pada saat proses learning.

Algoritma YOLO

Ada beberapa algoritma berbeda untuk deteksi objek dan mereka dapat dibagi menjadi dua kelompok:

  1. Algoritma berdasarkan klasifikasi - mereka bekerja dalam dua tahap. Pada langkah pertama, kami memilih dari wilayah gambar yang menarik. Kemudian kami mengklasifikasikan wilayah tersebut menggunakan jaringan saraf convolutional. Solusi ini bisa sangat lambat karena kami harus menjalankan prediksi untuk setiap wilayah yang dipilih. Contoh paling dikenal dari jenis algoritma ini adalah jaringan saraf convolutional berbasis Wilayah (RCNN) dan sepupunya Fast-RCNN dan Faster-RCNN.
  2. Algoritma yang didasarkan pada regresi - alih-alih memilih bagian yang menarik dari suatu gambar, kami memprediksi kelas dan kotak pembatas untuk keseluruhan gambar dalam satu menjalankan algoritma. Contoh algoritma yang paling dikenal adalah YOLO (Anda hanya terlihat sekali) yang biasa digunakan untuk deteksi objek waktu-nyata (Real Time).
Sebelum kita masuk ke detail YOLO, kita harus tahu apa yang akan kita prediksi. Tugas kita adalah memprediksi kelas suatu objek dan kotak pembatas yang menentukan lokasi objek. Setiap kotak pembatas dapat dideskripsikan menggunakan empat deskriptor:
  •     center of a bounding box (bx by)
  •     width (bw)
  •     height (bh)
  •     value c is corresponding to a class of an object (f.e. car, traffic lights,…).

Seperti yang saya katakan sebelumnya dengan algoritma YOLO, kami tidak mencari daerah yang tertarik pada gambar kami yang dapat berisi beberapa objek. Alih-alih itu kita membagi gambar kita menjadi sel, biasanya grid 19x19. Setiap sel akan bertanggung jawab untuk memprediksi 5 kotak pembatas (kalau-kalau ada lebih dari satu objek di sel ini). Ini akan memberi kita 1805 kotak pembatas untuk gambar dan itu adalah jumlah yang sangat besar!

Sebagian besar sel dan kotak itu tidak akan memiliki objek di dalam dan ini adalah alasan mengapa kita perlu memprediksi pc. Pada langkah berikutnya, kami menghapus kotak dengan probabilitas objek rendah dan mengikat kotak dengan area bersama tertinggi dalam proses yang disebut penindasan non-maks.


Setelah itu ,barulah object terdeteksi sempurna,tapi ingat gunakanlah produk camera terbaik supaya hasil berjalan dengan lancar.

Sekian penjelasan tentang YOLO ,semoga bermanfaat.




Referensi :
1. https://github.com/pjreddie/darknet/wiki/YOLO:-Real-Time-Object-Detection
2. https://pjreddie.com/darknet/yolo/
3. https://appsilon.com/object-detection-yolo-algorithm/
Load Comments

Subscribe Our Newsletter

Notifications

Disqus Logo