Dengan memecah masalah yang sulit diselesaikan menjadi bagian-bagian yang lebih kecil, teknik pembelajaran mendalam mengidentifikasi area optimal untuk mengurangi lalu lintas di gudang.
Ratusan robot berjalan bolak-balik melintasi lantai gudang robot raksasa, mengambil barang dan mengirimkannya ke pekerja manusia untuk dikemas dan dikirim. Gudang seperti ini semakin menjadi bagian dari rantai pasokan di banyak industri, mulai dari e-commerce hingga produksi otomotif.
Namun, membawa 800 robot ke dan dari tujuan mereka secara efisien sambil menjaga mereka agar tidak saling bertabrakan bukanlah tugas yang mudah. Ini adalah masalah yang sangat kompleks sehingga bahkan algoritma pencarian jalur terbaik pun kesulitan untuk mengimbangi laju e-commerce atau manufaktur yang sangat pesat.
Dalam arti tertentu, robot-robot ini seperti mobil yang mencoba menavigasi pusat kota yang padat. Jadi, sekelompok DENGAN peneliti yang menggunakan AI untuk mengurangi kemacetan lalu lintas menerapkan ide dari domain tersebut untuk mengatasi masalah ini.
Mereka membangun model pembelajaran mendalam yang mengkodekan informasi penting tentang gudang, termasuk robot, jalur yang direncanakan, tugas, dan hambatan, dan menggunakannya untuk memprediksi area terbaik di gudang yang akan dikurangi kemacetannya guna meningkatkan efisiensi secara keseluruhan.
Teknik mereka membagi robot gudang menjadi beberapa kelompok, sehingga kelompok robot yang lebih kecil ini dapat diatasi lebih cepat dengan algoritma tradisional yang digunakan untuk mengoordinasikan robot. Pada akhirnya, metode mereka menghilangkan kemacetan robot hampir empat kali lebih cepat dibandingkan metode pencarian acak yang kuat.
Selain menyederhanakan operasional gudang, pendekatan pembelajaran mendalam ini dapat digunakan dalam tugas perencanaan kompleks lainnya, seperti desain chip komputer atau perutean pipa di gedung-gedung besar.
“Kami merancang arsitektur jaringan saraf baru yang benar-benar cocok untuk operasi real-time pada skala dan kompleksitas gudang-gudang ini. Teknologi ini dapat mengkodekan ratusan robot dalam hal lintasan, asal, tujuan, dan hubungannya dengan robot lain, dan dapat melakukan hal ini dengan cara yang efisien dengan menggunakan kembali komputasi antar kelompok robot,” kata Cathy Wu, Gilbert W. Winslow Career. Asisten Profesor Pengembangan Teknik Sipil dan Lingkungan (CEE), dan anggota Laboratorium Sistem Informasi dan Keputusan (LIDS) dan Institut Data, Sistem, dan Masyarakat (IDSS).
Wu, penulis senior makalah tentang teknik ini, bergabung dengan penulis utama Zhongxia Yan, seorang mahasiswa pascasarjana di bidang teknik elektro dan ilmu komputer. Karya ini akan dipresentasikan pada Konferensi Internasional tentang Representasi Pembelajaran.
Dari sudut pandang luas, lantai gudang robot e-commerce terlihat seperti permainan “Tetris” yang bergerak cepat.
Ketika pesanan pelanggan masuk, robot berjalan ke area gudang, mengambil rak yang menyimpan barang yang diminta, dan mengirimkannya ke operator manusia yang mengambil dan mengemas barang tersebut. Ratusan robot melakukan ini secara bersamaan, dan jika jalur dua robot bertentangan saat melintasi gudang besar, mereka mungkin akan bertabrakan.
Algoritme berbasis penelusuran tradisional menghindari potensi kerusakan dengan menjaga satu robot tetap pada jalurnya dan merencanakan ulang lintasan untuk robot lainnya. Namun dengan banyaknya robot dan potensi tabrakan, masalahnya dengan cepat bertambah secara eksponensial.
“Karena gudang beroperasi secara online, robot-robot tersebut direncanakan ulang setiap 100 milidetik. Artinya setiap detik, sebuah robot direncanakan ulang sebanyak 10 kali. Jadi, operasi ini harus dilakukan dengan sangat cepat,” kata Wu.
Karena waktu sangat penting selama perencanaan ulang, para peneliti MIT menggunakannya pembelajaran mesin untuk memfokuskan perencanaan ulang pada area kemacetan yang paling dapat ditindaklanjuti – di mana terdapat potensi paling besar untuk mengurangi total waktu perjalanan robot.
Wu dan Yan membangun arsitektur jaringan saraf yang mempertimbangkan kelompok robot yang lebih kecil secara bersamaan. Misalnya, di gudang dengan 800 robot, jaringan mungkin membagi lantai gudang menjadi kelompok-kelompok kecil yang masing-masing berisi 40 robot.
Kemudian, ia memprediksi kelompok mana yang paling berpotensi meningkatkan solusi keseluruhan jika pemecah berbasis pencarian digunakan untuk mengoordinasikan lintasan robot dalam kelompok tersebut.
Sebuah proses berulang, keseluruhan algoritme memilih grup robot yang paling menjanjikan dengan jaringan saraf, menghilangkan kemacetan grup dengan pemecah berbasis pencarian, lalu memilih grup paling menjanjikan berikutnya dengan jaringan saraf, dan seterusnya.
Jaringan saraf dapat mempertimbangkan kelompok robot secara efisien karena menangkap hubungan rumit yang ada di antara masing-masing robot. Misalnya, meskipun satu robot mungkin berada jauh dari robot lain pada awalnya, jalur mereka masih bisa bersilangan selama perjalanan.
Teknik ini juga menyederhanakan komputasi dengan mengkodekan batasan hanya sekali, daripada mengulangi proses untuk setiap submasalah. Misalnya, di gudang dengan 800 robot, untuk menghilangkan kemacetan pada sekelompok 40 robot, diperlukan 760 robot lainnya sebagai pembatas. Pendekatan lain memerlukan penalaran tentang 800 robot satu kali per grup dalam setiap iterasi.
Sebaliknya, pendekatan para peneliti hanya memerlukan penalaran tentang 800 robot sekali di seluruh kelompok dalam setiap iterasi.
“Gudang adalah sebuah tempat yang besar, sehingga banyak dari kelompok robot ini akan memiliki beberapa aspek yang sama dalam mengatasi masalah yang lebih besar. Kami merancang arsitektur kami untuk memanfaatkan informasi umum ini,” tambahnya.
Mereka menguji teknik mereka di beberapa lingkungan simulasi, termasuk beberapa pengaturan seperti gudang, beberapa dengan rintangan acak, dan bahkan pengaturan seperti labirin yang meniru interior bangunan.
Dengan mengidentifikasi kelompok-kelompok yang lebih efektif untuk mengatasi kemacetan, pendekatan berbasis pembelajaran mereka dapat menghilangkan kemacetan hingga empat kali lebih cepat dibandingkan pendekatan kuat yang tidak berbasis pembelajaran. Bahkan ketika mereka memperhitungkan biaya komputasi tambahan dalam menjalankan jaringan saraf, pendekatan mereka masih memecahkan masalah 3,5 kali lebih cepat.
Di masa depan, para peneliti ingin mendapatkan wawasan sederhana dan berbasis aturan dari model saraf mereka, karena keputusan jaringan saraf bisa jadi tidak jelas dan sulit untuk diinterpretasikan. Metode yang lebih sederhana dan berbasis aturan juga bisa lebih mudah diterapkan dan dipelihara dalam pengaturan gudang robotik yang sebenarnya.
“Pendekatan ini didasarkan pada arsitektur baru di mana mekanisme konvolusi dan perhatian berinteraksi secara efektif dan efisien. Yang mengesankan, hal ini mengarah pada kemampuan untuk memperhitungkan komponen spatiotemporal dari jalur yang dibangun tanpa memerlukan rekayasa fitur khusus masalah. Hasilnya luar biasa: Tidak hanya dimungkinkan untuk meningkatkan metode pencarian lingkungan besar yang canggih dalam hal kualitas solusi dan kecepatan, namun model ini dapat menggeneralisasi kasus-kasus yang tidak terlihat dengan sangat baik,” kata Andrea Lodi, Andrew H. dan Ann R. Tisch Profesor di Cornell Tech, dan yang tidak terlibat dalam penelitian ini.
Referensi: Pencarian Lingkungan Neural untuk Pencarian Jalur Multi-Agen
Pekerjaan ini didukung oleh Amazon dan MIT Amazon Science Hub.
RisalahPos.com Network