Sanditya Larope Sutanto
Abstrak :
Skripsi ini mengatasi tantangan pelatihan agen Deep Reinforcement Learning (DRL) untuk mengemudi otonom dengan mengembangkan filter keselamatan prediktif berbasis model untuk mencapai pelatihan yang aman. Efektivitas pendekatan ini dievaluasi melalui analisis komparatif dari masalah mengemudi otonom yang diselesaikan menggunakan tiga skenario implementasi yang berbeda: pengendali berbasis pembelajaran konvensional, pengendali berbasis pembelajaran dengan filter keselamatan prediktif, dan pengendali prediktif berbasis model. Tujuan utama dari masalah mengemudi optimal dalam penelitian ini adalah meminimalkan waktu putaran pada lintasan tertutup, di mana agen tidak dibatasi oleh lintasan yang telah ditentukan tetapi dibatasi oleh batas lintasan. Oleh karena itu, filter keselamatan prediktif bertujuan untuk mempertahankan posisi agen dalam batas lintasan selama pelatihan, dengan intervensi minimal. Penelitian ini menyediakan desain dan implementasi dari pengendali prediktif berbasis model, pengendali berbasis pembelajaran konvensional, dan pengendali berbasis pembelajaran dengan filter keselamatan prediktif untuk masalah mengemudi optimal. Ditemukan bahwa filter keselamatan secara efektif mengurangi potensi kerusakan perangkat keras akibat tabrakan selama pelatihan dan meningkatkan efisiensi sampel. Dari segi kinerja, pengendali dengan filter keselamatan mencapai waktu putaran yang lebih cepat dibandingkan pengendali prediktif berbasis model, tetapi sedikit lebih lambat dibandingkan pengendali berbasis pembelajaran konvensional, terutama karena pendekatannya yang konservatif terhadap tikungan akibat penggunaan filter keselamatan prediktif berbasis model.
......This thesis addresses the challenge of training Deep Reinforcement Learning (DRL) agents for autonomous driving with an emphasis on optimal performance and safety. The primary objective is to develop a model-based predictive safety filter to achieve safe training. The effectiveness of this approach is evaluated through a comparative analysis of an autonomous driving problem solved using three distinct implementation scenarios: a conventional learning-based controller, a learning-based controller with a predictive safety filter, and a model predictive controller. The core goal of the optimal driving problem in this research is to minimize lap times on a closed-loop track, where the agent is not restricted to predefined trajectories but is constrained by track boundaries. Consequently, the predictive safety filter aims to maintain the agent’s position within track boundaries throughout training, with minimal intervention This research provides implementation of a model predictive controller, a conventional learning-based controller, and a learning-based controller with a predictive safety filter for optimal driving problems. The findings reveal that the safety filter effectively reduces potential hardware damage from crashes during training and increases sample efficiency. Performance-wise, the safety filter-equipped controller achieves faster lap times than the traditional model predictive controller but is marginally slower than the conventional learning-based controller, primarily due to its conservative approach to turns because of using the model-based predictive safety filter.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership Universitas Indonesia Library