Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query
cover
Aidan Azkafaro Deson
Abstrak :
Di dalam olahraga tenis, pemahaman yang mendalam tentang gerakan lawan sangat penting untuk merespons pukulan dengan efektif. Salah satu tantangan utama yang dihadapi pemain adalah mengantisipasi arah pukulan lawan dengan cepat dan akurat. Faktor utama yang memengaruhi arah pukulan bola tenis adalah sudut kontak bola dengan raket saat memukulnya. Namun, dalam kecepatan permainan yang tinggi, observasi terhadap faktor ini sulit dilakukan. Faktor lain yang dapat memengaruhi arah pukulan adalah pose pemain saat memukul bola. Penelitian ini bertujuan untuk mengevaluasi penerapan machine learning dalam mengatasi masalah ini, dengan menggunakan informasi sekuensial mengenai pergerakan pose pemain sesaat sebelum memukul bola dan meneruskannya ke jaringan neural network untuk klasifikasi arah pukulannya menjadi tiga jenis kelas, yaitu Cross Left, Cross Right, dan Straight. Dataset yang digunakan untuk penelitian ini diambil dari beberapa video pertandingan tenis profesional dari platform YouTube dengan total durasi permainan efektif 43 menit. Untuk mendapatkan informasi mengenai koordinat pose pemain, digunakan YOLOv8-Pose, sementara TrackNet digunakan untuk mendeteksi koordinat bola dan lapangan. Arah pukulan bola ditentukan dari informasi koordinat bola sebelum dan setelah pemain melakukan pukulan. Informasi pose pemain sebanyak 20 frame sebelum pemain memukul bola disimpan dalam suatu array tiga dimensi dan digunakan sebagai input untuk jaringan neural network. Penelitian ini menguji dua jenis neural network, yaitu RNN dan LSTM, dan dilakukan tuning hingga diperoleh performa terbaik pada kedua model tersebut. Model RNN mencapai akurasi sebesar 74%, sedangkan model LSTM mencapai akurasi sebesar 79%. Untuk meningkatkan performa model, diterapkan class weighting agar model memberikan perhatian yang lebih adil terhadap setiap kelas. Hasilnya, akurasi model RNN meningkat menjadi 80% dan akurasi model LSTM meningkat menjadi 82%. ......In the sport of tennis, a deep understanding of the opponent's movements is crucial for effectively responding to their shots. One of the main challenges players face is anticipating the direction of their opponent's shots quickly and accurately. The primary factor influencing the direction of a tennis ball's shot is the angle at which the ball contacts the racket. However, observing this factor is difficult in the high-speed context of the game. Another factor that can influence the shot's direction is the player's pose at the moment of impact. This study aims to evaluate the application of machine learning in addressing this issue by using sequential information about the player's pose movements just before hitting the ball and feeding it into a neural network for shot direction classification into three categories: Cross Left, Cross Right, and Straight. The dataset used for this study was obtained from several professional tennis match videos on YouTube, with a total effective gameplay duration of 43 minutes. To obtain information about the player's pose coordinates, YOLOv8-Pose was used, while TrackNet was used to detect the coordinates of the ball and the court. The shot direction was determined from the ball's coordinates before and after the player made contact. The player's pose information, consisting of 20 frames before hitting the ball, was stored in a three-dimensional array and used as input for the neural network. This study tested two types of neural networks, RNN and LSTM, and tuning was performed to obtain the best-performing models for both. The RNN model achieved an accuracy of 74%, while the LSTM model achieved an accuracy of 79%. To improve model performance, class weighting was applied to ensure the model gave fair attention to each class. As a result, the accuracy of the RNN model increased to 80%, and the accuracy of the LSTM model increased to 82%.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Irvan JP Elliika
Abstrak :
Secara umum, mobile robot merupakan salah satu tipe platform robot yang memiliki tugas yang kompleks karena robot tersebut akan berada pada lingkungan yang juga bersifat kompleks. Secara khusus, mobile robot harus bisa melakukan lokalisasi agar bisa melakukan tugas-tugas pokok selanjutnya. Oleh karenanya diperlukan sistem lokalisasi yang bisa menyelesaikan permasalahan tersebut. Sistem vision merupakan salah satu jawaban yang paling mungkin untuk menyelesaikan masalah pada platform mobile robot. Beranjak dari hasil penelitian sebelumnya mengenai lokalisasi pada map topologi, maka pada penelitian ini akan dikembangkan sistem lokalisasi berbasis map metric dimana nantinya akan didapatkan pose xr,yr,?r dari mobile robot. Untuk menyelesaikan sistem lokalisasi ini akan digunakan metode pose estimation oleh stereovision untuk mendapatkan pose dalam bentuk translasi x,y,z dan rotasi ?, ?, ? yang akan dimaksimalkan dengan penggunaan FAST sebagai algoritma fitur detection dengan kecepatan tinggi. Akhirnya dengan proses integrasi dengan penelitian sebelumnya akan didapatkan global position yang berguna untuk lokalisasi mobile robot. ......Generally, mobile robot is one of robot that has a complex task because the robot will also work in the complex environment. Particularly, service robot should be able to do localization in order to continue its task. Therefore it will need a localization system that could solve the problem. Vision system is one of the most likely answer to solve the problem in mobile robot platform. Based from the results of previous work on the localization of the topological map, this work will developed localization system for building metrics map which will obtain pose in term of xr, yr, ?r of the mobile robot. In order to complete this localization system, pose estimation method base stereovision will be used to get translational pose x, y, z and rotation pose ?, ?, ? which will be maximized by the use of FAST as the high speed feature detection algorithms. Finally the integration process with prior work will obtain global position that is useful for mobile robot localization.
Depok: Fakultas Teknik Universitas Indonesia, 2013
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Randy Pangestu Kuswana
Abstrak :
ABSTRAK
Pose estimasi wajah atau head pose estimator merupakan salah satu dari parameter yang penting dalam proses identifikasi wajah dalam bentuk citra muka tiga dimensi. Dikarenakan performanya yang sangat baik, deep learning menggunakan jaringan saraf konvolusi sering digunakan sebagai estimator dari pose wajah. Namun dibalik performanya yang kuat, jaringan saraf konvolusi masih rentan terhadap derau sehingga menyebabkan performa akan turun secara signifikan. Selain itu, performa dari CNN juga tergantung pada kombinasi dari hyper-parameter yang dipilih. Pengembangan CNN yang pesat membuat dikembangkannya beberapa arsitektur dengan setiap arsitektur memiliki performanya tersendiri. Dalam penelitian ini akan dibuat dua jenis estimator pose kepala yang pertama menggunakan arsitektur modifikasi dari LeNet-5 dan yang kedua menggunakan arsitektur modifikasi dari AlexNet. Pada arsitektur LeNet-5 akan dilakukan percobaan terhadap berbagai hyper-parameter tipe pooling dan fungsi aktivasi, untuk mengetahui pengaruhnya terhadap derau gaussian, salt-pepper, dan speckle. Selain itu dua jenis estimator yang dibuat akan dibandingkan juga hasilnya untuk mengetahui performa dari Arsitektur AlexNet Modified yang dibuat terhadap citra dengan noise. Dari hasil percobaan didapatkan nilai performa AlexNet yang memiliki akurasi lebih bagus dibandingkan dengan LeNet-5, baik pada data dengan derau atau pada data tanpa derau.
ABSTRACT
Head pose estimation is one of the important parameter for determination of known face from its three dimensional face images. Due to its superiority, Convolutional Neural Network CNN has been used as a head pose estimator, and has been under a rapid growth in the recent years, with the growth resulting in many architecture were developed to solve a particular task. However, most of the CNN rsquo s performance were significantly dropped when the input face images was exposed to noises. In this research, we will develope two sistem with each of them using a different Architecture, LeNet 5 and AlexNet. Moreover, by using an LeNet 5 system that we built, we test the effect on hyper parameter choices of pooling layer and activation function. It is due, to understand the their effect on a gaussian noise, salt pepper, and speckle noise. After testing the hyper parameter effect on degraded image, we compare the performance of modified LeNet 5 and modified AlexNet. Result of the experiments shows that the modified AlexNet has a better performance on dealing with either normal or degraded images.
2018
T51433
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Adi Nugroho
Abstrak :
Pengolahan citra telah mengalami banyak perkembangan dan semakin umum diaplikasikan. Salah satu pengaplikasiannya rekognisi wajah tiga dimensi, yang juga melibatkan estimasi pose wajah. Salah satu metode rekognisi citra, yaitu jaringan saraf konvolusi, berpotensi menjadi dasar dari sistem estimasi pose wajah. Operasi konvolusi diharapkan mampu meminimalisir pengaruh distorsi dan disorientasi objek, serta mampu mengefisiensikan parameter yang dibutuhkan. Namun, permasalahan noise atau derau belum secara eksplisit terselesaikan oleh jaringan saraf tiruan konvolusi. Penelitian ini bertujuan memasukkan fitur sistem fuzzy yang efektif mengelola data samar ke dalam jaringan saraf tiruan konvolusi yang diaplikasikan untuk estimasi pose wajah. Perancangan dimulai dari menjabarkan fungsi masing-masing lapisan jaringan saraf tiruan, menjabarkan operasi-operasi aritmatika pada bilangan fuzzy, dan mencoba menggantikan neuron crisp pada jaringan saraf tiruan konvolusi umum menjadi neuron fuzzy, dan mengaplikasikannya untuk mengestimasi pose wajah. Sistem yang sudah dibangun kemudian diujicoba pada dataset yang dimiliki Departemen Teknik Elektro UI dan dibandingkan dengan CNN-crisp yang memiliki arsitektur serupa dengan parameter pembelajaran yang sama. Hasil didapat menunjukkan sistem konvolusi fuzzy mencapai nilai kesalahan estimasi pose lebih rendah dari konvolusi crisp pada data berderau tanpa merubah hasil estimasi pada data tidak berderau. ...... Image processing has undergone many developments and is increasingly commonly applied. From limited two-dimensional recogniton, facial recognition has now being developed to be able to recognise three-dimensional features. This ability involves process of face pose estimation. One method of image recognition, the convolution neural network, has the potential to become the basis of the face pose estimation system. Convolution operation is expected to minimize the effect of distortion and disorientation of the object, and able to efficiently reduce the required parameters. However, the image noise problem has not been explicitly resolved by convolution neural networks. This study aims to include features of a fuzzy system that effectively manages fuzzy data into convolutional neural networks applied to head pose estimation. The design begins with describing the function of each layer of artificial neural networks, describing arithmetic operations on fuzzy numbers, and attempting to replace crisp neurons in convolution layer of convolutional neural into fuzzy neurons, and applying them to estimate head poses. The estimator system is then tested on a dataset owned by the Department of Electrical Engineering UI and compared with CNN-crisp that has a similar architecture with the same learning parameters. The results show that the fuzzy convolution system reaches less error of pose estimation value compared to the crisp convolution system, without changing the estimation value of image without noises.
Depok: Fakultas Teknik Universitas Indonesia, 2017
T49040
UI - Tesis Membership  Universitas Indonesia Library