Penerapan komputasi Paralel pada aplikasi-aplikasi penting dan memakan waktu yang panjang memerlukan kemampuan fault-tolerance (anti gagal). Hal ini untuk menjamin kesinambungan program aplikasi yang sedang bedalan. Pada komputasi paralel sebuah program besar terbagi atas beberapa task (proses anak), sehingga apabila terjadi kegagalan proses terhadap sebuah task akan mengakibatkan kegagalan seluruh program aplikasi tersebut. Kegagalan bisa disebabkan hardware komputer, pendukung power, bahkan program aplikasi yang tidak stabil atau kurang baik dalam memanfaatkan sumber daya komputer, seperti memori atau disk. Metode fault-tolerance yang diterapkan pada Tugas Akhir ini adalah metode checkgointing secara periodik dan teknik recovery dengan rollback. Metoda ini memungkinkan suatu program yang gagal untuk dilakukan recovery pada suatu titik keadaan tanpa perlu mengulang proses dari awal sekali. Penyisipan interupsi checkpointing pada program aplikasi dapat menimbulkan penambahan beban waktu pada program tersebut. Untuk itu perlu diterapkan teknik checkpointing yang efektif yang tidak terlalu membebani unjuk kerja program aplikasi. Pada Tugas Akhir ini dibahas implementasi checkpointing dan rollback recovery pada dua macam teknik penjadwalan komputasi paralel menggunakan platform PVM. Recovery terhadap program yang mengalami kegagalan memerlukan metoda-metoda khusus tergantung program yang mengalami kegagalan tersebut.