Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 90 dokumen yang sesuai dengan query
cover
"This book highlights the state of the art and recent advances in Big Data clustering methods and their innovative applications in contemporary AI-driven systems. The book chapters discuss Deep Learning for Clustering, Blockchain data clustering, Cybersecurity applications such as insider threat detection, scalable distributed clustering methods for massive volumes of data; clustering Big Data Streams such as streams generated by the confluence of Internet of Things, digital and mobile health, human-robot interaction, and social networks; Spark-based Big Data clustering using Particle Swarm Optimization; and Tensor-based clustering for Web graphs, sensor streams, and social networks. The chapters in the book include a balanced coverage of big data clustering theory, methods, tools, frameworks, applications, representation, visualization, and clustering validation. "
Switzerland: Springer Nature, 2019
e20507207
eBooks  Universitas Indonesia Library
cover
Loshin, David, 1963-
"
ABSTRACT
Big Data Analytics" will assist managers in providing an overview of the drivers for introducing big data technology into the organization and for understanding the types of business problems best suited to big data analytics solutions, understanding the value drivers and benefits, strategic planning, developing a pilot, and eventually planning to integrate back into production within the enterprise.
"
Amsterdam: Morgan Kaufmann, 2013
658.472 LOS b
Buku Teks SO  Universitas Indonesia Library
cover
Ishmah Naqiyya
"Perkembangan teknologi informasi dan internet dalam berbagai sektor kehidupan menyebabkan terjadinya peningkatan pertumbuhan data di dunia. Pertumbuhan data yang berjumlah besar ini memunculkan istilah baru yaitu Big Data. Karakteristik yang membedakan Big Data dengan data konvensional biasa adalah bahwa Big Data memiliki karakteristik volume, velocity, variety, value, dan veracity. Kehadiran Big Data dimanfaatkan oleh berbagai pihak melalui Big Data Analytics, contohnya Pelaku Usaha untuk meningkatkan kegiatan usahanya dalam hal memberikan insight yang lebih luas dan dalam. Namun potensi yang diberikan oleh Big Data ini juga memiliki risiko penggunaan yaitu pelanggaran privasi dan data pribadi seseorang. Risiko ini tercermin dari kasus penyalahgunaan data pribadi Pengguna Facebook oleh Cambridge Analytica yang berkaitan dengan 87 juta data Pengguna. Oleh karena itu perlu diketahui ketentuan perlindungan privasi dan data pribadi di Indonesia dan yang diatur dalam General Data Protection Regulation (GDPR) dan diaplikasikan dalam Big Data Analytics, serta penyelesaian kasus Cambridge Analytica-Facebook. Penelitian ini menggunakan metode yuridis normatif yang bersumber dari studi kepustakaan. Dalam Penelitian ini ditemukan bahwa perlindungan privasi dan data pribadi di Indonesia masih bersifat parsial dan sektoral berbeda dengan GDPR yang telah mengatur secara khusus dalam satu ketentuan. Big Data Analytics juga memiliki beberapa implikasi dengan prinsip perlindungan privasi dan data pribadi yang berlaku. Indonesia disarankan untuk segera mengesahkan ketentuan perlindungan privasi dan data pribadi khusus yang sampai saat ini masih berupa rancangan undang-undang.

The development of information technology and the internet in various sectors of life has led to an increase in data growth in the world. This huge amount of data growth gave rise to a new term, Big Data. The characteristic that distinguishes Big Data from conventional data is that Big Data has the characteristic of volume, velocity, variety, value, and veracity. The presence of Big Data is utilized by various parties through Big Data Analytics, for example for Corporation to incurease their business activities in terms of providing broader and deeper insight. But this potential provided by Big Data also comes with risks, which is violation of one's privacy and personal data. One of the most scandalous case of abuse of personal data is Cambridge Analytica-Facebook relating to 87 millions user data. Therefor it is necessary to know the provisions of privacy and personal data protection in Indonesia and which are regulated in the General Data Protection (GDPR) and how it applied in Big Data Analytics, as well as the settlement of the Cambridge Analytica-Facebook case. This study uses normative juridical methods sourced from library studies. In this study, it was found that the protection of privacy and personal data in Indonesia is still partial and sectoral which is different from GDPR that has specifically regulated in one bill. Big Data Analytics also has several implications with applicable privacy and personal data protection principles. Indonesia is advised to immediately ratify the provisions on protection of privacy and personal data which is now is still in the form of a RUU."
Depok: Fakultas Hukum Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Febtriany
"Saat ini kompetisi di industri telekomunikasi semakin ketat. Perusahaan telekomunikasi yang dapat tetap menghasilkan banyak keuntungan yaitu perusahaan yang mampu menarik dan mempertahankan pelanggan di pasar yang sangat kompetitif dan semakin jenuh. Hal ini menyebabkan perubahan strategi banyak perusahaan telekomunikasi dari strategi 'growth '(ekspansi) menjadi 'value added services'. Oleh karena itu, program mempertahankan pelanggan ('customer retention') saat ini menjadi bagian penting dari strategi perusahaan telekomunikasi. Program tersebut diharapkan dapat menekan 'churn' 'rate 'atau tingkat perpindahan pelanggan ke layanan/produk yang disediakan oleh perusahaan kompetitor.
Program mempertahankan pelanggan ('customer retention') tersebut tentunya juga diimplementasikan oleh PT Telekomunikasi Indonesia, Tbk (Telkom) sebagai perusahaan telekomunikasi terbesar di Indonesia. Program tersebut diterapkan pada berbagai produk Telkom, salah satunya Indihome yang merupakan 'home services' berbasis 'subscriber' berupa layanan internet, telepon, dan TV interaktif. Melalui kajian ini, penulis akan menganalisa penyebab 'churn' pelanggan potensial produk Indihome tersebut, sehingga Telkom dapat meminimalisir angka 'churn' dengan melakukan program 'customer retention' melalui 'caring' yang tepat.
Mengingat ukuran 'database' pelanggan Indihome yang sangat besar, penulis akan menganalisis data pelanggan tersebut menggunakan metoda 'Big Data Analytics'. 'Big Data' merupakan salah satu metode pengelolaan data yang sangat besar dengan pemetaan dan 'processing' data. Melalui berbagai bentuk 'output', implementasi 'big data' pada perusahaan akan memberikan 'value' yang lebih baik dalam pengambilan keputusan berbasis data.

Nowadays, telecommunication industry is very competitive. Telecommunication companies that can make a lot of profit is the one who can attract and retain customers in this highly competitive and increasingly saturated market. This causes change of the strategy of telecommunication companies from growth strategy toward value added services. Therefore, customer retention program is becoming very important in telecommunication companies strategy. This program hopefully can reduce churn rate or loss of potential customers due to the shift of customers to other similar products.
Customer retention program also implemented by PT Telekomunikasi Indonesia, Tbk (Telkom) as the leading telecommunication company in Indonesia. Customer retention program implemented for many Telkom products, including Indihome, a home services based on subscriber which provide internet, phone, and interactive TV. Through this study, the authors will analyze the cause of churn potential customers Indihome product, so that Telkom can minimize the churn number by doing customer retention program through the efficient caring.
Given by huge customer database the author will analyze using Big Data analytics method. Big Data is one method in data management that contain huge data, by mapping and data processing. Through various forms of output, big data implementation on the organization will provide better value in data-based decision making.
"
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2018
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ferry Astika Saputra
"

Ancaman keamanan cyber berupa aktivitas Botnet merupakan salah satu ancaman berbahaya yang dihadapi oleh komunitas internet. Para peneliti telah mengusulkan sistem deteksi intrusi (IDS) yang bekerja dengan menggunakan algoritma machine learning sebagai solusi alternatif dari IDS yang menggunakan metode signature dan metode anomali untuk mendeteksi aktivitas Botnet.

Permasalahan yang dihadapi adalah sulitnya membedakan antara trafik normal dengan trafik Botnet. Perlu adanya pemilihan fitur dari data set jaringan sehingga trafik Botnet dapat dideteksi dengan akurat. Dalam penelitian ini diusulkan metode baru yang meningkatkan kinerja IDS dalam mendeteksi Botnet. Metode yang diusulkan adalah dengan menggabungkan dua metode statistik yaitu low variance filter yang dikombinasikan dengan Pearson Correlation Filter yang selanjutnya disebut dengan  Hybrid Pearson Correlation Filter (HPCF) untuk diterapkan dalam tahap  pemilihan fitur. Pemilihan fitur dengan metode yang diajukan yaitu HPCF (Hybrid Pearson Correlation Filter) terbukti dapat meningkatkan efektifitas dan efisiensi dari IDS. Efektivitas diukur dengan menggunakan metrik performasi. Dari hasil eksperimen offline maupun reatime detection, DT lebih unggul dari tujuh model ML lainnya. Model DT-15 merupakan kombinasi terbaik dengan performasi diatas 95% untuk offline detection, 99% untuk Real-time detection.

Pemilihan fitur juga berpengaruh terhadap efisiensi yang diukur dari waktu komputasi pembelajaran mode dan waktu komputasi deteksi di jaringan sebenarnya. Model DT-15 merupakan kombinasi terbaik dengan rata-rata waktu 6,3 detik untuk pembelajaran model (offline detection) and 350 detik untuk waktu deteksi di jaringan sebenarnya (Real-time detection).

Tantangan untuk membuat arsitektur IDS yang dapat beradaptasi dengan  tekonologi komputasi awan juga menjadi topik dalam penelitian ini. Perubahan dinamis dalam arsitektur komputasi awan membutuhkan kemudahan dan fleksibilitas didistribusikan dan dikonfigurasi, dan sarana transportasi data yang paling andal ke defense center. Selain itu teknologi komputasi awan secara signifikan meningkatkan volume, kecepatan, dan variasi data yang harus diproses di pusat pertahanan. Ini berarti bahwa defense center membutuhkan teknologi big data. Snort adalah sistem deteksi dan pencegahan intrusi jaringan berbasis signature yang populer dan berpengaruh di komunitas Internet. Kekurangan dari Snort adalah keterbatasannya dalam menempatkan sensor dengan defense center yang harus terhubung dalam satau sama lain dalam satu jaringan. Hal ini bertolak belangkang dengan kebutuhan dari teknologi komputasi awan. Pada penelitian ini digunakan referensi arsitektur lambda. Dalam pengembangannya arsitektur terbagi menjadi tiga bagian: data source, data collecting dan data serving. Untuk data source dikembangkan aplikasi docker yang didalamnya terdapat aplikasi Snort IDS. Sedangkan untuk collecting data ddigunakan protokol MQTT sebagai saluran pengirimannya. MQTT lebih unggul dalam kemampuan pengirimanya dengan message rate 12 kali lebih besar dan latensi 62 kali lebih rendah dibandingkan dengan protokol Kafka Pub/Sub. Secara keseluruhan penelitian menghasilkan arsitektur baru big data penerapan sistem deteksi intrusi jaringan berbasis Snort di lingkungan komputasi awan.  Aplikasi NIDS Snort yang dibangun dengan merujuk dari arsitektur yang telah dibangun dapat diakses di https://github.com/Mata-Elang-Stable/MataElang-Platform/wiki.


Cyber security threats in the form of botnet activities are one of the dangerous threats faced by the internet community. Researchers have proposed an intrusion detection system (IDS) that works using machine learning algorithms as an alternative solution to IDS that uses signature and anomaly methods to detect botnet activity.

The problem faced is the difficulty of distinguishing between normal traffic and Botnet traffic. There needs to be a selection feature from the network data set to detect Botnet traffic accurately. This study proposes a new method to improve IDS performance in detecting botnets. The proposed method combines two statistical methods, namely the low variance filter and the Pearson Correlation Filter, referred to as the Hybrid Pearson Correlation Filter (HPCF), to be applied in the feature selection stage. Feature selection with the proposed method, namely HPCF (Hybrid Pearson Correlation Filter), is proven to increase the effectiveness and efficiency of IDS. Effectiveness is measured using performance metrics. From the results of offline and real-time detection experiments, DT is superior to the other seven ML models. The DT-15 model is the best combination, with over 95% performance for offline detection and 99% for real-time detection.

The selection of features also affects the efficiency measured by the computational time of mode learning and the computational time of detection in the real network. The DT-15 model is the best combination, with an average time of 6.3 seconds for the learning model (offline detection) and 350 seconds for detecting in the real network (real-time detection).

Developing an IDS architecture that can adapt to cloud computing technology is also a topic in this research. Dynamic changes in cloud architecture require the flexibility of configuring and the most reliable means of data transportation for the defense center. In addition, cloud computing significantly increases the volume, speed, and variety of data that must be centralized in the defense center. So this means that the defense center needs big data technology. Snort is a signature-based network intrusion detection and prevention system that is popular and influential in the Internet community. The drawback of Snort is its limitation in placing sensors with central defenses that must be connected to a single network, which is contrary to the needs of cloud computing technology.

In this study,  we refer to lambda architecture, which consists of three parts: data source, data collecting and serving. A docker application for the data source is developed, including the Snort IDS application. Meanwhile, the MQTT protocol is used as the delivery channel for collecting data. MQTT is superior in its delivery capabilities, with a message rate of 12 times more significant and latency 62 times lower than the Kafka Pub/Sub protocol. Overall, the research resulted in a new big data architecture for implementing a Snort-based network intrusion detection system in a cloud computing environment. Our proposed design and implementation can be accessed at https://github.com/Mata-Elang-Stable/MataElang-Platform/wiki.

"
Depok: Fakultas Teknik Universitas Indonesia, 2022
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Mugi Ayomi
"ABSTRAK

Semakin strategisnya peran Direktorat Jenderal Bea dan Cukai (DJBC) Kementerian Keuangan Republik Indonesia dalam memfasilitasi perdagangan internasional membuat DJBC harus terus berinovasi dengan memanfaatkan teknologi mutakhir. DJBC dituntut untuk memberikan pelayanan yang efisien dan melakukan pengawasan yang efektif yang merujuk pada praktik-praktik terbaik dalam kepabeanan internasional. Implementasi Big Data pada DJBC bertujuan untuk mendapatkan manfaat dari data yang telah dikumpulkan agar dapat dianalisis untuk mendukung pengambilan keputusan. Konsep Smart Customs and Excise mengusung Big Data sebagai inti dari semua sistem dan proses bisnis pada DJBC, namun sampai dengan saat ini penerapan Big Data masih bersifat proof of concept. Penerapan teknologi baru tanpa adanya arah pengembangan yang jelas memiliki risiko kegagalan, untuk itu diperlukan evaluasi penerapan Big Data di DJBC. Pengukuran tingkat kematangan Big Data dapat digunakan sebagai langkah awal untuk menilai situasi yang sebenarnya dari sebuah organisasi, memperoleh dan memprioritaskan langkah-langkah perbaikan dan kemudian mengontrol setiap tahap pelaksanaannya. Hasil pengukuran kematangan Big Data dapat dijadikan sebagai acuan untuk merumuskan saran dan rekomendasi bagi DJBC untuk mencapai tingkat kematangan yang lebih tinggi. Pengukuran dilakukan menggunakan framework TDWI Big Data Maturity Model untuk mengevaluasi implementasi Big Data pada DJBC. Pengumpulan data dilakukan melalui wawancara pertanyaan tertutup, kemudian diolah menggunakan assessment tools. Hasil evaluasi menunjukkan bahwa tingkat kematangan Big Data pada DJBC ada pada tingkat 3 (Early Adoption) dari skala 1 - 5. Hasil penelitian memberikan rekomendasi pada tiap dimensi untuk dapat meningkatkan tingkat kematangan ke tingkat 4 (Corporate Adoption) dengan prioritas perubahan mulai dimensi organisasi, analitis, manajemen data, infrastruktur, dan tata kelola.


ABSTRACT


The more strategic role of the Directorate General of Customs and Excise (DGCE) of the Ministry of Finance of Republic of Indonesia in facilitating international trade has made DGCE to continue to innovate by utilizing the latest technology. DGCE is required to provide efficient services and conduct effective supervision that refers to international customs organization best practices. Implementation of Big Data on DGCE aims to get the benefits of the data that has been collected so that it can be analyzed to support decision making. The Smart Customs and Excise concept brings Big Data as the core of all systems and business processes in DGCE, but until now the implementation of Big Data is still proof of concept. Implementation of new technology without the direction of development that clearly defined has the risk of failure, therefore an evaluation is needed regarding the implementation of Big Data on DGCE. Measuring the maturity level of Big Data can be used as a first step to assess the actual situation of an organization, obtain and prioritize corrective steps and then control each stage of its implementation. The measurement results can be used as a reference to formulate suggestions and recommendations for DGCE to reach a higher maturity level. Measurements were made using the TDWI Big Data Maturity Model framework to evaluate the implementation of Big Data on DGCE. Data collection is done through closed question interviews, then processed using assessment tools. The evaluation results indicate that the maturity level of Big Data on DGCE is at phase 3 (Early Adoption) of scale 1 to 5. The results of the study provide recommendations on each dimension to be able to increase the maturity level to phase 4 (Corporate Adoption) with priority changes starting from the organizational dimension, analytics, data management, infrastructure, and governance.

"
2019
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
cover
Panji Winata
"[ABSTRAK
PT. XYZ merupakan perusahaan telekomunikasi di Indonesia yang sedang
berusaha mentransformasikan bisnisnya menuju layanan broadband dan bisnis
digital. Banyak peluang bisnis di layanan broadband dan bisnis digital yang dapat
diidentifikasi dengan memproses dan menganalisis data dengan cepat, tepat, dan
menyeluruh. Saat ini PT. XYZ telah memiliki kemampuan dalam mengolah
beberapa sumber data yang terstruktur dengan ukuran data yang terbatas. Untuk
membuat perhitungan dan keputusan yang jitu, terutama di layanan broadband dan
bisnis digital, PT. XYZ dituntut juga untuk bisa memproses dan menganalisis data
yang memiliki karakteristik 3V (Velocity, Volume, Variety) atau dikenal dengan big
data. Penelitian ini bertujuan untuk merancang arsitektur sistem pemrosesan big
data di PT. XYZ. Kerangka arsitektur (framework) enteprise yang digunakan dalam
penelitian ini adalah TOGAF. Hasil yang diperoleh dari penelitian ini adalah
rancangan arsitektur sistem pemrosesan big data yang mampu mengolah data yang
memiliki karakteristik 3V, yaitu aliran data yang cepat, berukuran masiv, dan
beranekaragam (terstruktur maupun tidak terstruktur) dengan biaya lebih rendah
dari sistem pemrosesan data yang dimiliki PT. XYZ saat ini. Saran untuk penelitian
ini kedepannya adalah sistem pemrosesan big data di PT. XYZ dapat
diimplementasikan dengan baik jika mendapat dukungan penuh dari manajemen
perusahaan, dimulai dengan kasus bisnis yang spesifik (specific business case) yang
ingin disasar. Hasil yang maksimal dari kasus bisnis tersebut dapat dijadikan
landasan untuk investasi sistem pemrosesan big data yang lebih menyeluruh dalam
mendukung transformasi bisnis menuju layanan broadband dan bisnis digital.

ABSTRACT
PT. XYZ is a telecommunication company in Indonesia which is transforming it's business to broadband services & digital business. Many business opportunities in broadband services & digital business can be identified by processing and analyzing data quickly, accurately, and completely. Right now PT. XYZ has the capability in processing some structured data sources with limited data size. To make accurate calculations and decisions, especially in broadband services and digital business, PT. XYZ also required to be able to process and analyze the data that has the characteristics of 3V (Velocity, Volume, Variety) or known as big data. This research aims to design the architecture of big data processing system. The enterprise architecture framework used in this study is TOGAF. The results obtained from this study is the design of big data processing system architecture that is capable of processing data which has the characteristics of 3V (the fast data
flow, massive data size, and diverse structured or unstructured data sources) at a lower cost than the current data processing system in PT. XYZ. The suggestion about this study is the big data processing system can be implemented properly in PT. XYZ with the full support of the PT. XYZ management, started with a specific business use case that want targeted. The maximum results from the business use case can be used as a piloting for big data processing system investments more
thorough in supporting business transformation toward broadband services and digital business. ;PT. XYZ is a telecommunication company in Indonesia which is transforming it?s
business to broadband services & digital business. Many business opportunities in
broadband services & digital business can be identified by processing and analyzing
data quickly, accurately, and completely. Right now PT. XYZ has the capability in
processing some structured data sources with limited data size. To make accurate
calculations and decisions, especially in broadband services and digital business,
PT. XYZ also required to be able to process and analyze the data that has the
characteristics of 3V (Velocity, Volume, Variety) or known as big data. This
research aims to design the architecture of big data processing system. The
enterprise architecture framework used in this study is TOGAF. The results
obtained from this study is the design of big data processing system architecture
that is capable of processing data which has the characteristics of 3V (the fast data
flow, massive data size, and diverse structured or unstructured data sources) at a
lower cost than the current data processing system in PT. XYZ. The suggestion
about this study is the big data processing system can be implemented properly in
PT. XYZ with the full support of the PT. XYZ management, started with a specific
business use case that want targeted. The maximum results from the business use
case can be used as a piloting for big data processing system investments more
thorough in supporting business transformation toward broadband services and
digital business. , PT. XYZ is a telecommunication company in Indonesia which is transforming it’s
business to broadband services & digital business. Many business opportunities in
broadband services & digital business can be identified by processing and analyzing
data quickly, accurately, and completely. Right now PT. XYZ has the capability in
processing some structured data sources with limited data size. To make accurate
calculations and decisions, especially in broadband services and digital business,
PT. XYZ also required to be able to process and analyze the data that has the
characteristics of 3V (Velocity, Volume, Variety) or known as big data. This
research aims to design the architecture of big data processing system. The
enterprise architecture framework used in this study is TOGAF. The results
obtained from this study is the design of big data processing system architecture
that is capable of processing data which has the characteristics of 3V (the fast data
flow, massive data size, and diverse structured or unstructured data sources) at a
lower cost than the current data processing system in PT. XYZ. The suggestion
about this study is the big data processing system can be implemented properly in
PT. XYZ with the full support of the PT. XYZ management, started with a specific
business use case that want targeted. The maximum results from the business use
case can be used as a piloting for big data processing system investments more
thorough in supporting business transformation toward broadband services and
digital business. ]"
2015
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
"Informasi telah menjadi komoditas berharga yang membawa pada perubahan pada kehidupan manusia. Salah satu perubahan adalah bagaimana manusia memperoleh informasi tersebut dari kepingan data yang sangat banyak. Kepingan data yang banyak tersebut merupakan big data membutuhkan tempat untuk disimpan di organisasi dan di analisa. Perpustakaan memiliki sejarah panjang sebagai tempat penyimpanan, pengorganisasian dan analisa informasi. Artikel ini berusaha memberikan gambaran umum tentang big data dan pengaruhnya terhadap dunia perpustakaan. Big data membawa pengaruh besar dalam dunia perpustakaan khususnya pada aspek layanan perpustakaan, kompetensi pustakawan."
MPMKAP 22:4 (2015)
Artikel Jurnal  Universitas Indonesia Library
cover
Diyanatul Husna
"ABSTRAK
Apache Hadoop merupakan framework open source yang mengimplementasikan MapReduce yang memiliki sifat scalable, reliable, dan fault tolerant. Scheduling merupakan proses penting dalam Hadoop MapReduce. Hal ini dikarenakan scheduler bertanggung jawab untuk mengalokasikan sumber daya untuk berbagai aplikasi yang berjalan berdasarkan kapasitas sumber daya, antrian, pekerjaan yang dijalankan, dan banyaknya pengguna. Pada penelitian ini dilakukan analisis terhadapap Capacity Scheduler dan Fair Scheduler. Pada saat Hadoop framework diberikan 1 pekerjaan dengan ukuran data set 1,03 GB dalam satu waktu. Waiting time yang dibutuhkan Capacity Scheduler dan Fair Scheduler adalah sama. Run time yang dibutuhkan Capacity Scheduler lebih cepat 6% dibandingkan Fair Scheduler pada single node. Sedangkan pada multi node Fair Scheduler lebih cepat 11% dibandingkan Capacity Scheduler. Pada saat Hadoop framework diberikan 3 pekerjaan secara bersamaan dengan ukuran data set (1,03 GB ) yang sama dalam satu waktu. Waiting time yang dibutuhkan Fair Scheduler lebih cepat dibandingkan Capacity Scheduler yaitu 87% lebih cepat pada single node dan 177% lebih cepat pada multi node. Run time yang dibutuhkan Capacity Scheduler lebih cepat dibandingkan Fair Scheduler yaitu 55% lebih cepat pada single node dan 212% lebih cepat pada multi node. Turnaround time yang dibutuhkan Fair Scheduler lebih cepat dibandingkan Capacity Scheduler yaitu 4% lebih cepat pada single node, sedangkan pada multi node Capacity Scheduler lebih cepat 58% dibandingkan Fair Scheduler. Pada saat Hadoop framework diberikan 3 pekerjaan secara bersamaan dengan ukuran data set yang berbeda dalam satu waktu yaitu data set 1 (456 MB), data set 2 (726 MB), dan data set 3 (1,03 GB) dijalankan secara bersamaan. Pada data set 3 (1,03 GB), waiting time yang dibutuhkan Fair Scheduler lebih cepat dibandingkan Capacity Scheduler yaitu 44% lebih cepat pada single node dan 1150% lebih cepat pada multi node. Run time yang dibutuhkan Capacity Scheduler lebih cepat dibandingkan Fair Scheduler yaitu 56% lebih cepat pada single node dan 38% lebih cepat pada multi node. Turnaround time yang dibutuhkan Capacity Scheduler lebih cepat dibandingkan Fair Scheduler yaitu 12% lebih cepat pada single node, sedangkan pada multi node Fair Scheduler lebih cepat 25,5% dibandingkan Capacity Scheduler

ABSTRACT
Apache Hadoop is an open source framework that implements MapReduce. It is scalable, reliable, and fault tolerant. Scheduling is an essential process in Hadoop MapReduce. It is because scheduling has responsibility to allocate resources for running applications based on resource capacity, queue, running tasks, and the number of user. This research will focus on analyzing Capacity Scheduler and Fair Scheduler. When hadoop framework is running single task. Capacity Scheduler and Fair Scheduler have the same waiting time. In data set 3 (1,03 GB), Capacity Scheduler needs faster run time than Fair Scheduler which is 6% faster in single node. While in multi node, Fair Scheduler is 11% faster than Capacity Scheduler. When hadoop framework is running 3 tasks simultaneously with the same data set (1,03 GB) at one time. Fair Scheduler needs faster waiting time than Capacity Scheduler which is 87% faster in single node and 177% faster in muliti node. Capacity Scheduler needs faster run time than Fair Scheduler which is 55% faster in single node and 212% faster in multi node. Fair Scheduler needs faster turnaround time than Capacity Scheduler which is 4% faster in single node, while in multi node Capacity Scheduler is 58% faster than Fair Scheduler. When hadoop framework is running 3 tasks simultaneously with different data set, which is data set 1 (456 MB), data set 2 (726 MB), and data set 3 (1,03 GB) in one time. In data set 3 (1,03 GB), Fair Scheduler needs faster waiting time than Capacity Scheduler which is 44% faster in single node and 1150% faster in muliti node. Capacity Scheduler needs faster run time than Fair Scheduler which is 56% faster in single node and 38% faster in multi node. Capacity Scheduler needs faster turnaround time than Fair Scheduler which is 12% faster in single node, while in multi node Fair Scheduler is 25,5% faster than Capacity Scheduler"
2016
T45854
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9   >>