Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 187195 dokumen yang sesuai dengan query
cover
Pratiwi Arizona
"Online customers segmentation could be a valuable research topic of marketing strategy. Previous literature mainly studied the differences between non-purchasers and purchasers, lacking further segmentation of online customers themselves. This thesis focuses on online customer segmentation based on a large volume of real transaction data in one of Indonesias e-commerce website. This research proposes a customer clustering technique using the K-Means algorithm and RFM Patterns as an analysis of the customers profile. Then, the market basket analysis is conducted using the Apriori algorithm for every customer profile and cluster to obtain the association rule as well as product relationships purchased by customers. Later on, the result of market basket analysis is utilized as an input for e-commerce companies in designing promotions such as bundling or product recommendation system for segmented customers.

Segmentasi pelanggan daring bisa menjadi topik penelitian yang berharga dalam strategi pemasaran. Literatur yang sudah ada cenderung mempelajari perbedaan antara pembeli dan non-pembeli, tanpa menggali lebih lanjut mengenai segmentasi pelanggan daring itu sendiri. Tesis ini berfokus pada segmentasi pelanggan daring berdasarkan data transaksi di salah satu situs penjualan daring di Indonesia. Penelitian ini mengusulkan teknik pengelompokan pelanggan menggunakan algoritma K-Means dan pola RFM sebagai analisis profil pelanggan. Kemudian, analisis keranjang belanja dilakukan dengan menggunakan algoritma Apriori untuk setiap profil pelanggan dan kluster untuk mendapatkan aturan asosiasi serta hubungan produk yang dibeli oleh pelanggan. Kemudian, hasil analisis keranjang belanja tersebut digunakan sebagai masukan untuk perusahaan penjualan daring dalam merancang promosi seperti bundling atau sistem rekomendasi produk untuk pelanggan yang berada dalam profil yang sama."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2019
T53471
UI - Tesis Membership  Universitas Indonesia Library
cover
Nurul Annisa
"Semakin ketatnya persaingan pada industri e-commerce menyebabkan perusahaan harus memiliki strategi yang inovatif untuk dapat memenangkan kompetisi ini. Salah satu strategi yang dapat diterapkan adalah dengan menerapkan customer relationship management (CRM). Penelitian ini bertujuan untuk mengindentifikasi pelanggan yang sudah ada pada salah satu perusahaan e-commerce di Indonesia. Identifikasi pelanggan dengan konsep CRM, yaitu customer lifetime value (CLV) merupakan salah satu pelaksanaan dari analytical CRM. Relational database management system digunakan untuk mendapatkan informasi mengenai pelanggan berdasarkan atribut yang dimiliki. Model Recency, Frequency, dan Monetary (RFM) dijadikan atribut untuk mensegmentasikan pelanggan dengan metode clustering k-means. Pemetaan customer value matrix juga digunakan untuk membantu dalam pembuatan program maintaining pelanggan sehingga dapat meningkatkan loyalitas pelanggan. Hasil dari penelitian ini berupa 9 segmen pelanggan dimana 3 diantara memiliki nilai CLV yang rendah dari semua model analisis. Selain itu, pelanggan yang paling menguntungkan bagi perusahaan adalah pelanggan pada segmen 6 dan 9 karena memiliki nilai CLV tinggi dan penilaian karakteristik lain yang paling baik. Untuk itu, kedua segmen tersebut merupakan pelanggan yang harus dijaga hubunganannya dengan perusahaan agar terciptanya profit.

The increasing of competition in e-commerce industry forces the company to have an innovative strategy in order to lead this competition. One of these strategy which can be implemented is customer relationship management concept. In the implementation, the company needs to understand the target of customer based on behavior and characteristics in the transaction process. The study aims to identify the existing customer of e-commerce's company in Indonesia. Identifying customer is one of the activity in analytical CRM. Customer lifetime value is a concept of CRM to identify the customer loyalty. The used of the existing database can help in analyzing customer. Relational database management system approach is used to retrieve the information about RFM (recency, frequency, and monetary) atribut of each customer. RFM model is used as atribut to differentiate customer with clustering k-means method. Finally, mapping the customer's segment into customer value matrix is used to help in creating maintaining customer program in order to increase customer loyalty. Result from this study is 9 segments of customer where 3 clusters have the lowest CLV and another analysis model. Beside that, segment 6 and 9 have high CLV and high in another model of assessment. Both segments are the customer which have high loyalty. Company should maintain the relationship very well with those kind of customer"
Depok: Fakultas Teknik Universitas Indonesia, 2016
S63333
UI - Skripsi Membership  Universitas Indonesia Library
cover
Naiza Astri Wulandari
"Sistem Penilaian Esai Otomatis (Simple-O) telah dibuat menggunakan algoritma K-Means dan metode Latent Semantic Analysis (LSA). Jawaban karangan siswa pertama-tama akan diklasifikasikan ke dalam kelas-kelas sesuai dengan topik masing-masing nomor, dan akan memisahkannya dari jawaban siswa yang tidak sesuai konteks kemudian akan dilakukan proses LSA yang merepresentasikan kata ke dalam matriks, yang kemudian matriks direduksi menggunakan Singular Value Decomposition dan dilanjutkan dengan mencari norma frobenius yang merupakan nilai dari setiap soal. Pada penelitian ini dilakukan uji coba dengan menggunakan 4 skenario dan hasil penelitian SIMPLE-O menggunakan algoritma K-Means dan LSA menghasilkan akurasi rata-rata sebesar 74% yaitu hasil skenario pengujian 1

An Automatic Essay Assessment System (Simple-O) has been created using the K-Means algorithm and the Latent Semantic Analysis (LSA) method. Students' essay answers will first be classified into classes according to the topic of each number, and will separate them from student answers that do not fit the context then an LSA process will be carried out which represents the word into a matrix, which is then reduced by using Singular Value. Decomposition and continue by looking for the Frobenius norm which is the value of each question. In this study, trials were carried out using 4 scenarios and the results of the SIMPLE-O research using the K-Means and LSA algorithms produced an average accuracy of 74%, namely the results of the test scenario number 1."
Depok: FAkultas Teknik Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dendy Tryanda
"Produk internet fixed broadband atau produk internet menggunakan kabel merupakan produk yang jarang digunakan oleh masyarakat Indonesia, padahal di era Covid-19 dengan sistem work from home, masyarakat membutuhkan kualitas internet yang baik. Penelitian ini bertujuan untuk membantu PT ABC mendapatkan pelanggan baru dengan melakukan cross-selling produk terhadap pelanggan dari anak perusahaannya yaitu PT XYZ yang juga menggunakan produk internet fixed broadband namun bukan produk dari PT ABC dengan menggunakan metode machine learning jenis unsupervised learning dengan jenis clustering partisi dengan algoritma k-means clustering dengan menggunakan tool KNIME untuk proses k-means clustering dan tool R Programming untuk proses pencarian cluster jumlah optimal. Hasil dari algoritma ini menemukan bahwa terdapat empat jenis cluster pelanggan PT XYZ yang karakteristiknya dapat dilihat dari sisi pendapatan yang didapat dari hasil korelasi data, cluster 2 dan cluster 3 merupakan cluster potensial dengan 2123 pelanggan dan area yang memiliki sedikit pelanggan adalah area 1 dan area 4, lalu estimasi pendapatan minimum yang akan dihasilkan adalah Rp 8.937.830.000.

Internet fixed broadband products or internet products using cables is a products that are rarely used by Indonesian people, even though in the Covid-19 era with a work from home system, people need a good quality internet. This study aims to help PT ABC get new customers by cross-selling products to customers of its subsidiary PT XYZ who also use internet fixed broadband products, but not products from PT ABC by using the machine learning method unsupervised learning types with partition clustering and the k-means clustering algorithm using the KNIME tool for the k-means clustering process and the R Programming tool for the process of finding the optimal number of clusters. The result of this algorithm finds that there are four types of PT XYZ customer clusters whose characteristics we can see from the revenue side from the results of data correlation, cluster 2 and cluster 3 are potential clusters with 2123 customers and areas that have few customers are area 1 and area 4, then the estimated minimum revenue that will be generated is IDR 8,937,830,000."
Jakarta: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Fajar Agung Prasetyo
"Indonesia merupakan salah satu negara di dunia yang masih menerapkan subsidi untuk Bahan Bakar Minyak (BBM). Pemerintah Indonesia sesuai dengan amanah undang-undang harus menjamin penyediaan dan pendistribusian BBM bagi seluruh rakyat Indonesia. Untuk menerapkan kebijakan ini dengan tepat maka pemahaman akan pola konsumsi BBM menjadi hal yang sangat fundamental karena setiap daerah memiliki hak yang sama dalam memperoleh sumber energi termasuk BBM. Penelitian ini menggunakan metode clustering untuk mengetahui kategori kabupaten/kota berdasarkan pola konsumsi BBM subsidi. Data yang digunakan adalah data konsumsi BBM subsidi sejak Januari tahun 2016 hingga Juni tahun 2021 dalam bentuk time series. Penelitian ini membandingkan beberapa metode clustering yaitu k-means, Partitioning Around Medoid (PAM) dan Clustering Large Applications (CLARA). Hasil yang diperoleh adalah k-means menjadi metode clustering yang paling optimal untuk analisis konsumsi BBM subsidi setelah dilakukan evaluasi terhadap nilai rata-rata Silhouette, Dunn Index dan Connectivity. Hasil clustering dengan metode k-means mengindikasikan adanya dua cluster kabupaten/kota yang memiliki tingkat kerentanan terhadap konsumsi BBM yang tinggi dan rendah. Pemerintah perlu menetapkan daerah prioritas dalam pengawasan penggunaan BBM subsidi terutama daerah dengan tingkat kerentanan penggunaan BBM subsidi yang tinggi serta untuk daerah yang memiliki tingkat kerentanan rendah pemerintah perlu meninjau kembali kuota BBM subsidi yang ditetapkan

Indonesia is one of the countries in the world that still applies subsidies for fuel oil (BBM). The Indonesian government following the mandate of the law must ensure the supply and distribution of fuel for all Indonesian people. Understanding the pattern of fuel consumption is very fundamental because every region has the same rights in obtaining energy sources, including fuel. This study uses the clustering method to determine the category of districts/cities based on the pattern of consumption of subsidized fuel. The data used is data on subsidized fuel consumption from January 2016 to June 2021 in the form of a time series. This study compares several clustering methods, namely k-means, Partitioning Around Medoid (PAM), and Clustering Large Applications (CLARA). The results found that k-means becomes the most optimal clustering method for the analysis of subsidized fuel consumption after evaluating the values of Silhouette, Dunn Index, and Connectivity. The results indicate that two district/city clusters have high and low levels of vulnerability to fuel consumption. The government needs to determine priority areas in supervising the use of subsidized fuel, and for areas that have a low level of vulnerability, the government needs to review the quota for subsidized fuel that has been set."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Aries Agus Budi Hartanto
"Era perdagangan bebas membutuhkan peningkatan daya saing produk lokal di pasar global, melalui standardisasi. Kebijakan standardisasi termasuk bagaimana merencanakan, merumuskan, menetapkan, menerapkan, menegakkan, memelihara, dan mengawasi Standar Nasional, seperti Standar Nasional Indonesia (SNI). SNI bermanfaat untuk menciptakan daya saing dan perlindungan konsumen. Konsistensi standardisasi terlihat dari evaluasi kegiatan standardisasi, yang membutuhkan waktu dan sumber daya yang tinggi. Terdapat hambatan dalam kegiatan standardisasi seperti kurangnya infrastruktur standardisasi, jumlah SNI, kesiapan industri, sumber daya pengawasan, dan juga hambatan lain dalam kegiatan standardisasi. Hambatan tersebut menjadi perhatian media, melalui banyaknya pemberitaan, keluhan tentang permasalahan tersebut. Perkembangan opini pada media dapat berpengaruh terhadap pembuatan kebijakan, pelayanan dan dapat mengubah strategi kebijakan standardisasi. Oleh karena itu tujuan dari penelitian ini adalah untuk menemukan klasifikasi dan pengelompokan dari permasalahan standardisasi, yang menjadi bagian penting dari kebijakan evaluasi. Penelitian ini menggunakan pendekatan analisis sentimen, yang dapat menangkap perubahan pemberitaan media yang cepat dalam bidang standardisasi, dengan menggunakan metode klasifikasi deep belief networks (DBN) dan pengelompokan K-means. Selain DBN, penelitian ini juga membandingkan performa DBN dengan metode klasifikasi lainnya, yaitu Naive Bayes (NB), Artificial Neural Networks (ANN) dan Support Vector Machine (SVM). Hasil penelitian ini menunjukkan performa model klasifikasi dengan DBN lebih baik dari metode lainnya dengan F1 Measure mencapai 94.20%, dimana NB mencapai 89.98%, ANN mencapai 83.72% dan SVM mencapai 89.97%. Selain itu, hasilnya menunjukkan bahwa jumlah sentimen negatif terbanyak adalah 12.54% dan jumlah sentimen positif terbanyak adalah 29,94%. Kedua sentimen tersebut adalah anggota kelas pemberlakuan SNI. Adapun hasil pengelompokan K-means terbentuk 5 buah klaster optimal pada setiap kelas, dan menunjukkan subtopik dengan judul kendala pemberlakuan, penegakan, pemahaman aturan serta kebutuhan regulasi SNI menjadi perhatian terbesar dari media. Penelitian ini menghasilkan pengetahuan yang berguna untuk membangun alternatif masukan, secara cepat dalam evaluasi kebijakan standardisasi, dalam bentuk analisis sentimen yang belum pernah dilakukan sebelumnya. Penelitian ini diharapkan dapat menangkap kondisi standardisasi serta berkontribusi dalam meningkatkan kebijakan standardisasi di Indonesia.

Free trade era requires increasing the competitiveness of local products in the global market, through standardization. The standardization policy is including how to plan, formulate, establish, implement, enforce, maintain, and supervise National Standard, e.g Indonesian National Standard called SNI. SNI is useful in order to create competitiveness and consumer protection. The consistency of standardization shows through evaluation of standardization activity, that requires hight time and resources. There are obstacles in standardization activities such as lack of standardization infrastructure, number of SNIs, industry readiness, supervision resources, and also other obstacles in standardization activities. This obstacle has become the media`s attention, through many news reports and complaints about the problem. The development of opinion on the media can influence policy making, service and can change the standardization policy strategy. Therefore the purpose of this study is to find the classification and clustering of standardization problems, which to become an important part of the evaluation policy. This study uses a sentiment analysis approach, which can capture rapid changes of media coverage in standardization, using the method of deep belief networks (DBN) classification and grouping of K-means. Besides DBN, this study also compares the performance of DBN with other classification methods, namely Naive Bayes (NB), Artificial Neural Networks (ANN) and Support Vector Machine (SVM). The results of this study show the performance of the classification model with DBN is better than other methods with F1 Measure reaching 94.20%, where NB reaches 89.98%, ANN reaches 83.72% and SVM reaches 89.97%. In addition, the results showed that the highest number of negative sentiments was 12.54% and the highest number of positive sentiments was 29.94%. Both sentiments are class members of SNI regulation. The results of the K-means clustering formed 5 optimal clusters of each class, and showed subtopics about the constraints of enforcement, establishment, understanding the rules and requirements of SNI regulation to be the biggest concern of the media. This research produces knowledge that is useful for building alternative inputs, and quickly in evaluating standardization policies, in the form of sentiment analysis that has never been done before. This research is expected to capture the conditions of standardization and contribute to improving standardization policies in Indonesia."
Depok: Fakultas Teknik Universitas Indonesia, 2019
T54219
UI - Tesis Membership  Universitas Indonesia Library
cover
Renata Tursina
"CRM yang sukses seperti meningkatkan loyalitas pelanggan, dan profit perusahaan berawal dari identifikasi pelanggan berdasarkan nilai dan loyalitas pelanggan. Dalam penelitian ini, Customer Lifetime Value (CLV) digunakan untuk mensegmentasi pelanggan seluler berdasarkan nilai pelanggan. Atribut yang dipilih dari database pelanggan yaitu variabel recency, frequency dan monetary (RFM). Dalam segmentasi pelanggan digunakan metode k-means, salah satu metode dalam data mining dengan menggunakan Euclidean Distance dalam menentukan nilai k optimal (jumlah segmentasi optimal). Pembobotan variabel RFM menggunakan Analytic Hierarchy Process (AHP) untuk mengevaluasi customer lifetime value (CLV). Pada akhirnya, penelitian ini akan dilakukan analisis CLV pada masing-masing kelompok pelanggan yang dibagi dalam beberapa kuartal. Tujuan utama penelitian ini yaitu sebagai acuan pemberi keputusan strategi pemasaran perusahaan berdasarkan segmentasi pelanggan mereka.

A firm starts from identifying customers’ value and loyalty in identifying different segments of customer for to building successful customer relationship management (CRM) such as improve customer loyalty and revenue of the firm. In this paper, CLV is used to telecom market segmentation. The RFM (recency, frequency and monetary ) model variables were used to segment database, the K-means cluster analysis was also employed in data mining with K-optimum according to Euclidean Distance. The Analytic Hierarchy Process (AHP) was applied to determine the relative weights of RFM variables in evaluating customer customer lifetime value (CLV). Finally, this paper analysing customer lifetime value of each segments by tren of customer value in different quartal. The general aim of this study is to provide a quide to marketing decisions of the firm based on their customer segmentation.
"
Depok: Fakultas Teknik Universitas Indonesia, 2014
S59292
UI - Skripsi Membership  Universitas Indonesia Library
cover
Bambang Novianto
"Pertumbuhan pemanfaatan internet telah meningkatkan perhatian terhadap keamanan data. Pada tahun 2014, Projek SHINE (SHodan Intelligence Extraction) telah menerbitkan laporan penilaian keamanan skala besar untuk perangkat yang terhubung ke Internet. Namun, berdasarkan laporan tersebut, jumlah informasi mengenai IP address Indonesia yang berhasil didapatkan masih sedikit. Terdapat sebanyak 7.182 IP address dari Indonesia, yaitu sekitar 0,0032% dari total 2.186.971 IP address yang berhasil dikumpulkan oleh Projek SHINE. Dalam penulisan tesis ini, penulis mengajukan inisiatif untuk melakukan analisis kerentanan semua informasi Autonomous System Number (AS Number) di Indonesia dari Shodan. Penulis telah menyusun dataset semua informasi AS Number di Indonesia antara lain 12.787 port, 79 sistem operasi, 409 produk, 3.634 domain, 145.543 IP address, dan 790 organisasi. Penulis menggunakan algoritma K-Means clustering untuk mengelompokkan AS Number ke dalam beberapa kelas sesuai dengan tingkat paparan di shodan. Berdasarkan hasil pengelompokan, penulis mendapatkan 4 kelas AS Number antara lain 1.075 AS Number di kelas: 0 (belum terdapat informasi mengenai AS Number tersebut di Shodan), 614 AS Number di kelas: 1 (tingkat paparan rendah), 9 AS Number di kelas: 2 (tingkat paparan sedang), dan 1 AS Number di kelas: 3 (tingkat paparan tinggi). Informasi ini dapat dimanfaatkan oleh Kementerian yang menangani bidang Teknologi Informasi dan Komunikasi dan Badan yang menangani Keamanan Siber di Indonesia untuk menghimbau organisasi pengelola AS Number agar mewaspadai potensi kerentanan yang dinformasikan oleh Shodan dan dimanfaatkan oleh hacker.

The growth of internet-enabled devices has increased interest in cybersecurity. In 2014, Project SHINE (SHodan INtelligence Extraction) published a report of large-scale security assessments for devices connected to the Internet. However, the number of IP addresses harvested from Indonesia in 2014 is very small. There were 7.182 IP address from Indonesia. It was about 0,0032% from the total 2.186.971 IP addresses. In this paper, we propose an initiative to gather all information for all Autonomous System Number (AS Number) from Indonesia in Shodan. We have gathered a dataset about all information of AS Numbers in Indonesia such as 12.787 unique ports, 79 unique operating systems, 409 unique products, 3.634 unique domains, 145.543 unique IP addresses, and 790 unique organizations. We use the K-Means algorithm to cluster all AS Numbers into several classes according to the exposure level in shodan. Based on the result, we have 4 classes of AS Numbers. There are 1.075 AS Numbers in class:0 (no information in Shodan yet), 614 AS Numbers in class:1 (exposure level = low), 9 AS Numbers in class:2 (exposure level = medium), and 1 AS Number in class:3 (exposure level = high). This information can be used to warn the organizations that manage AS Numbers in Indonesia to be aware of the security and the threats to their systems."
Jakarta: Fakultas Teknik Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Labibah Alya Huwaida
"E-commerce merupakan kontributor utama ekonomi digital Indonesia, tetapi statistik menunjukkan adanya peningkatan jumlah keluhan dan insiden penipuan terkait e-commerce yang berakibat kepercayaan masyarakat terhadap e-commerce menurun. Salah satu akar permasalahan yang diidentifikasi yaitu maraknya opini negatif publik yang cenderung mendorong pelanggan untuk tidak menggunakan layanan e-commerce. Oleh karena itu, penelitian ini menganilisis sentimen publik dengan tujuan mengetahui model terbaik untuk mengklasifikasikan sentimen, tren sentimen dari waktu ke waktu, topik utama yang melandasi sentimen tersebut, serta rekomendasi berdasarkan analisis. Penelitian ini menggunakan data dari Twitter dengan periode tweet dari Agustus hingga Oktober 2023, berfokus pada tiga e-commerce terbesar di Indonesia. Pada tahap analisis, metode machine learning untuk analisis sentimen dan Latent Dirichlet Allocation (LDA) untuk pemodelan topik diimplementasikan. Hasil penelitian menunjukkan bahwa model terbaik untuk mengklasifikasikan sentimen adalah Support Vector Machine (SVM) dengan temuan yaitu sentimen netral mendominasi, sentimen negatif stabil dengan beberapa peningkatan, sementara sentimen positif lebih bervariasi, terdapat lonjakan di beberapa titik. Topik utama sentimen positif berkaitan dengan proses belanja menyenangkan, fitur inovatif, event khusus, harga dan penawaran murah, serta dukungan terhadap produk lokal di e-commerce. Sentimen negatif berpusat pada isu ketidaksesuaian barang, pengembalian dana, pengiriman barang, dan layanan pelanggan. Rekomendasi untuk meningkatkan kepuasan pelanggan mencakup memperkuat aspek-aspek yang memicu sentimen positif, serta menangani permasalahan yang memicu sentimen negatif, seperti perbaikan proses pengiriman, dan penguatan langkah-langkah keamanan untuk mengatasi penipuan.

E-commerce plays a vital role in Indonesia's digital economy, but statistics reveal an increase in complaints and fraud incidents associated with e-commerce, leading to a decline in public trust. One identified root issue is the prevalence of negative public opinions, discouraging customers from using e-commerce services. Therefore, this study analyzes public sentiment with the aim of determining the best model for sentiment classification, understanding sentiment trends over time, identifying key topics underlying these sentiments, and providing recommendations based on the analysis. The study utilizes Twitter data from August to October 2023, focusing on the three largest e-commerce platforms in Indonesia. In the analysis phase, machine learning methods for sentiment analysis and Latent Dirichlet Allocation (LDA) for topic modeling are implemented. The findings indicate that the Support Vector Machine (SVM) is the best model for sentiment classification. Neutral sentiment dominates, negative sentiment remains stable with occasional increases, while positive sentiment is more varied, experiencing spikes at certain points. Key topics associated with positive sentiment include enjoyable shopping experiences, innovative features, special events, affordable pricing, and support for local products in e-commerce. Negative sentiment revolves around issues of product mismatch, refund processes, shipping concerns, and customer service. Recommendations to enhance customer satisfaction involve strengthening aspects that trigger positive sentiments and addressing issues causing negative sentiments, such as improving the delivery process and reinforcing security measures to tackle fraud."
Jakarta: Fakultas Ilmu Komputer Universitas ndonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Khoirul Umam
"DNA adalah salah satu pembawa informasi genetik pada makhluk hidup. Sequencing dan clustering barisan DNA telah menjadi pekerjaan utama dan rutin dalam dunia biologi molekuler, khususnya dalam bidang terapan bioinformatika. Secara umum metode clustering dapat dibedakan menjadi dua, yaitu hirarki clustering dan partisi clustering. Penelitian ini menggabungkan dua metode clustering yaitu K-Means partisi clustering pada Level 1 dan DIANA hirarki clustering pada Level 2, oleh karena itu disebut Two-Level Hybrid Clustering. Proses awal dimulai dengan mengumpulkan barisan DNA HPV yang diperoleh dari NCBI National Centre for Biotechnology Information, Ekstraksi Ciri, dan Normalisasi. Kemudian melakukan proses clustering menggunakan algoritma K-Means pada Level 1 dan algoritma DIANA pada Level 2. Untuk menghitung jarak genetik antar barisan DNA HPV digunakan persamaan Euclidian Distance. Dan validitas klaster yang digunakan untuk menentukan banyaknya klaster yang optimum adalah Indeks Davies-Bouldin IDB. Hasil penerapan Two-Level Hybrid Clustering pada 1252 barisan DNA HPV adalah data dikelompokan menjadi 4 klaster dengan nilai IDB yaitu 0.859154564. Semua perhitungan dan proses clustering menggunakan software R.

DNA is one of the carrier of genetic information in living organisms. Sequencing and clustering DNA sequences has become the key and routine activitis in the molecular biology, in particular on bioinformatics applications. There are two type of clustering, hierarchical clustering and partitioning clustering. In this paper, we combine two type clustering proccesses including K Means partitioning clustering on Level 1 and DIANA hierarchical clustering on Level 2, therefore it called Two Level Hybrid clustering. The beginning of process is started with collecting DNA sequences of HPV from NCBI National Centre for Biotechnology Information, Characteristics Extraction, and Normalization. The next step is clustering by implementation K Means algorithm on Level 1 and DIANA algorithm on Level 2. To calculate the genetic distance we use Euclidian Distance. Moreover, in validating cluster results in order to get optimum number of clusters, we use Davies Bouldin Index DBI. The result of implementation of Two Level Hybrid Clustering on 1252 sequences of HPV is the data clustered into 4 clusters with minimal IDB value is 0.859154564. All calculating and clustering process in this paper using software R.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47109
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>