Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Ika Marta Sari
Abstrak :

Analisis triclustering merupakan pengembangan dari analisis clustering dan analisis biclustering. Tujuan dari analisis triclustering yaitu mengelompokkan data tiga dimensi secara simultan atau bersamaan. Data tiga dimensi tersebut dapat berupa observasi, atribut, dan konteks. Salah satu pendekatan yang digunakan dalam analisis triclustering, yaitu pendekatan berdasarkan pattern contohnya, adalah metode Timesvector. Metode Timesvector bertujuan untuk mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Metode Timesvector memiliki langkah kerja yang dimulai dengan mereduksi matriks data tiga dimensi menjadi matriks data dua dimensi untuk mengurangi kompleksitas dalam pengelompokkan. Pada metode ini akan digunakan algoritma Spherical K-means dalam pengelompokkannya. Tahap selanjutnya, yaitu mengidentifikasi pola dari cluster yang dihasilkan pada Spherical K-means. Pola yang dimaksud terdiri dari tiga jenis, yaitu DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), dan SEP (Similarly Expressed Pattern). Penerapan dari metode Timesvector dilakukan pada data ekspresi gen yaitu data tumor otak yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan banyak cluster yang sama tetapi nilai threshold yang berbeda-beda. Hasil dari ke enam skenario akan divalidasi menggunakan nilai coverage dan nilai tricluster diffusion (TD). Hasil penerapan metode timesvector menunjukkan bahwa dengan menggunakan threshold sebesar 1,5 memberikan hasil yang paling optimal karena memiliki nilai coverage yang tinggi sebesar 57% dan nilai TD yang rendah sebesar 2,95594E-06. Nilai coverage yang tinggi menunjukkan kemampuan metode dalam mengekstrak data dan nilai TD yang rendah menunjukkan bahwa tricluster yang dihasilkan memiliki volume yang besar dan koherensi yang tinggi. Berdasarkan pola yang dihasilkan menggunakan skenario yang optimal diperoleh sebanyak 49 ODEP cluster dengan pasien ke-empat selalu memiliki pola ekspresi yang berbeda dibandingkan dengan pasien lainya.  Hal ini dapat digunakan oleh ahli medis untuk melakukan tindakan selanjutnya terhadap pasien tumor otak.

 


Triclustering analysis is the development of clustering analysis and biclustering analysis. The purpose of triclustering analysis is to group three-dimensional data simultaneously or simultaneously. The three-dimensional data can be in the form of observations, attributes, and context. One of the approaches used in triclustering analysis, namely an approach based on a pattern, for example, is the Timesvector method. Timesvector method aims to group data matrices that show the same or different patterns in three-dimensional data. The Timesvector method has a work step that starts with reducing the three-dimensional data matrix to a two-dimensional data matrix to reduce complexity in a grouping. In this method, the Spherical K-means algorithm will be used in grouping it. The next step is to identify the pattern of the clusters generated in the Spherical K-means. The pattern referred to consists of three types, namely DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), and SEP (Similar Expressed Pattern). The application of the Timesvector method was carried out on gene expression data, namely brain tumor data carried out in 6 scenarios. Each scenario uses the same many clusters but different threshold values. The results of the six scenarios will be validated using the coverage value and the tricluster diffusion (TD) value. The results of applying the timesvector method show that using a threshold of 1.5 gives the most optimal results because it has a high coverage value of 57% and a low TD value of 2.95594E-06. A high coverage value indicates the method's ability to extract data and a low TD value indicates that the resulting tricluster has a large volume and high coherence. Based on the pattern generated using the optimal scenario, there were 49 ODEP clusters with the fourth patient always having a different expression pattern compared to other patients. This can be used by medical experts to perform further action on brain tumor patients.

 

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Stefany Nurhatika
Abstrak :

Analisis triclustering merupakan pengembangan dari analisis clustering dan biclustering. Analisis triclustering bertujuan mengelompokkan data tiga dimensi secara simultan yang menghasilkan submatriks dinamakan tricluster. Pendekatan yang digunakan dalam analisis triclustering di antaranya adalah pendekatan berdasarkan greedy dan pattern. Salah satu contoh pendekatan analisis triclustering berdasarkan greedy adalah metode  Î´ – Trimax. Sedangkan salah satu contoh analisis triclustering berdasarkan pattern adalah metode Timesvector. Metode δ – Trimax bertujuan menghasilkan tricluster yang memiliki mean square residual kecil dari threshold  dengan volume data tricluster yang maksimal. Metode Timesvector bertujuan mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Implementasi metode  Î´ – Trimax dan metode Timesvector pada penelitian ini dilakukan pada data ekspresi gen pasien penderita penyakit periodontitis. Ekspresi gen diukur pada 14 titik kondisi dan 4 titik waktu. Berdasarkan beberapa skenario yang telah diterapkan, metode Î´ – Trimax memberikan hasil terbaik pada saat menerapkan skenario dengan nilai threshold =0,0028564 dan =1,25 dengan jumlah tricluster yang dihasilkan adalah 260 tricluster. Dari 260 tricluster tersebut, dipilih tricluster ke-216 yang dianalisis dengan menggunakan metode Timesvector. Hasil tricluster yang diperoleh dapat menambah wawasan bagi ahli medis dalam memberikan periodontal treatment kepada pasien penderita periodontitis berikutnya. ......Triclustering analysis is the development of clustering and biclustering. Triclustering analysis aims to group three-dimensional data simultaneously, forming the initial subspace known as a tricluster. It utilizes two main approaches that are greedy-based and pattern-based approaches, exemplified by the δ – Trimax and Timesvector methods, respectively. The δ – Trimax method aims for triclusters with smaller mean square residuals than the threshold δ, while Timesvector groups data matrices with similar or different patterns. In a study on periodontitis patients gene expression data, comprising 14 condition points and 4 time points, both methods were implemented. The δ – Trimax method yielded optimal results under specific conditions (δ = 0.0028564, λ = 1.25), producing 260 triclusters. Among these, the 216th tricluster was selected for further analysis using the Timesvector method. The insights gained from these triclusters can enhance periodontal treatment strategies for patients with subsequent periodontitis, providing valuable guidance to medical experts.

 

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Melati
Abstrak :
Pusat Sistem Informasi dan Teknologi Keuangan Pusintek ditunjuk sebagai unit TIK Pusat di lingkungan Kemenkeu yang fungsi utamanya memberikan layanan TIK di seluruh lingkungan Kemenkeu. Untuk mengukur kualitas layanan publik yang diberikan Kemenkeu dalam memenuhi harapan pengguna layanan, Kemenkeu melakukan Survey Kepuasan Pengguna SKP .Pusintek mempunyai berbagai jenis layanan dibidang TIK. Agar layanan tersebut dikenali secara tepat dan diminta sesuai kebutuhan, maka dibuat Daftar Layanan TIK. Salah satu layanan yang termasuk dalam penilaian SKP Kemenkeu tahun 2015 adalah layanan cloud server, yaitu layanan yang menyediakan infrastruktur server dengan menggunakan teknologi virtualisasi. Berdasarkan SKP tahun 2015, layanan cloud server belum memenuhi target. Penelitian ini bertujuan untuk menyusun rancangan spesifikasi layanan cloud pada daftar layanan TIK Pusintek, agar dapat memenuhi ekspektasi kebutuhan user.Dalam menyusun rancangan spesifikasi layanan cloud server untuk daftar layanan TIK Pusintek Kemenkeu, penulis menggunakan teori pattern-based infrastructure oleh Robertson dan Sribar dan memulai dengan menyusun data profil aplikasi yang digunakan di lingkungan Kemenkeu. Kemudian dengan menggunakan metode statistik deskriptif menggunakan tabel distribusi frekuensi, didapatkan hasil klasifikasi kapasitas server berupa pengelompokan spesifikasi tinggi, sedang, dan rendah. Selain itu dilakukan pemetaan aplikasi terhadap pengelompokan spesifikasi tersebut berdasarkan tingkat kritikalitas yang didapat dari analisis dampak bisnis.
Center of Information Systems and Technology Finance Pusintek Pusat Sistem Informasi dan Teknologi Keuangan was appointed as ICT central unit within the Ministry of Finance whose primary function provides ICT services in all spheres of MOF. To measure the quality of public services provided by MoF to meet the expectations of users, the Ministry of Finance conduct User Satisfaction Survey SKP Survey Kepuasan Pengguna .Pusintek has various types of services in the field of ICT. To make that services appropriately identified and requested as needed, they have a Service Catalog. One of the services included in the assessment of the Ministry of Finance SKP 2015 is a cloud services, which provide infrastructure server using virtualization technologies. Based on SKP 2015 report, cloud services user satisfactions do not meet the target. This study aims to draft specifications cloud services on the Pusintek IT service catalog, in order to meet the expectations of user needs.In preparing the draft service specification cloud server to the list of ICT services In preparing the draft of cloud service specification to the Pusintek IT service catalog, the author uses the theory of pattern based infrastructure by Robertson and Sribar, and begin to compile profile data applications used in the Ministry of Finance. By using descriptive statistical methods using the frequency distribution table, the capacity classification server grouping specifications of high, medium, and low. Besides the mapping of applications to the grouping is based on the specifications of the criticality levels obtained from the business impact analysis.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2017
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Yudhistira Erlandinata
Abstrak :
Korpus relasi semantik dapat menunjang berbagai penelitian di bidang pengolahan bahasa manusia. Untuk Bahasa Indonesia, korpus relasi semantik yang berukuran besar dan berkualitas baik masih belum tersedia. Korpus relasi semantik dapat dibuat secara manual dengan melibatkan anotator dan juga dapat dihasilkan secara otomatis menggunakan algoritma rule-based atau machine learning. Penelitian ini bertujuan untuk mengevaluasiseberapa baik kualitas korpus relasi semantik Bahasa Indonesia, khususnya relasi hiponim-hipernim, apabila dibangun dengan pendekatan machine learning dan metode crowdsourcing yang menerapkan gamifikasi. Algoritma pattern-based yang sebelumnya pernah diteliti untuk Bahasa Indonesia akan digunakan untuk menghasilkan data training algoritma machine learning dan kandidat entri korpus untuk dianotasi dengan metode crowdsourcing. Kualitas korpus hasil metode crowdsourcing diukur berdasarkan tingkat persetujuan antar anotator dan diperoleh hasil yang cukup baik walaupun belum sempurna. Untuk pendekatan machine learning, beberapa model machine learning yang diterapkan masih belum memberikan hasil optimal karena keterbatasan resource. Kata kunci: relasi semantik, hiponim-hipernim, crowdsourcing, gamifikasi, machine learning, pattern-based ......Semantic relations corpus is vital to support research in the field of Natural Language Processing. Currently, there is no existing corpus of semantic relations in Indonesian language which is enormous and high-quality. The corpus can be constructed manually by employing human annotators or built automatically using rule-based or machine learning algorithms. This research aims to evaluate the quality of Indonesian hyponym- hypernym semantic relations corpus that is produced by crowdsourcing mechanism with gamification, and to test the model for semantic relations prediction using machine learning algorithms. The pattern-based method is applied to obtain the training data for machine learning experiments and corpus entry candidates to be annotated using the crowdsourcing method. The quality of the crowdsourced corpus is measured using inter- annotator agreement. The experimental result shows that the gamification-based crowdsourcing method is promising to produce the corpus. On the other hand, machine learning models tested in this research have not given optimal results yet due to the limitations of the lexical resources in Indonesian language.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dea Siska
Abstrak :
Metode triclustering merupakan pengembangan dari metode clustering dan biclustering. Berbeda dengan  metode clustering dan biclustering yang bekerja pada data dua dimensi, triclustering bekerja pada data tiga dimensi yang disusun dalam bentuk matriks. Matriks ini terdiri dari dimensi observasi, atribut, dan konteks. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara simultan dan membentuk kelompok berupa subruang yang disebut tricluster. Metode ini umumnya diimplementasikan dalam bidang bioinformatika, terkhususnya dalam analisis data ekspresi gen tiga dimensi untuk menemukan profil ekspresi gen. Data atau matriks ini terdiri dari dimensi gen, kondisi eksperimen, dan waktu eksperimen (time point). Salah satu algoritma triclustering, yaitu Order Preserving Triclustering (OPTricluster), adalah algoritma yang menggunakan pendekatan pattern based dan digunakan untuk menganalisis data ekspresi gen tiga dimensi yang merupakan short time series 3-8 time point). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan ekspresi yang sama di sepanjang time points pada sejumlah kondisi eksperimen. Dalam penelitian ini, OPTricluster diimplementasikan pada data ekspresi gen sejumlah pasien yellow fever pasca vaksinasi dengan beberapa skenario yang menggunakan threshold yang berbeda-beda. Skenario dengan threshold yang optimum ditunjukkan oleh rata-rata skor Tricluster Diffusion terendah. Tricluster-tricluster yang dihasilkan berhasil menunjukkan hubungan biologis di antara pasien-pasien tersebut, di mana vaksin cenderung memberikan reaksi yang lebih signifikan pada pasien pria dibandingkan pasien wanita. Selain itu, ditemukan anomali pada pasien-pasien tersebut.
Triclustering method is the development of clustering method and biclustering method. Unlike clustering and biclustering that works on two-dimensional data, triclustering works on three-dimensional data that arranged in the form of a matrix consisting of observations, attributes, and contexts dimensions. Triclustering is able to group these dimensions simultaneously and form a subspace called a tricluster. This method is generally implemented in analysis of three-dimensional gene expression data to find profiles of gene expression. This data or matrix consists of genes, experimental conditions and time points dimensions. One of the triclustering algorithms, Order Preserving Triclustering (OPTricluster), is an algorithm that uses a pattern-based approach and used to analyze short time series data (3-8 time points). The OPTricluster forms the tricluster by identifying genes that have the same expression change across time points under a number of experimental conditions. The change in expression is expressed in a rank pattern which is divided based on three types of patterns, namely constant, conserved and divergent patterns. In this study, OPTricluster was implemented in gene expression data of yellow fever patients after vaccination using several scenarios with different thresholds. The scenario with the optimum threshold is indicated by the lowest average Tricluster Diffusion score. The resulting triclusters were successful in showing biological relationships among these patients, where the vaccine tending to have a more significant reaction in male patients than in female patients. In addition, anomalies were found in these patients.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library