Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 66220 dokumen yang sesuai dengan query
cover
Fina Haryanti Azzahra
"Satuan lingual -e bahasa Jawa memiliki dua variasi (alomorf), yaitu -e dan -ne. Berdasarkan buku Tata Bahasa Jawa Mutakhir, secara umum, alomorf -e dapat melekat pada kata berakhiran fonem konsonan dan alomorf -ne dapat melekat pada kata berakhiran fonem vokal. Akan tetapi, dalam data bahasa Jawa di Cirebon, terdapat alomorf -e dan -ne yang sama-sama dapat melekat pada kata berakhiran fonem vokal. Berdasarkan latar belakang tersebut, penelitian ini bertujuan untuk menjelaskan pengaruh fonem akhir kata terhadap alomorf -e dan -ne dalam bahasa Jawa di Cirebon dengan ragam sumber data yang berbeda. Penelitian ini menggunakan pendekatan kualitatif yang bersifat deskriptif. Sumber data ragam tulis yang digunakan adalah buku (BK) Kumpulan Jogregan dan Demang Karang Kletak (Naskah Drama Cerbonan). Sumber data ragam lisan yang digunakan berupa wawancara (WR) dan obrolan WhatsApp (WA) berbahasa Jawa di Cirebon. Pengumpulan data BK dilakukan dengan cara memindai teks dalam bentuk digital. Data WR dikumpulkan dengan melakukan perekaman dan wawancara yang kemudian ditrankripsi menggunakan ELAN. Data WA dikumpulkan menggunakan fitur ekspor riwayat obrolan. Penyediaan data diproses menggunakan Antconc. Data pada penelitian ini adalah kata-kata berakhiran satuan lingual -e. Analisis dilakukan berdasarkan fonem akhir kata, suku kata, dan kategori. Penelitian ini menunjukkan bahwa -e bahasa Jawa di Cirebon tidak dipengaruhi oleh fonem akhir kata yang dilekati, sedangkan -ne mendapat pengaruh. Satuan lingual -e yang melekat pada fonem vokal mempengaruhi fonotaktik bahasa Jawa dan membentuk deret vokal baru.

Lingual constituents -e Javanese in Cirebon has two variations (allomorphs), there are -e and -ne. Based on Tata Bahasa Jawa Mutakhir book, the -e allomorph generally can be attached to words ending by consonant phoneme, while the -ne allomorph can be attached to words ending by vowel phoneme. However, data from the Javanese language in Cirebon, there are -e and -ne allomorphs which can be attached to words ending by vowel phonemes. Based on this background, this research aims to explain the influence of phonemes in the ending of words towards -e and -ne allomorphs Javanese in Cirebon using a variety of different data sources. This research uses a descriptive qualitative approach. The written variety data sources are books (BK) Kumpulan Jogregan dan Demang Karang Kletak (Naskah Drama Cerbonan). The verbal data sources are interviews (WR) and WhatsApp chats (WA) that used Javanese in Cirebon. BK data collection is carried out by scanning text in digital form. WR data was collected by recording and interviewing which was then transcribed using ELAN. WA data is collected using the chat history export feature. Data provision is processed using AntConc. The data in this study are words ending by the lingual constituents -e. Analysis was carried out based on phonemes in the end of words, syllables, and categories. This research shows that -e in the Javanese language in Cirebon is not influenced by the phoneme of words ending that attached to, while -ne is influenced. The lingual constituents -e that attached to the vowel phoneme, influences the phonotactics of the Javanese language and forms a new vowel series."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Fadli Aulawi Al Ghiffari
"Penelitian ini bertujuan untuk membangun model dependency parser untuk bahasa Jawa menggunakan pendekatan cross-lingual transfer learning. Metode transfer learning dipilih untuk mengatasi kurangnya dataset yang tersedia untuk proses training model pada bahasa Jawa yang merupakan low-resource language. Model dibangun menggunakan arsitektur encoder-decoder, tepatnya menggunakan gabungan dari self-attention encoder dan deep biaffine decoder. Terdapat tiga skenario yang diuji yaitu model tanpa transfer learning, model dengan transfer learning, dan model dengan hierarchical transfer learning. Metode transfer learning menggunakan bahasa Indonesia, bahasa Korea, bahasa Kroasia, dan bahasa Inggris sebagai source language. Sementara metode hierarchical transfer learning menggunakan bahasa Prancis, bahasa Italia, dan bahasa Inggris sebagai source language tahap satu, serta bahasa Indonesia sebagai source language tahap dua (intermediary language). Penelitian ini juga mengujikan empat word embedding yaitu fastText, BERT Jawa, RoBERTa Jawa, dan multilingual BERT. Hasilnya metode transfer learning secara efektif mampu menaikkan performa model sebesar 10%, di mana model tanpa transfer learning yang memiliki performa awal unlabeled attachment score (UAS) sebesar 75.87% dan labeled attachment score (LAS) sebesar 69.04% mampu ditingkatkan performanya hingga mencapai 85.84% pada UAS dan 79.22% pada LAS. Skenario hierarchical transfer learning mendapatkan hasil yang lebih baik daripada transfer learning biasa, namun perbedaannya tidak cukup signifikan.

This research aims to develop a Javanese dependency parser model using a cross-lingual transfer learning approach. The transfer learning method was chosen to overcome the lack of available datasets for the model training process in Javanese, a low-resource language. The model uses an encoder-decoder architecture, precisely combining a self-attention encoder and a deep biaffine decoder. Three scenarios are experimented with: a model without transfer learning, a model with transfer learning, and a model with hierarchical transfer learning. The transfer learning process uses Indonesian, Korean, Croatian, and English as source languages. In contrast, the hierarchical transfer learning process uses French, Italian, and English as the first-stage source languages and Indonesian as the second-stage source language (intermediary language). This research also experimented with four word embedding types: fastText, Javanese BERT, Javanese RoBERTa, and multilingual BERT. The results show that the transfer learning method effectively improves the model’s performance by 10%, where the model without transfer learning has an initial unlabeled attachment score (UAS) performance of 75.87% and labeled attachment score (LAS) of 69.04% can be increased to 85.84% in UAS and 79.22% in LAS. Hierarchical transfer learning has a slightly better result than standard transfer learning, but the difference is insignificant."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dewa Ngakan Gede Anom
"Penelitian ini membahas tentang satuan lingual ?e yang terdapat pada teks Cantakaparwa. Satuan lingual ?e tersebut dibagi menurut varian, kategori, dan peranannya. Metode penelitian yang digunakan pada penelitian adalah metode deskriptif analisis. Penelitian ini bertujuan untuk melihat apa saja varian, kategori, dan peranan satuan lingual ?e yang terdapat pada teks Cantakaparwa.
Hasil penelitian memperlihatkan bahwa terdapat beberapa bentuk varian, kategori dan peranan satuan lingual ?e.
This research discuss about lingual unit of ?e in the Cantakaparwa manuscript. lingual unit of ?e are divided according to variants, categories, and roles. The research method used in research is descriptive method of analysis. This research aims to see what variants, categories, and the role of lingual unit of ?e in the Cantakaparwa manuscript.
The results show that there are several variant forms, categories and the role of lingual unit of ?e.
"
Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2012
S42697
UI - Skripsi Open  Universitas Indonesia Library
cover
Gabriel Enrique
"Part-of-speech tagging, adalah task di bidang Natural Language Processing di mana setiap kata di dalam suatu kalimat dikategorisasi ke dalam kategori parts-of-speech (kelas kata) yang sesuai. Pengembangan model POS tagger menggunakan pendekatan machine learning membutuhkan dataset dengan ukuran yang besar. Namun, dataset POS tagging tidak selalu tersedia dalam jumlah banyak, seperti dataset POS tagging untuk bahasa Jawa. Dengan jumlah data yang sedikit, model POS tagger yang dilatih kemungkinan tidak akan memiliki performa yang optimal. Salah satu solusinya adalah dengan menggunakan pendekatan cross-lingual transfer learning, di mana model dilatih menggunakan suatu source language pada suatu task agar dapat menyelesaikan task yang sama pada suatu target language. Penelitian ini bertujuan untuk menguji performa pre-trained language model (mBERT, XLM-RoBERTa, IndoBERT) dan melihat pengaruh cross-lingual transfer learning terhadap performa pre-trained language model untuk POS tagging bahasa Jawa. Percobaan yang dilakukan menggunakan lima source language, yaitu bahasa Indonesia, bahasa Inggris, bahasa Uighur, bahasa Latin, dan bahasa Hungaria, serta lima jenis model, yaitu fastText + LSTM, fastText + BiLSTM, mBERT, XLM-RoBERTa, dan IndoBERT; sehingga secara keseluruhan ada total 35 jenis model POS tagger. Model terbaik yang dilatih tanpa pendekatan cross-lingual transfer learning dibangun menggunakan IndoBERT, dengan akurasi sebesar 86.22%. Sedangkan, model terbaik yang dilatih menggunakan pendekatan cross-lingual transfer learning dalam bentuk dua kali fine-tuning, pertama menggunakan source language dan kedua menggunakan bahasa Jawa, sekaligus model terbaik secara keseluruhan dibangun menggunakan XLM-RoBERTa dan bahasa Indonesia sebagai source language, dengan akurasi sebesar 87.65%. Penelitian ini menunjukkan bahwa pendektan cross-lingual transfer learning dalam bentuk dua kali fine-tuning dapat meningkatkan performa model POS tagger bahasa Jawa, dengan peningkatan akurasi sebesar 0.21%–3.95%.

Part-of-speech tagging is a task in the Natural Language Processing field where each word in a sentence is categorized into its respective parts-of-speech categories. The development of POS tagger models using machine learning approaches requires a large dataset. However, POS tagging datasets are not always available in large quantities, such as the POS tagging dataset for Javanese. With a low amount of data, the trained POS tagger model may not have optimal performance. One of the solution to this problem is using the cross-lingual transfer learning approach, where a model is trained using a source language for a task so that it can complete the same task on a target language. This research aims to test the performance of pre-trained language models (mBERT, XLM-RoBERTa, IndoBERT) and to see the effects of cross-lingual transfer learning on the performance of pre-trained language models for Javanese POS tagging. The experiment uses five source languages, which are Indonesian, English, Uyghur, Latin, and Hungarian, as well as five models, which are fastText + LSTM, fastText + BiLSTM, mBERT, XLM-RoBERTa, and IndoBERT; hence there are 35 POS tagger models in total. The best model that was trained without cross-lingual transfer learning approach uses IndoBERT, with an accuracy of 86.22%. While the best model that was trained using a cross-lingual transfer learning approach, implemented using a two fine-tuning process, first using the source language and second using Javanese, as well as the best model overall uses XLM-RoBERTa and Indonesian as the source language, with an accuracy of 87.65%. This research shows that the cross-lingual transfer learning approach, implemented using the two fine-tuning process, can increase the performance of Javanese POS tagger models, with a 0.21%–3.95% increase in accuracy.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
MUL 9 (1-2)2010
Artikel Jurnal  Universitas Indonesia Library
cover
Sudaryanto
Yogyakarta: Gadjah Mada University Press, 1994
499.222 SUD p
Buku Teks SO  Universitas Indonesia Library
cover
Rahmawati
"ABSTRAK
Morfem -e dalam bahasa Jawa yang mempunyai dua alomorf [-e] dan [-ne] mempunyai dua fungsi, diantaranya adalah sebagai pronomina posesif, penanda posesif, penentu, dan pembentuk nomina. Akan tetapi, belum banyak ditemukan penelitian yang membahas fungsi-fungsi lain -e dalam teks. Oleh sebab itu penelitian tentang fungsi morfem -e dalam bahasa Jawa dilakukan. Tujuan penelitian ini adalah untuk mengidentifikasi fungsi morfem -e dalam bahasa Jawa khususnya dalam teks naratif pada majalah Panjebar Semangat. Metode yang digunakan dalam penelitian ini adalah metode kualitatif. Data pada penelitian ini adalah kata, dan frasa yang dilekati oleh morfem -e. Program aplikasi AntConc digunakan untuk mengumpulkan data. Data tersebut kemudian dianalisis dengan mengidentifikasi fungsinya. Dari analisis data, morfem -e dalam teks naratif bahasa Jawa mempunyai empat fungsi yaitu pronomina posesif, penanda posesif, penentu, dan pembentuk nomina. Fungsi yang paling banyak ditemukan adalah fungsi penanda posesif, diikuti fungsi pronomina posesif, penentu, pembentuk nomina dan penanda posesif, dan pembentuk nomina dan pronomina posesif.

ABSTRACT
Morpheme -e in Javanese has two allomorphs, they are [-e] and [-ne]. This morpheme has more than one functions, they are possessive pronoun, possessive marker, definite marker, and nominalizer. Therefore, this research is conducted in order to identify the functions of -e in Javanese, especially in narrative text in Panjebar Semangat magazine. The qualitative method is applied in this research. The data of this reserch are words, and phrases which are attached by morpheme -e . AntConc program applications is used in order to collected the data. The data then analyzed by identified the functions. From the analyzed data, morpheme -e in narrative text in Javanese has four functions, they are possessive pronoun, possessive marker, definite marker, and nominalizer. The functions that mostly found is possessive marker followed by possessive pronoun, definite marker, nominalizer and possessive marker, and nominalizer and possessive pronoun."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Heninggar Septiantri
"Ambiguitas adalah masalah yang seringkali ditemui dalam pemrosesan bahasa alami oleh komputer. Word Sense Disambiguation (WSD) adalah upaya untuk menentukan makna yang tepat dari sebuah kata yang ambigu. Berbagai penelitian tentang WSD telah banyak dikerjakan, namun penelitian WSD untuk bahasa Indonesia belum banyak dilakukan. Ketersediaan korpus paralel berbahasa Inggris-Indonesia dan sumber pengetahuan bahasa berupa WordNet bahasa Inggris dan bahasa Indonesia dapat dimanfaatkan untuk menyediakan data pelatihan untuk WSD dengan metode Cross-Lingual WSD (CLWSD). Data pelatihan ini kemudian dijadikan input untuk klasifikasi dengan algoritma Naive Bayes, sehingga model klasifikasinya dapat digunakan untuk melakukan monolingual WSD untuk bahasa Indonesia.
Evaluasi klasifikasi menunjukkan rata-rata akurasi hasil klasifikasi lebih tinggi dari baseline. Penelitian ini juga menggunakan stemming dan stopwords removal untuk mengetahui bagaimana efeknya terhadap klasifikasi. Penggunaan stemming menaikkan rata-rata akurasi, sedangkan penerapan stopwords removal menurunkan rata-rata akurasi. Namun pada kata yang memiliki dua makna dalam konteks yang cukup jelas berbeda, stemming dan stopwords removal dapat menaikkan rata-rata akurasi.

Ambiguity is a problem we frequently face in natural languange processing. Word Sense Disambiguation (WSD) is an attempt to decide the correct sense of an ambiguous word. Various research in WSD have been conducted, but research in WSD for Indonesian Language is still rare to find. The availability of parallel corpora in English and Indonesian language and WordNet for both language can be used to provide training data for WSD with Cross-Lingual WSD (CLWSD) method. This training data can be used as input to the classification process using Naive Bayes classifier.
The model resulted by the classification process is then used to do monolingual WSD for Indonesian language. The whole process in this research results in higher accuracy compared to baseline. This research also includes the use of stemming and stopwords removal. The effect of stemming is increasing the average accuracy, whereas stopwords removal is decreasing average accuracy. Nevertheless, for ambiguous words that have distinct context of usage, the use of stemming and stopwords removal can increase average accuracy."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2013
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Faisal Adi Soesatyo
"Pendekatan transfer learning telah digunakan di beragam permasalahan, khususnya low-resource language untuk meningkatkan performa model di masing-masing permasalahan tersebut. Fokus pada penelitian ini ingin menyelidiki apakah pendekatan cross-lingual transfer learning mampu meningkatkan performa pada model constituency parsing bahasa Indonesia. Constituency parsing adalah proses penguraian kalimat berdasarkan konstituen penyusunnya. Terdapat dua jenis label yang disematkan pada konstituen penyusun tersebut, yakni POS tag dan syntactic tag. Parser model yang digunakan di penelitian ini berbasis encoder-decoder bernama Berkeley Neural Parser. Terdapat sebelas macam bahasa yang digunakan sebagai source language pada penelitian ini, di antaranya bahasa Inggris, Jerman, Prancis, Arab, Ibrani, Polandia, Swedia, Basque, Mandarin, Korea, dan Hungaria. Terdapat dua macam dataset bahasa Indonesia berformat Penn Treebank yang digunakan, yakni Kethu dan ICON. Penelitian ini merancang tiga jenis skenario uji coba, di antaranya learning from scratch (LS), zero-shot transfer learning (ZS), dan transfer learning dengan fine-tune (FT). Pada dataset Kethu terdapat peningkatan F1 score dari 82.75 (LS) menjadi 84.53 (FT) atau sebesar 2.15%. Sementara itu, pada dataset ICON terjadi penurunan F1 score dari 88.57 (LS) menjadi 84.93 (FT) atau sebesar 4.11%. Terdapat kesamaan hasil akhir di antara kedua dataset tersebut, di mana masing-masing dataset menyajikan bahwa bahasa dari famili Semitic memiliki skor yang lebih tinggi dari famili bahasa lainnya.

The transfer learning approach has been used in various problems, especially the low-resource languages, to improve the model performance in each of these problems. This research investigates whether the cross-lingual transfer learning approach manages to enhance the performance of the Indonesian constituency parsing model. Constituency parsing analyzes a sentence by breaking it down by its constituents. Two labels are attached to these constituents: POS tags and syntactic tags. The parser model used in this study is based on the encoder-decoder named the Berkeley Neural Parser. Eleven languages are used as the source languages in this research, including English, German, French, Arabic, Hebrew, Polish, Swedish, Basque, Chinese, Korean, and Hungarian. Two Indonesian PTB treebank datasets are used, i.e., the Kethu and the ICON. This study designed three types of experiment scenarios, including learning from scratch (LS), zero-shot transfer learning (ZS), and transfer learning with fine-tune (FT). There is an increase in the F1 score on the Kethu from 82.75 (LS) to 84.53 (FT) or 2.15%. Meanwhile, the ICON suffers a decrease in F1 score from 88.57 (LS) to 84.93 (FT) or 4.11%. There are similarities in the final results between the two datasets, where each dataset presents that the languages from the Semitic family have a higher score than the other language families."
Depok;;: Fakultas Ilmu Komputer Universitas Indonesia;;, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ilham Saiful Mubin
"ABSTRAK
Penelitian ini membahas medan makna rasa heran dalam bahasa Jawa. Objek kajian pada penelitian ini adalah kata-kata yang memiliki makna rasa heran. Kata-kata tersebut dicari dalam majalah Panjebar Semangat edisi tahun 2012 terutama pada rubrik, Cerita Sambung, Cerita Cekak, Alaming Lelembut, Gelanggang Remaja, dan Wahana Bocah. Penelitian ini bertujuan untuk mengetahui kata-kata yang bermedan makna rasa heran dalam bahasa Jawa, mengetahui komponen makna, dan mengetahui relasi makna. Penelitian ini menggunakan teori medan makna, komponen makna, dan relasi makna. Metode penelitian yang digunanakan adalah penelitian kualitatif. Metode penulisan dalam peneletian ini adalah deskriptif-analitis. Langkah pertama dalam menganalisis data adalah menemukan komponen makna yang dilanjutkan dengan menganalisis hubungan makna dari masing-masing kata. Hasil penelitian menunjukkan ada 22 kata yang masuk dalam medan makna rasa heran. Dari kedua puluh dua kata kata tersebut menunjukkan adanya hubungan sinonimi.

ABSTRACT
This thesis analizes semantic domain of a sense of wonder in the Javanese language. Object in this thesis are the words that have meaning sense of wonder. The words are searched in Panjebar Semangat magazine of the 2012th edition especially on the rubric, Cerita Sambung, Cerita Cekak, Alaming Lelembut, Gelanggang Remaja, and Wahana Bocah. The purposes to find out words from semantic domain of a sense of wonder in the Javanese language, the semantic components, and the semantic relation. This thesis uses semantic domain theory, the semantic component theory, and the semantic relation theory. The method for this thesis is a qualitative research. The method of writing is descriptive-analytical. The first step in analyzing the data is to find the semantic components and then analyzing the semantic relation of each words. The results of this thesis show there are twenty-two words that entering the semantic domain of a sense of wonder. The twenty-two words indicate the synonymy."
2014
S53154
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>