KOMPARASI INDOBERT DAN XLM-ROBERTA DALAM DETEKSI BAHASA SARKASME PADA MEDIA DARING MOJOK.CO

ULVIA, AGUSTINA and Mochammad, Yusa and Andang, Wijanarko (2023) KOMPARASI INDOBERT DAN XLM-ROBERTA DALAM DETEKSI BAHASA SARKASME PADA MEDIA DARING MOJOK.CO. Undergraduated thesis, Fakultas Teknik.

[img] Archive (Thesis)
NASKAH_SKRIPSI_Ulvia_Agustina_G1A017063 - ulvia agustina.pdf - Bibliography
Restricted to Repository staff only
Available under License Creative Commons GNU GPL (Software).

Download (2MB)

Abstract

Penelitian ini bertujuan untuk membandingkan kinerja dua model bahasa dalam pemrosesan bahasa alami (natural language processing), yaitu IndoBERT dan XLM-RoBERTa, dalam deteksi bahasa sarkasme pada media daring Mojok.co. Penelitian ini menggunakan tiga jenis data dengan metode pelabelan yang berbeda dan jumlah yang berbeda pula. Evaluasi dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa model XLM-RoBERTa mencapai akurasi 82% pada data dengan label manual, 93% pada data dengan label manual + SSA, dan 94% pada data dengan label SSA. Sementara itu, model IndoBERT mencapai akurasi 81%, 91%, dan 95% untuk masing-masing data tersebut. Penelitian ini menemukan bahwa kedua model menunjukkan kinerja yang kompetitif dalam deteksi sarkasme pada berbagai jenis data. Meskipun demikian, ditemukan bahwa model-model ini masih mengalami overfitting ketika dilakukan training dengan jumlah epoch yang banyak, yang kemungkinan disebabkan oleh representativitas dataset dan metode pelabelan yang digunakan. Kata Kunci: Sarkasme; IndoBERT; XLM-RoBERTa; Komparasi;

Item Type: Thesis (Undergraduated)
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Engineering > Department of Informatics Engineering
Depositing User: 58 lili haryanti
Date Deposited: 30 May 2024 08:17
Last Modified: 30 May 2024 08:17
URI: http://repository.unib.ac.id/id/eprint/18297

Actions (login required)

View Item View Item