STUDI KOMPARASI SPELLING CORRECTION MENGGUNAKAN ALGORITMA DAMERAU-LEVENSHTEIN DISTANCE DAN JARO-WINKLER DISTANCE UNTUK MENDETEKSI TYPOGRAPHICAL ERROR BAHASA INDONESIA

DEA, FANIA and Ferzha, Putra Utama and Ruvita, Faurina (2023) STUDI KOMPARASI SPELLING CORRECTION MENGGUNAKAN ALGORITMA DAMERAU-LEVENSHTEIN DISTANCE DAN JARO-WINKLER DISTANCE UNTUK MENDETEKSI TYPOGRAPHICAL ERROR BAHASA INDONESIA. Undergraduated thesis, Fakultas Teknik.

[img] Archive (Thesis informatika)
Dea Fania (G1A018073) Naskah Skripsi - Dea Fania.pdf - Bibliography
Restricted to Repository staff only
Available under License Creative Commons GNU GPL (Software).

Download (2MB)

Abstract

Dalam Natural Language Processing salah satu tugas penting yang harus ditangani adalah permasalahan typo. Kesalahan ejaan atau typographical error (typo) merupakan kesalahan penulisan kata yang dapat mengubah arti dari suatu kata bahkan arti dari suatu kalimat. Oleh karena itu, dibutuhkan suatu metode yang bertujuan untuk memudahkan proses pengoreksian ejaan (spelling correction). Pada penelitian ini mengkomparasikan 2 algoritma spelling correction untuk membandingkan akurasi yang terbaik antara keduanya, yaitu Damerau Levenshtein Distance dan Jaro Winkler Distance dengan menggunakan data uji sebanyak 120 kata yang terbagi dari 4 jenis kesalahan typographical error yaitu 30 kata insertion, 30 kata subtitution, 30 kata deletion dan 30 kata transposition. Perbandingan akrasi didapatkan dari nilai Mean Reciprocal Rank (MRR). Proses perhitungan akurasi untuk mendapatkan nilai MRR menggunakan metode bigram untuk memecah kata, metode tf-idf untuk pembobotan karakter dan menggunakan cosine similiarity untuk penentuan rangking kandidat. Hasil pengujian berdasarkan nilai MRR, Damerau�Levenshtein Distance lebih tinggi dibandingkan dengan Jaro Winkler Distance pada 4 kesalahan jenis typo, yaitu pada insertion 95%, subtitution 93,6%, deletion 87, 33% dan transposition 96,33%. Sedangkan Jaro Winkler Distance mendapatkan nilai, insertion 33,1%, Subtitution 53,13%, deletion 47,73% dan transposition 36,03%. Luaran yang dihasilkan pada penelitian ini adalah sistem pendeteksi typo berbasis website. Kata kunci : spelling correction, typographical error, Damerau Levenshtein Distance, Jaro Winkler Distance, Mean Reciprocal Rank,

Item Type: Thesis (Undergraduated)
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Engineering > Department of Informatics Engineering
Depositing User: 58 lili haryanti
Date Deposited: 14 Jun 2024 08:59
Last Modified: 14 Jun 2024 08:59
URI: http://repository.unib.ac.id/id/eprint/18406

Actions (login required)

View Item View Item