OPTIMASI ALGORITMA SIMPLIFIED LESK DENGAN SPACY UNTUK WORD SENSE DISAMBIGUATION PADA KALIMAT BAHASA INGGRIS

Authors

DOI:

https://doi.org/10.31294/khatulistiwa.v12i1.10250

Keywords:

WSD; NLP; Simplified Lesk

Abstract

Word Sense Disambiguation (WSD) merupakan salah satu permasalahan
utama dalam pengolahan bahasa alami yang bertujuan untuk menentukan
arti yang tepat dari kata-kata yang memiliki makna ganda dalam konteks
kalimat. Dalam penelitian ini, kami memperkenalkan sebuah pendekatan
baru dalam peningkatan akurasi WSD dalam bahasa Inggris dengan
mengoptimalkan algoritma Lesk menggunakan library Spacy. Algoritma
Simplified Lesk telah diketahui memiliki batasan dalam menangani berbagai
pemrosesan kata dalam kalimat. Spacy adalah library natural language
processing (NLP) yang sangat kuat, khususnya untuk pemrosesan bahasa
Inggris. Selain fungsi dasar seperti tokenizer, perpustakaan ini juga
mendukung fungsi NLP yang bergantung pada solusi berbasis pembelajaran
mesin seperti part-of-speech (POS) tagging, Named Entity Recognition (NER),
dan parsing dependency. Penelitian sebelumnya menunjukkan nilai recall,
presisi, dan f-measure sebesar 40% masing-masing. Dengan memanfaatkan
kemampuan Spacy, kami berhasil meningkatkan nilai recall, presisi, dan f
measure menjadi 45% masing-masing pada sejumlah dataset uji.

 

Downloads

Published

2024-06-01

Issue

Section

Articles