Collected Item: “Old or New, We Repair, Adjust and Alter (Texts)”
Врста публикације
Рад у часопису
Верзија рада
објављена верзија
Језик рада
енглески
Аутор/и (Милан Марковић, Никола Николић)
Cvetana Krstev, Ranka Stanković
Наслов рада (Наслов - поднаслов)
Old or New, We Repair, Adjust and Alter (Texts)
Наслов часописа
Infotheca
Издавач (Београд : Просвета)
Faculty of Philology, University of Belgrade
Година издавања
2020
Сажетак на српском језику
U ovom radu predstavljamo kako se e-rečnici i kaskade transduktora konačnih stanja implementirani u alatu Unitex mogu koristiti za rešavanje tri problema transformacije teksta: ispravljanje tekstova nakon OCR-a, vraćanje dijakritičkih znakova i prebacivanje između različitih jezičkih varijanti.
Сажетак на енглеском језику
In this paper we present how e-dictionaries and cascades of finite-state transducers as implemented in Unitex can be used to solve three text transformation problems: correction of texts after OCR, restoration of diacritics and switching between different language variants.
Волумен/том или годиште часописа
19
Број часописа
2
Почетна страна
61
Завршна страна
80
DOI број
10.18485/infotheca.2019.19.2.3
ISSN број часописа
1450-9687
Кључне речи на српском (одвојене знаком ", ")
ispravka teksta, OCR greške, restauracija dijakritika , jezičke varijante, elektronski rečnik, transduktori konačnih stanja
Кључне речи на енглеском (одвојене знаком ", ")
text correction, OCR errors, diacritic restoration, language variants, electronic dictionary, finite-state transducers
Линк
http://dx.doi.org/10.18485/infotheca.2019.19.2.3
Шира категорија рада према правилнику МПНТ
M50
Ужа категорија рада према правилнику МПНТ
М53
Степен доступности
Отворени приступ
Лиценца
Creative Commons – Attribution-Share Alike 4.0 International
Формат дигиталног објекта
.pdf