Skip to main content
Пријава

Collected Item: “Old or New, We Repair, Adjust and Alter (Texts)”

Врста публикације

Рад у часопису

Верзија рада

објављена верзија

Језик рада

енглески

Аутор/и (Милан Марковић, Никола Николић)

Cvetana Krstev, Ranka Stanković

Наслов рада (Наслов - поднаслов)

Old or New, We Repair, Adjust and Alter (Texts)

Наслов часописа

Infotheca

Издавач (Београд : Просвета)

Faculty of Philology, University of Belgrade

Година издавања

2020

Сажетак на српском језику

U ovom radu predstavljamo kako se e-rečnici i kaskade transduktora konačnih stanja implementirani u alatu Unitex mogu koristiti za rešavanje tri problema transformacije teksta: ispravljanje tekstova nakon OCR-a, vraćanje dijakritičkih znakova i prebacivanje između različitih jezičkih varijanti.

Сажетак на енглеском језику

In this paper we present how e-dictionaries and cascades of finite-state transducers as implemented in Unitex can be used to solve three text transformation problems: correction of texts after OCR, restoration of diacritics and switching between different language variants.

Волумен/том или годиште часописа

19

Број часописа

2

Почетна страна

61

Завршна страна

80

DOI број

10.18485/infotheca.2019.19.2.3

ISSN број часописа

1450-9687

Кључне речи на српском (одвојене знаком ", ")

ispravka teksta, OCR greške, restauracija dijakritika , jezičke varijante, elektronski rečnik, transduktori konačnih stanja

Кључне речи на енглеском (одвојене знаком ", ")

text correction, OCR errors, diacritic restoration, language variants, electronic dictionary, finite-state transducers

Линк

http://dx.doi.org/10.18485/infotheca.2019.19.2.3

Шира категорија рада према правилнику МПНТ

M50

Ужа категорија рада према правилнику МПНТ

М53

Степен доступности

Отворени приступ

Лиценца

Creative Commons – Attribution-Share Alike 4.0 International

Формат дигиталног објекта

.pdf
Click here to view the corresponding item.