Skip to main content
Пријава

Collected Item: “Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++”

Врста публикације

Рад у часопису

Верзија рада

објављена верзија

Језик рада

енглески

Аутор/и (Милан Марковић, Никола Николић)

Branislava Šandrih, Ranka Stanković

Наслов рада (Наслов - поднаслов)

Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++

Наслов часописа

Infotheca

Издавач (Београд : Просвета)

Faculty of Philology, University of Belgrade

Година издавања

2020

Сажетак на српском језику

U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu bibliotekarstva i informacionih nauka. Dobijeni rezultati, kao i aplikacija koja implementira metod, dostupni su on-line.

Сажетак на енглеском језику

In science, industry and many research fields, terminology is rapidly developing. Most often, a language that is “lingua franca” for most of these areas is English. As a consequence, for many fields, domain terms are conceived in English, and are later translated to other languages. In this paper, we present an approach for automatic bilingual terminology extraction for English-Serbian language pair that relies on an aligned bilingual domain corpus, a terminology extractor for a target language and a tool for chunk alignment. We examine the performance of the method on a Library and Information Science domain. The obtained results, as well as the application that implements the method, are available on-line.

Волумен/том или годиште часописа

19

Број часописа

2

Почетна страна

119

Завршна страна

138

DOI број

10.18485/infotheca.2019.19.2.6

ISSN број часописа

1450-9687

Кључне речи на српском (одвојене знаком ", ")

ekstrakcija terminologije, validacija terminologije, GIZA++, grafovi, Unitex, klasifikacija teksta

Кључне речи на енглеском (одвојене знаком ", ")

terminology extraction, terminology validation, GIZA++, graphs, Unitex, text classification

Линк

http://dx.doi.org/10.18485/infotheca.2019.19.2.6

Шира категорија рада према правилнику МПНТ

M50

Ужа категорија рада према правилнику МПНТ

М53

Степен доступности

Отворени приступ

Лиценца

Creative Commons – Attribution-Share Alike 4.0 International

Формат дигиталног објекта

.pdf
Click here to view the corresponding item.