Skip to main content

Collected Item: “Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++”

Врста публикације

Рад у часопису

Верзија рада

објављена верзија

Језик рада


Аутор/и (Милан Марковић, Никола Николић)

Branislava Šandrih, Ranka Stanković

Наслов рада (Наслов - поднаслов)

Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++

Наслов часописа


Издавач (Београд : Просвета)

Faculty of Philology, University of Belgrade

Година издавања


Сажетак на српском језику

U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu bibliotekarstva i informacionih nauka. Dobijeni rezultati, kao i aplikacija koja implementira metod, dostupni su on-line.

Сажетак на енглеском језику

In science, industry and many research fields, terminology is rapidly developing. Most often, a language that is “lingua franca” for most of these areas is English. As a consequence, for many fields, domain terms are conceived in English, and are later translated to other languages. In this paper, we present an approach for automatic bilingual terminology extraction for English-Serbian language pair that relies on an aligned bilingual domain corpus, a terminology extractor for a target language and a tool for chunk alignment. We examine the performance of the method on a Library and Information Science domain. The obtained results, as well as the application that implements the method, are available on-line.

Волумен/том или годиште часописа


Број часописа


Почетна страна


Завршна страна


DOI број


ISSN број часописа


Кључне речи на српском (одвојене знаком ", ")

ekstrakcija terminologije, validacija terminologije, GIZA++, grafovi, Unitex, klasifikacija teksta

Кључне речи на енглеском (одвојене знаком ", ")

terminology extraction, terminology validation, GIZA++, graphs, Unitex, text classification


Шира категорија рада према правилнику МПНТ


Ужа категорија рада према правилнику МПНТ


Степен доступности

Отворени приступ


Creative Commons – Attribution-Share Alike 4.0 International

Формат дигиталног објекта

Click here to view the corresponding item.