Skip to main content
Пријава

Collected Item: “Football terminology: compilation and transformation into OntoLex-Lemon resource”

Врста публикације

Рад у зборнику

Верзија документа

објављена

Језик

српски

Аутор/и (Милан Марковић, Никола Николић)

Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević

Наслов рада (Наслов - поднаслов)

Football terminology: compilation and transformation into OntoLex-Lemon resource

Назив конференције (зборника), место и датум одржавања

LDK 2023 – 4th Conference on Language, Data and Knowledge

Уредник/ци зборника

Carlvalho, Sara et al.

Издавач (Београд : Просвета)

NOVA FCSH - CLUNL

Година издавања

2023

Сажетак рада на српском језику

У овом раду представља се пројекат који је у развоју, креирање првог дигиталног фудбалског речника на српском језику, као и да демонстрација примене модела OntoLex и љегових модула. OntoLex-FrAC модул укључује информације о учесталости и примерима употребе екстрахованих из корпуса. У овом случају, креиран је корпус за специфичан домен под називом СрФудКо, који садржи чланке вести о фудбалу на српском језику. Вишечлани термини аутоматски су екстраховани из српског корпуса, а затим ручно евалуирани и класификовани као спортски или фудбалски. Лексикон флексија је произведен и трансформисан у OntoLex формат, информације о фреквенцији из фазе екстракције су додељене лексичким записима. Коначно, неколико лексичких записа је повезано са потврдама из корпуса.

Сажетак рада на енглеском језику

The purpose of this article is to present the ongoing project which is the compilation of the first digital Football dictionary in the Serbian language, as well as to demonstrate the application of OntoLex and associated modules. The OntoLex-FrAC module for a football-specific dictionary includes information about frequency, attestation, and corpus usage. In this case, a domain-specific corpus was created by the name of SrFudKo, containing news articles about football in Serbian. Multi-word terms were automatically extracted from the Serbian corpus, then manually evaluated and classified as either sport or football-related. An inflection lexicon was produced and transformed into the OntoLex format, Frequency information from the extraction phase was assigned to the entries. Finally, a few lexical entries were linked with the attestations from the corpus.

Почетна страна рада

634

Завршна страна рада

645

DOI број

10.34619/srmk-injj

ISBN број изворне публикације

978-989-54081-5-3

Кључне речи на српском (одвојене знаком ", ")

повезани отворени подаци, корпус, СрФудКо, OntoLex, OntoLex-FrAC

Кључне речи на енглеском (одвојене знаком ", ")

linked open data, corpus, SrFudKo, OntoLex, OntoLex-FrAC

Линк

http://hdl.handle.net/10362/156751

Шира категорија рада према правилнику МПНТ

М30

Ужа категорија рада према правилнику МПНТ

М33

Ниво приступа

Отворени приступ

Лиценца

Creative Commons – Attribution 4.0 International

Формат датотеке

.pdf
Click here to view the corresponding item.