Football terminology: compilation and transformation into OntoLex-Lemon resource

Објеката

Тип
Рад у зборнику
Верзија рада
објављена
Језик
српски
Креатор
Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević
Извор
LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria
Уредник
Carlvalho, Sara et al.
Издавач
Lisabon : NOVA FCSH - CLUNL
Датум издавања
2023
Сажетак
У овом раду представља се пројекат који је у развоју, креирање првог дигиталног фудбалског речника на српском језику, као и да демонстрација примене модела OntoLex и љегових модула. OntoLex-FrAC модул укључује информације о учесталости и примерима употребе екстрахованих из корпуса. У овом случају, креиран је корпус за специфичан домен под називом СрФудКо, који садржи чланке вести о фудбалу на српском језику. Вишечлани термини аутоматски су екстраховани из српског корпуса, а затим ручно евалуирани и класификовани као спортски или фудбалски. Лексикон флексија је произведен и трансформисан у OntoLex формат, информације о фреквенцији из фазе екстракције су додељене лексичким записима. Коначно, неколико лексичких записа је повезано са потврдама из корпуса.
The purpose of this article is to present the ongoing project which is the compilation of the first digital Football dictionary in the Serbian language, as well as to demonstrate the application of OntoLex and associated modules. The OntoLex-FrAC module for a football-specific dictionary includes information about frequency, attestation, and corpus usage. In this case, a domain-specific corpus was created by the name of SrFudKo, containing news articles about football in Serbian. Multi-word terms were automatically extracted from the Serbian corpus, then manually evaluated and classified as either sport or football-related. An inflection lexicon was produced and transformed into the OntoLex format, Frequency information from the extraction phase was assigned to the entries. Finally, a few lexical entries were linked with the attestations from the corpus.
почетак странице
634
крај странице
645
doi
10.34619/srmk-injj
isbn
978-989-54081-5-3
Subject
повезани отворени подаци, корпус, СрФудКо, OntoLex, OntoLex-FrAC
linked open data, corpus, SrFudKo, OntoLex, OntoLex-FrAC
Шира категорија рада
М30
Ужа категорија рада
М33
Права
Отворени приступ
Лиценца
Creative Commons – Attribution 4.0 International
Формат
.pdf
Медија
LDK2023_vf-634-645.pdf

Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević. "Football terminology: compilation and transformation into OntoLex-Lemon resource" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj

This item was submitted on 5. октобар 2023. by [anonymous user] using the form “Рад у зборнику радова” on the site “Радови”: http://romeka.rgf.rs/s/repo

Click here to view the collected data.