Collected Item: “Annotation of the Serbian ELTeC Collection”
Врста публикације
Рад у часопису
Верзија рада
објављена верзија
Језик рада
енглески
Аутор/и (Милан Марковић, Никола Николић)
Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić
Наслов рада (Наслов - поднаслов)
Annotation of the Serbian ELTeC Collection
Наслов часописа
Infotheca
Издавач (Београд : Просвета)
Faculty of Philology, University of Belgrade
Година издавања
2021
Сажетак на српском језику
Ovaj rad predstavlja takozvano izdanje nivoa 2 kolekcije tekstova SrpELTeC razvijene u okviru aktivnosti Radne grupe 2 – Metode i alati COST akcije CA 16204 (Distant Reading for European Literary History) i njene specifikacije šeme. Izdanje nivoa 2 je nastavak izdanja nivoa 1, koje se koristi kao ulaz za morfosintaksičke i NER anotacije romana. Srpska obrada nivoa-2 je navedena kroz potrebne korake, uključujući metode i alate koji se koriste u tom procesu. Neki statistički podaci iz srpske kolekcije nivoa 2 ELTeC-a daju zanimljiv uvid u sadržaj kolekcije.
Сажетак на енглеском језику
This paper presents the so-called level-2 edition of SrpELTeC collection developed within the activities of Working Group 2 - Methods and Tools of the COST Action CA 16204 (Distant Reading for European Literary History), and its schema specification. The level-2 edition is a follow-up of the level-1 edition, which is used as input for morphosyntactic and NER annotation of novels. The Serbian level-2 pipeline outlines steps required for production of level-2, including methods and tools used in the process. Some statistics drawn from the Serbian ELTeC level-2 sub-collection brings an interesting insight into collection content.
Волумен/том или годиште часописа
21
Број часописа
2
Почетна страна
43
Завршна страна
59
DOI број
10.18485/infotheca.2021.21.2.3
ISSN број часописа
1450-9687
Кључне речи на српском (одвојене знаком ", ")
udaljeno čitanje, literarni korpus, tagiranje, prepoznavanje imenovanih entiteta, lematizacija, ELTeC
Кључне речи на енглеском (одвојене знаком ", ")
distant reading, literary corpus, tagging, NER, lemmatization, ELTeC
Линк
http://dx.doi.org/10.18485/infotheca.2021.21.2.3
Шира категорија рада према правилнику МПНТ
M50
Ужа категорија рада према правилнику МПНТ
М51
Степен доступности
Отворени приступ
Лиценца
Creative Commons – Attribution 4.0 International
Формат дигиталног објекта
.pdf