Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data
Објеката
- Тип
- Рад у зборнику
- Верзија рада
- објављена
- Језик
- енглески
- Креатор
- Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović
- Извор
- LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria
- Уредник
- Carlvalho, Sara et al.
- Издавач
- Lisabon : NOVA FCSH - CLUNL
- Датум издавања
- 2023
- Сажетак
- Овај рад описује студију случаја о генерисању повезаних података креираних на основу обечежених текстуалних корпуса коришћењем формата размене података у обради природних језика (NIF). Као основа за ово истраживање послужио је подскуп корпуса ELTeC, који се састоји од 900 романа из периода 1840-1920 за 9 европских језика. Верзија романа са коментарима, у такозваном TEI level-2 формату, трансформисана је у NIF, формат заснован на RDF/OWL који има за циљ постизање интероперабилности између алата за обраду природних језика, језичких ресурса и анотација. У овом раду представљамо наш приступ трансформацији, имплементирану процедуру, програмски код и резултате за сличне случајеве употребе.
- This paper describes a case study on the generation of Linked Data text corpora using the NLP Interchange Format (NIF). The ELTEC corpus subset, which consists of 900 novels from the period 1840-1920 for 9 European languages, served as the basis for this research. The annotated version of the novels, in the so-called TEI level-2 format, was transformed into NIF, an RDF/OWL-based format that aims to achieve interoperability between NLP tools, language resources, and annotations. In this paper, we present our approach for transformation, and the implemented pipeline, and offer the code and results for similar use cases.
- почетак странице
- 180
- крај странице
- 191
- doi
- 10.34619/srmk-injj
- isbn
- 978-989-54081-5-3
- Subject
- повезани отворени подаци, корпус, SrpELTeC, NIF
- linked open data, corpus, SrpELTeC, NIF
- Шира категорија рада
- М30
- Ужа категорија рада
- М33
- Права
- Отворени приступ
- Лиценца
- Creative Commons – Attribution 4.0 International
- Формат
- Медија
- LDK2023_vf-180-191.pdf
Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović. "Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj
This item was submitted on 5. октобар 2023. by [anonymous user] using the form “Рад у зборнику радова” on the site “Радови”: http://romeka.rgf.rs/s/repo
Click here to view the collected data.