Претрага
128 items
-
A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian
Uvredljivi govor na društvenim medijima, uključujući psovke, pogrdni govor i govor mržnje, dostigao je nivo pandemije. Sistem koji bi bio u stanju da detektuje takve tekstove mogao bi da pomogne da internet i društveni mediji postanu bolji virtuelni prostor sa više poštovanja. Istraživanja i komercijalna primena u ovoj oblasti do sada su bili fokusirani uglavnom na engleski jezik. Ovaj rad predstavlja rad na izgradnji AbCoSER-a, prvog korpusa uvredljivog govora na srpskom jeziku. Korpus se sastoji od 6.436 ručno označenih ...Danka Jokić, Ranka Stanković, Cvetana Krstev, Branislava Šandrih. "A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian" in 3rd Conference on Language, Data and Knowledge (LDK 2021), MDPI AG (2021). https://doi.org/10.4230/OASIcs.LDK.2021.13
-
Dimenzionisanje deponija za ugalj
Dinko Knežević, Božo Kolonja, Ranka Stanković, Aleksandra Tomašević, Dragana Nišić. "Dimenzionisanje deponija za ugalj" in Jedanaesta međunarodna konferencija o površinskoj eksploataciji OMC, 2014, Zlatibor, 15-18 oktoba 2014, Zlatibor : Jugoskovenski komitet za površinsku eksploataciju (2014)
-
Terminological and lexical resources used to provide open multilingual educational resources
Open educational resources (OER) within BAEKTEL (Blending Academic and Entrepreneurial Knowledge in Technology enhanced learning) network will be available in different languages, mostly in the languages of Western Balkans, Russian and English. University of Belgrade (UB) hosts a central repository based on: BAEKTEL Metadata Portal (BMP), terminological web application for management, browse and search of terminological resources, web services for linguistic support (query expansion, information retrieval, OER indexing, etc.), annotation of selected resources and OER repository on local edX ...Biljana Lazić, Danica Seničić, Aleksandra Tomašević, Bojan Zlatić. "Terminological and lexical resources used to provide open multilingual educational resources" in The Seventh International Conference on eLearning (eLearning-2016), 29-30 September 2016, Belgrade, Serbia, Belgrade : Belgrade Metropolitan University (2016)
-
Споменица 1991. – 2015. година: 135 година геологије и 70 година рударства на Универзитету у Београду
главни и одговорни уредник Душан Поломчић. Споменица 1991. – 2015. година: 135 година геологије и 70 година рударства на Универзитету у Београду, Београд : Универзитет у Београду, Рударско-геолошки факултет, 2016
-
Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities
Овај рад представља активности на развоју корпуса ELEXIS-sr, српском додатку вишејезичном анотираном корпусу ELEXIS-а, који се састоји од семантичких анотација и репозиторија значења речи. ELEXIS је паралелни вишејезични анотирани корпус на десет европских језика, који може да се користи као вишејезички репер за евалуацију европских језика са мање и средње развијеним ресурсима. Фокус овог рада је на вишечланим изразима и именованим ентитетима, њиховом препознавању у скупу реченица ELEXIS-sr и поређењу са анотацијама на другим језицима. Разматрају се први кораци ...Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov. "Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
-
Hibridni sistem za planiranje i analizu ventilacije rudnika
Nikola Lilić, Ranka Stanković, Ivan Obradović. Hibridni sistem za planiranje i analizu ventilacije rudnika, Rudarsko-geološki fakultet, Univerzitet u Beogradu, 2000
-
Еоценска фауна југозападног дела Сирт басена (Либија)
Љупко Рундић, Мери Ганић (2020)... и енглеском језику у посебном реду ) Назив рада (до 12 речи, величина фонта 11, болдирано, велика слова, центрирано на српском и енглеском језику у посебном реду) Име(на) и адресу(е) институције(а), е-пошта аутора (величина фонта 9, лево равнање, на српском и енглеском језику, у фусноти) ...
... прихваћени за штампу. УПУТСТВА АУТОРИМА ЗА ПРИПРЕМУ РАДОВА 1. Радови се штампају на српском и енглеском језику у еквивалетном пуном обиму. 134 2. Превод рада на енглески језик обезбеђује аутор. Превод мора бити квалитетан јер се радови шаљу на рецензију иностраним члановима Уређивачког ...
... радови) је до 6 страна горе описаног формата. Проширени абстракт на оба језика, може имати највише до 4 стране текста. Најмање половина укупног текста кратких саопштења или апстракта такође мора бити преведена на енглески језик. 6. Припрема рукописа радова је у Microsoft Word 2003-2007 или новијим ...Љупко Рундић, Мери Ганић. "Еоценска фауна југозападног дела Сирт басена (Либија)" in Записници Српског геолошког друштва, Српско геолошко друштво (2020)
-
Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++
Branislava Šandrih, Ranka Stanković (2020)U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu ...Branislava Šandrih, Ranka Stanković. "Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.6
-
Višenamenski autonomni sistem za daljinsko praćenje parametara stanja u rudnicima i okruženju, aplikativni softver
Kričak Lazar, Rikalo Aleksandar, Negovanović Milanka, Mitrović Stojan. "Višenamenski autonomni sistem za daljinsko praćenje parametara stanja u rudnicima i okruženju, aplikativni softver" in TR33003 (2015)
-
Multiword Expressions between the Corpus and the Lexicon: Universality, Idiosyncrasy and the Lexicon-Corpus Interface
Verginica Barbu Mititelu, Voula Giouli, Kilian Evang, Daniel Zeman, Petya Osenova, Carole Tiberius, Simon Krek, Stella Markantonatou, Ivelina Stoyanova, Ranka Stankovic, Christian Chiarcos (2024)Predstavljamo trenutne aktivnosti na definisanju interfejsa leksikona i korpusa koji će služiti kao referenca u prikazu polileksemskih jedinica - višečlanih izraza - (različitih tipova - imenskih, glagolskih, itd.) u specijalizovanim leksikonima i povezivanju ovih unosa sa njihovim pojavljivanjima u korpusima. Konačni cilj je korišćenje ovakvih resursa za automatsko identifikovanje višečlanih izraza u tekstu. Uključivanje nekoliko prirodnih jezika ima za cilj univerzalnost rešenja koje nije usredsređeno na određeni jezik, kao i prilagođavanje idiosinkrazijama. Raspravljaju se izazovi u leksikografskom opisu višerečnih ...Verginica Barbu Mititelu, Voula Giouli, Kilian Evang, Daniel Zeman, Petya Osenova, Carole Tiberius, Simon Krek, Stella Markantonatou, Ivelina Stoyanova, Ranka Stankovic, Christian Chiarcos. "Multiword Expressions between the Corpus and the Lexicon: Universality, Idiosyncrasy and the Lexicon-Corpus Interface" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
-
Praktikum za vežbe iz Informatike 1
... srpski jezik. To se može učiniti izborom komande Language sa statusne linije na dnu ekrana. Na njoj je ispisan trenutno podešen jezik a u dijalogu koji se otvara može se izabrati željeni. Ovo se može uraditi i u dijalogu File/Word Options na Language kartici. Kada se izabere, npr. srpski jezik i kada ...
... okruženja lokalnim jezicima. Office jezički interfejs paket (LIP) je preveden korisnički interfejs koji se naknadno instalira i može se besplatno preuzeti. Za srpski jezik postoji podrška i za latinicu i za ćirilicu. Instalacijom ovog dodatka dobija se kompletan meni na srpskom jeziku. Kada instalirate ...
... Kod nas je jednako zastupljeno podešavanje na engleskom, kao i na srpskom jeziku. U engleskom jeziku se kao separator za decimale koristi tačka, a zarezom se odvajaju hiljade (npr. 1,444,444.55), dok je u srpskom jeziku to obrnuto (1.444.444,55). Excel očekuje da se brojevi unose u skladu sa ...Ranka Stanković, Ivan Obradović, Olivera Kitanović, Mirjana Banković. Praktikum za vežbe iz Informatike 1, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2014
-
Analiza obrazovnog sistema i kadrovskog potencijala Republike Srbije u oblasti rudarstva i geologije
Adekvatno postavljen i kontinualno unapređivan sistem obrazovanja predstavlja jasan preduslov za razvoj pojedinca, društva i države u celini. Sistem obrazovanja u Republici Srbiji davno je postavljen, a reforme nisu do kraja sprovedene. Posebno je to izraženo u visokom obrazovanju gde reforma po bolonjskom sistemu nije do kraja sprovedena ili je negativno zloupotrebljena. Trenutno je sistem obrazovanja je pod velikim pritiskom usled oštrih zahteva tržišta rada. U ovom radu je izvršena analiza obrazovnog sistema u oblasti rudarstva i geologije u ...... i sistema, korišćenje savremenih analitičkih metoda u upravljanju bazama podataka; • Jezička pismenost - poznavanje stranog jezika uz podrazumevani engleski i maternji jezik; • Održivost - razumevanje potrebe za zaštitom životne sredine, primena metoda koje minimalizuju ekološki uticaj na životnu ...Dragan Ignjatović, Stevan Đenadić, Predrag Jovančić, Filip Miletić, Jovana Mitrović . "Analiza obrazovnog sistema i kadrovskog potencijala Republike Srbije u oblasti rudarstva i geologije" in XVI Međunarodna rudarska konferencija OMC 2024, Jugoslovenski komitet za površinsku eksploataciju (2024)
-
From DELA Based Dictionary to Leximirka Lexical Database
Biljana Lazić, Mihailo Škorić (2020)In this paper, we will present an approach in transforming Serbian language Morphological dictionaries from a DELA text format to a lexical database dubbed Leximirka. Considering the benefits of storing data within a database when compared to storing them in textual documents, we will outline some of the functionality that the database has made possible. We will also show how hand-made rules that use category labels lexical entries are marked with can be used to link lexical entries. ...Biljana Lazić, Mihailo Škorić. "From DELA Based Dictionary to Leximirka Lexical Database" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.4
-
SrpCNNeL: Serbian Model for Named Entity Linking
Ovaj rad predstavlja razvoj modela za prepoznavanje i povezivanje imenovanih entiteta (NEL) sa bazom znanja Vikipodaci za srpski jezik pod nazivom SrpCNNeL. Model je obučen da prepozna i poveže sedam različitih imenovanih tipova entiteta (osobe, lokacije, organizacije, profesije, događaji, demoni i umetnička dela) na skupu podataka koji sadrži rečenice iz romana, pravnih dokumenata, kao i rečenice generisane iz znanja Vikipodataka baza i Leksimirka leksička baza podataka. Dobijeni model je pokazao dobre performanse, postigavši F1 rezultat od 0,8 na test ...Milica Ikonić Nešić, Saša Petalinkar, Ranka Stanković, Miloš Utvić, Olivera Kitanović. "SrpCNNeL: Serbian Model for Named Entity Linking" in Annals of Computer Science and Information Systems, IEEE (2024). https://doi.org/10.15439/2024F8827
-
Ефикасност дистрибуције и коришћења природног гаса у домаћинствима
Dejan Brkić (2010-03-30)Природни гас ће се у будућности све више користити као енергент за подмиривање грејних потреба становништва у српским градовима. Стога је потребно изнаћи најповољнији начин употребе природног гаса. Природни гас се може користити за подмирење грејних потреба становништва на два дијаметрално супростављена начина, и то директно, тако што би се гас директно уводио у зграде путем дистрибутивног система за снабдевање гасом и затим сагоревао у гасном котлу којим је сваки стан опремљен (гасни дистрибутивни систем), или индиректно, тако што ...prirоdni gаs, distribuciја gаsа,grејаnjе, cеvоvоdi, cеvоvоdnе mrеžе,fаktоr trеnjа pri prоtоku fluidа,urbаnizаmDejan Brkić. "Ефикасност дистрибуције и коришћења природног гаса у домаћинствима" in Универзитет у Београду, Универзитет у Београду, Рударско-геолошки факултет (2010-03-30)
-
Ефикасност дистрибуције и коришћења природног гаса у домаћинствима
Dejan Brkić (2010-03-30)Природни гас ће се у будућности све више користити као енергент за подмиривање грејних потреба становништва у српским градовима. Стога је потребно изнаћи најповољнији начин употребе природног гаса. Природни гас се може користити за подмирење грејних потреба становништва на два дијаметрално супростављена начина, и то директно, тако што би се гас директно уводио у зграде путем дистрибутивног система за снабдевање гасом и затим сагоревао у гасном котлу којим је сваки стан опремљен (гасни дистрибутивни систем), или индиректно, тако што ...prirоdni gаs, distribuciја gаsа,grејаnjе, cеvоvоdi, cеvоvоdnе mrеžе,fаktоr trеnjа pri prоtоku fluidа,urbаnizаmDejan Brkić. "Ефикасност дистрибуције и коришћења природног гаса у домаћинствима" in Универзитет у Београду, Универзитет у Београду, Рударско-геолошки факултет (2010-03-30)
-
SrpELTeC: A Serbian Literary Corpus for Distant Reading
U članku je predstavljen SrpELTeC, korpus razvijen u okviru akcije COST Distant Reading for European Literary History (CA16204). Svi romani u SrpELTeC-u su odabrani, pripremljeni i obeleženi korišćenjem zajedničkih principa uspostavljenih za sve jezičke zbirke u Evropskoj zbirci književnog teksta (ELTeC). Navedeni su izazovi i rešenja u pripremi SrpELTeC od nule. Svi romani su ručno kodirani u TEI sa bogatim metapodacima i strukturnim napomenama. Automatska anotacija je uključivala POS-označavanje, lematizaciju i imenovane entitete, oslanjajući se na resurse za obradu ...digital humanities, Serbian literature, text corpora, distant reading , linked data, named entity recognition, text analyticsRanka Stanković, Cvetana Krstev, Duško Vitas. "SrpELTeC: A Serbian Literary Corpus for Distant Reading" in Primerjalna književnost, Research Centre of the Slovenian Academy of Sciences and Arts (2024). https://doi.org/10.3986/pkn.v47.i2.03
-
Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC
OntoLex, dominantni standard zajednice za mašinski čitljive leksičke resurse u kontekstu RDF-a, Linked Data i tehnologija Semantičkog veba, trenutno se proširuje sa posebnim modulom za Frekvencije, Primere i Informacije zasnovane na Korpusu (OntoLex-FrAC). Predlažemo novi komponent za OntoLex-FrAC, koji se bavi inkorporacijom korpusnih upita za (a) povezivanje rečnika sa korpusnim mašinama, (b) omogućavanje RDF baziranih web servisa da dinamički razmenjuju korpusne upite i podatke odgovora, i (c) korišćenje konvencionalnih upitačkih jezika za formalizaciju unutrašnje strukture kolokacija, skica reči i ...standardizacija, digitalna leksikografija, OntoLex, upiti korpusa, povezani podaci, Lingvistički povezani otvoreni podaciChristian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset. "Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024, LREC (2024)
-
Development of Open Educational Resources (OER) for Natural Language Processing
In this paper we present the development of an online course at the edX BAEKTEL platform named “Lexical Recognition in the Natural Language Processing (NLP)”. It is based on the course of the same name for PhD studies at the University of Belgrade, Faculty of Philology. There are not many courses in Computational Linguistics (CL) on OER platforms, and there is none in Serbian either for CL or NLP. We have developed this course in order to improve this ...Cvetana Krstev, Biljana Lazić, Ranka Stanković, Giovanni Schiuma, Miladin Kotorčević. "Development of Open Educational Resources (OER) for Natural Language Processing" in The Sixth International Conference on e-Learning (eLearning-2015), September 2015, Belgrade, Serbia, Belgrade : Belgrade Metropolitan Univesity (2015)
-
Topic Modeling of the SrpELTeC Corpus: A Comparison of NMF, LDA, and BERTopic
Modeliranje tema je efikasan način da se dobije uvid u velike količine podataka. Neki od najčešće korišćenih metoda za modeliranje tema su Latentna Dirihleova alokacija (LDA) i faktorizacija nenegativne matrice (NMF). Međutim, sa porastom modela samopažnje i unapred obučenih jezičkih modela, pojavili su se novi načini za ekstrakcju tema. BERTopic predstavlja novi pristup modeliranju tema. U ovom radu smo uporedili performanse LDA, NMF i BERTopic na književnim tekstovima na srpskom, merenjem koherentnosti tema i raznovrsnosti tema, kao i kvalitativnom ...Teodora Mihajlov, Milica Ikonić Nešić, Ranka Stanković, Olivera Kitanović. "Topic Modeling of the SrpELTeC Corpus: A Comparison of NMF, LDA, and BERTopic" in Annals of Computer Science and Information Systems, IEEE (2024). https://doi.org/10.15439/2024F1593