Претрага
25 items
-
Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis
U ovom radu predstavljen je model koji omogućava prikupljanje, pripremu, opis metapodataka, upravljanje i eksploataciju, uključujući pretragu punog teksta dokumenata iz domena kriminalistike napisanih na srpskom jeziku. Predloženi pristup primenjuje se na veb portalu koji sakuplja različite tekstove nastale iz časopisa Akademije za kriminalistiku i policijske studije, Krivičnog zakona Srbije, konferencija „Tara“ i „Reiss“, kao i iz nekih doktorskih disertacija vezanih za ovu oblast istraživanje. Nakon obrade teksta, korpus koji sadrži preko 5500 stranica običnog teksta, kreiran je i ...Dalibor Vorkapić, Aleksandra Tomašević, Miljana Mladenović, Ranka Stanković, Nikola Vulović. "Digital Library From A Domain Of Criminalistics As A Foundation For A Forensic Text Analysis" in International Scientific Conference “Archibald Reiss Days” Thematic Conference Proceedings Of International Significance, Belgrade, 7-9 November 2017, Academy Of Criminalistic And Police Studies Belgrade (2017)
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... Podešavanjem upita, uz izbor koncepata i ključnih reči, može se značajno podići preciznost odgovora na upit. Slika 4. Kombinovanje semantičkog i morfološkog proširenja upita Na slici 4. ilustrovana je mogućnost sistema WS4QE da kombinuje semantičko i morfološko proširenje upita, uz p ...
... leksikalizuju na različite načine u različitim jezicima a relevantan dokument za postavljeni upit može biti i dokument na jeziku koji se razlikuje od jezika upita, pa stoga i višejezično proširenje upita može biti od značaja. 2. LEKSIČKI RESURSI Leksički resursi za srpski jezik se razvijaju ...
... tako i za složenice, i formira složeni upit povezujući ih logičkim “ili” vezama. Korisnik na isti način, prostim izborom odgovarajućih polja, bira da li želi da upit postavi na ćiriličnom ili latiničnom pismu, ili na oba. Za semantičko proširenje upita koristi se srpski wordnet, tako što za ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... • Речник библиотекарста и информатике14. Вебран-сервиси за проширење упита се користе на следећи начин (Стан- ковић 2009; Станковић и др. 2017): 1. Апликација која прихвата кориснички упит контактира веб-сервис ради проширења упита. Контакт се остварује преко адресе веб-сер- 9 https://dotnet.microsoft ...
... процесор упита може да претражи позициони атрибут lemma и пронађе флективну парадигму лексеме ископина, али не може да интерпретира семантички проширени упит јер нема инфор- мацију о томе шта су синоними лексеме ископина; (СП2) ако корисник није задао захтев за семантичким проширењем упита, веб-сучеље ...
... веб-сучеље алатке за претрагу корпуса директно про- слеђује упит процесору упита и прелази се на корак (СП8); (СП3) ако је корисник задао захтев за семантичким проширењем упи- та, веб-сучеље анализира упит и прослеђује веб-сервису, поред задате леме X и осталих параметара, ознаку одређене лексичке релације ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... primene proširenih upita, sa svim pomenutim opcijama proširenja, može se lepo prikazati na paralelizovanom tekstu u TMX formatu. Na osnovu proširenja upita, koje može biti morfološko, semantičko i višejezično, iz paralelizovanog teksta se izdvajaju segmenti koji zadovoljavaju upit, odnosno segmenti ...
... jezik. U Slika 13. Upit sa semantičkim i višejezičnim proširenjem primeru je odabran engleski wordnet kao osnov za višejezično pretraživanje, pa su pored srpskih reči kocka i kockanje korisniku za proširenje upita ponuđene i reči game, play, gambling i gaiming. Kao ...
... 10 Sa druge stran uspešno koristiti za obogać posebno je značajano kada s (ako se anje semantičkih oznaka lemama kuća i d 5. Proširenje upita iji upiti za pretraživanje tekstualnih sadržaja sastoje se od jedne ili više e, semantičke informacije iz SWN mogu se ivanje srpskog MR. Naime ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... Претраживање без и са морфолошким и семантичко-морфолошким проширењима упита биће приказан на примеру претраживања лексеме хомогенизациjа. Упитом без проширења тражи се само облик номинатива jеднине: хомогенизациjа Упитом са морфолошким проширењем, у претрагу су укључени сви флективни облици тражене лексеме ...
... садржаjа само по jедном писму jе могуће у случаjу претраживања без проширења упита, док проширење упита аутоматски подразумева оба писма. Претраживање докумената на српском jезику jе сложен процес због веома богатог морфолошког система. Упитима се наjчешће траже речи у свом канонском облику (номинатив jеднине ...
... проширених упита. Коришћени су веб сервиси (Stanković et al., 2012) и морфолошки електронски речници за српски jезик (Krstev et al., 2008; Stanković et al., 2016): – за морфолошко проширење упита: http://hlt.rgf.bg.ac.rs/vebran/api/delafs/ključna_reč – за семантичко и морфолошко проширење упита: http://hlt ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... нове типове ентитета. Како семантички маркери, интегрисани у графове, обезбеђују постављање комп- лексних упита за екстракцију конкорданци, то је за специфичне, доменски зависне упите је потребно допунити скуп лексичких маркера. Један од домена који су недавно уведени у српски морфолошки речник ...
... семантички маркер – опрема (или део опреме) Маркере је могуће користити кроз регуларне изразе, за неке једностав- није упите над корпусом. Други вид употребе јесте кроз постављање упита конструкцијом аутомата са сложенијим захтевима. Пример истраживања у коме су коришћени маркери у циљу екстракције ...
... РУДАРСТВА У СРПСКЕ ЕЛЕКТРОНСКЕ РЕЧНИКЕ Семантички маркери у електронским речницима омогућавају постављање комплек- сних упита за екстракцију информација. Када су у питању упити везани за специфични домен, расположиви скуп лексичких маркера за тај конкретни домен од пресудног је зна- чаја за квалитет ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... проширених упита. Коришћени су веб сервиси (Станковић и др. 2012) и морфолошки електронски речници за српски језик (Крстев и др. 2008, Станковић 152 BIBLIOINFO и др. 2016) за морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/ vebran/api/delafs/ključna_reč) и семантичко-морфолошко проширење упита ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... Slika 4-30 Konkordance za upit „rizik … kao što…je“ Iterativnim postupkom se može doći do odgovarajućih upita, naime upit se može prilagoditi da izvuče štete okidačima, recimo „što inicira|prouzrokuje|…“. Dakle potrebne su takve rečenice i odgovarajući upiti kojima će se precizno pronaći koncepti ...
... mogu javiti neke reči ali ne i tačka. prikazuje deo rezultata varijante prethodnog upita za NP0=“proces“ (Slika 4-29). Slika 4-29 Konkordance za upit „72 kao što “ Na osnovu prikazanih rezultata upita možemo dodati u ontologiju sledeće relacije : hyponym ("proces", "čišćenje uglja") ...
... primer upita nad korpusom koji bi odgovarao sličnom obrascu je: [lemma="jesam"][word!="\."]{0,3}[lemma="vrsta"][tag="N"] Analizom rezultata (Slika 4-31) je uočeno da dosta primera za nabrajanja idu sa zagradom tako da se može upit modifikovati u tom smeru. Slika 4-31 Konkordance za upit „je … ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji
Ljiljana R. Kolonja (2016-09-23)Postojeća organizacija zaštite na radu na površinskim kopovima uglja često nije umogućnosti da blagovremeno i tačno ukaže na nedostatke, koji mogu u bližoj ilidaljoj budućnosti da budu uzrok narušavanja bezbednosti radnika, ali i uzrokoštećenja materijalnih dobara rudnika. Nemogućnost donošenja pravovremenihodluka je moguće izbeći uvođenjem softverski podržanih sistema za praćenje ianalizu bezbednosti i zaštite na radu.Osnovni cilj ove doktorske disertacije je definisanje metodologije i razvoj modelasistema upravljanja zaštitom na radu, koji će omogućiti savremen, adekvatan isveobuhvatan način praćenja i analize ...... morfološko proširenje oblicima, „nogu“, „nozi“, „ruku“, „ruke“… (Krstev et al., 2013). Osim toga, višejezičnost ontologije omogućava da upit na jednom jeziku vraća rezultate koji sadrže dokumente koji odgovaraju ključnoj reči upita po svom sadržaju, ali nisu na jeziku inicijalnog upita. 7 ...
... podataka, SQL upitima za takozvane jednodimenzionalne upite (npr. 5 najstarijih radnika, ili upoređivanje broja povreda u prošloj i tekućoj godini). Analitičke aplikacije podržavaju direktno pretraživanje podataka, ali omogućavaju i kreiranje složenijih, višedimenzionalnih upita sa na primer ...
... e i ekspanziju upita Slika 7.11. prikazuje isečke iz radova koji odgovaraju postavljenom upitu, gde se u prvoj koloni navode podaci o radu iz koje je isečak teksta, u drugoj isečak na engleskom i u trećoj na srpskom. Termini koje je sistem sravnio sa upitom su istaknuti plavom ...Ljiljana R. Kolonja. "Sistem poslovne inteligencije za upravljanje zaštitom na radu u rudarskoj industriji" in Универзитет у Београду, Универзитет у Београду, Рударско-геолошки факултет (2016-09-23)
-
Integrisanje heterogenih leksičkih resursa
Osnovna aktivnost Grupe za obradu prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena u okviru međunarodnog projekta Balkanet. Radi se o dva heterogena leksička resursa, razvijena na osnovu sasvim različitih modela, koji samim tim sadrže i različite vrste leksičkih informacija. Integracijom ovih resursa, informacije ...... izgovora (+Ek). Informacije iz sistema rečnika SrpDic mogu se pomoću sistema Intex [1] koristiti za formulisanje kompleksnih upita za pretraživanje tekstova. Na primer, upitom: će se dobiti svi prisvojni pridevi u tekstu koji ne pripadaju ekavskom izgovoru. Zapisi u DELAS rečniku mogu ...
... relacijom ENG_DERIVATIVE. U opštem slučju poslednja veza ne mora da postoji. Semantičke oznake u DELAS zapisima omogućavaju formulisanje kompleksnih upita u Intex okruženju. Korišćenje Intex-ovih regularnih izraza (* ) + ( * ) (imenica označena kao ...
... po veličini. Osim toga, razvoj srpskog morfološkog rečnika složenih reči je u svojoj početnoj fazi, što predstavlja ozbiljnu prepreku za proširenje WN morfosintaktičkim informacijama, jer su u njemu brojne složene reči kao npr. usmeni ispit:1, sa svojim, posebnim pravilima izvođenja. Sa povećanjem ...Ranka Stanković, Cvetana Krstev, Duško Vitas, Ivan Obradović, Gordana Pavlović-Lažetić. "Integrisanje heterogenih leksičkih resursa" in Festivalski katalog 11. Festivala informatičkih dostignuća INFOFEST 2004, 26th September - 2nd October, 2004, Budva, Montenegro, INFOFEST (2004)
-
Upravljanje projektima u hidrogeologiji na primeru proširenja izvorišta Pančevo
Jelena Pantelić (2012)Jelena Pantelić. Upravljanje projektima u hidrogeologiji na primeru proširenja izvorišta Pančevo, Beograd:Rudarsko-geološki fakultet, 2012
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... означава кулинарску меру и потом именица из кулинарског домена. На слици је приказано радно окружење за задавање обрасца упита и конкорданце добијене као одзив за постављени упит: додај кашику воде, мети кашику масти, намажи главу лимуновим соком и сл., али препознаје и три зрна бибера, јер је три ...
... представљено неколико карактеристичних образаца. Претраживање кулинарског корпуса, осим по облицима и лемама, могуће је коришћењем колмплекснијих упита, представљених регуларним изразима или графовима. Образац облика<+MessApp> проналази глагол (који није помоћни), за којим ...
... потом за математику, физику, етнологију, право итд.). Када је у питању конкретно лексика кулинарских текстова, даљи кораци би свакако обухватили проширење корпуса и дигитализацију осталих кувара у библиотеци Института САНУ. Свакако треба радити и на набавци нових кувара, пожељно у е-облику. Потребно ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC
OntoLex, dominantni standard zajednice za mašinski čitljive leksičke resurse u kontekstu RDF-a, Linked Data i tehnologija Semantičkog veba, trenutno se proširuje sa posebnim modulom za Frekvencije, Primere i Informacije zasnovane na Korpusu (OntoLex-FrAC). Predlažemo novi komponent za OntoLex-FrAC, koji se bavi inkorporacijom korpusnih upita za (a) povezivanje rečnika sa korpusnim mašinama, (b) omogućavanje RDF baziranih web servisa da dinamički razmenjuju korpusne upite i podatke odgovora, i (c) korišćenje konvencionalnih upitačkih jezika za formalizaciju unutrašnje strukture kolokacija, skica reči i ...standardizacija, digitalna leksikografija, OntoLex, upiti korpusa, povezani podaci, Lingvistički povezani otvoreni podaciChristian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset. "Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024, LREC (2024)
-
Creation of a Training Dataset for Question-Answering Models in Serbian
Razvoj i primena veštačke inteligencije u jezičkim tehnologijama značajno su napredovali poslednjih godina, posebno u domenu zadatka odgovaranja na pitanja (Question Answering - QA). Dok su postojeći resursi za QA zadatke razvijeni za glavne svetske jezike, srpski jezik je relativno zanemaren u ovoj oblasti. Ovaj rad predstavlja inicijativu za kreiranje obimnog i raznovrsnog skupa podataka za obučavanje modela za odgovaranje na pitanja na srpskom jeziku, koji će doprineti unapređenju jezičkih tehnologija za srpski jezik. Pored brojnih istraživanja o jezičkim modelima ...veštačka inteligencija, obrada prirodnog jezika, jezički resursi, anotirani skupovi, ekstrakcija informacija, odgovaranje na pitanjaRanka Stanković, Jovana Rađenović, Maja Ristić, Dragan Stankov. "Creation of a Training Dataset for Question-Answering Models in Serbian" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Vebran Web Services for Corpus Query Expansion
Ranka Stanković, Miloš Utvić (2020)U ovom radu se govori o razvoju veb usluga Vebran i njihovoj primeni u poboljšanju pretraživanja korpusa. Veb-servisi Vebran koriste se za konsultovanje spoljnih leksičkih izvora za srpski jezik (uglavnom elektronski morfološki rečnici i srpski Vordnet) i proširivanje korisničkih upita radi dobijanja relevantnijih rezultata iz srpskih korpusa.... Eighth International Confer- ence on Language Resources and Evaluation (LREC),(Istanbul, Turkey, 2012, 1710–1717 Stanković, Ranka. “Modeli ekspanzije upita nad tekstuelnim resursima”. Phdthesis, Univerzitet u Beogradu, Matematički fakultet, Beograd, 2009 Stanković, Ranka, Cvetana Krstev, Biljana Lazić ...Ranka Stanković, Miloš Utvić. "Vebran Web Services for Corpus Query Expansion" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.5
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... задово- љавајућег одговора треа да се примени синтаксичко парсирање да и се анализирала граматичка струк- 23 корисников упит веб странице припремна обрада анализа упита припремна обрада семантичка обрада индексирање сравњивање и релевантност резултати претраживања 8: Претраживање веба ...
... се „препознавање именованих ен- титета”. Још захтевнији су покушаји сравњивања упита са документима који су записани на различитим јези- цима. За вишејезично проналажење информација потрено је да се аутоматски преведе упит на све мо- гуће изворне језике, а затим да се пронађена инфор- мација преведе ...
... углавном за стране партнере и за енглески језик. У истраживачком окружењу су оављени експери- менти са системима за проширивање упита који су машинама за претраживање слали упите прошири- ване морфолошким речницима и вишејезичним се- мантичким мрежама. Ови експерименти су дали за- нимљиве и корисне резултате ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Managing mining project documentation using human language technology
Purpose: This paper aims to develop a system, which would enable efficient management and exploitation of documentation in electronic form, related to mining projects, with information retrieval and information extraction (IE) features, using various language resources and natural language processing. Design/methodology/approach: The system is designed to integrate textual, lexical, semantic and terminological resources, enabling advanced document search and extraction of information. These resources are integrated with a set of Web services and applications, for different user profiles and use-cases. Findings: The ...Digital libraries, Information retrieval, Data mining, Human language technologies, Project documentationAleksandra Tomašević, Ranka Stanković, Miloš Utvić, Ivan Obradović, Božo Kolonja . "Managing mining project documentation using human language technology" in The Electronic Library (2018). https://doi.org/10.1108/EL-11-2017-0239
-
Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model
Ova studija predstavlja analizu sentimenta srpskih starih romana iz perioda 1840-1920, koristeći veliki jezički model (LLM) Mistral za tehniku učenja sa zasnovani na takozvanim "zero" i "few-shot" pokušajima. Glavni pristup uvodi inovacije osmišljavanjem istraživačkih upita (promptova) uključuju tekst sa uputstvom za klasifikaciju bez primera i na osnovu nekoliko primera, omogućavajući jezičkom modelu da klasifikuje osećanja u pozitivne, negativne ili objektivne kategorije. Ova metodologija ima za cilj da pojednostavi analizu osećanja ograničavanjem odgovora, čime se povećava preciznost ...Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković, Biljana Rujević. "Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model" in In Proceedings of the Sixth International Conference on Computational Linguistics in Bulgaria (CLIB 2024), BAS (2024)
-
Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking
U radu se prikazuju rezultati istraživanja vezanih za pripremu paralelnih korpusa, fokusirajući se na transformaciju u RDF grafove koristeći NLP Interchange Format (NIF) za lingvističku anotaciju. Pružamo pregled paralelnog korpusa koji je korišćen u ovom studijskom slučaju, kao i proces označavanja delova govora, lematizacije i prepoznavanja imenovanih entiteta (NER). Zatim opisujemo povezivanje imenovanih entiteta (NEL), konverziju podataka u RDF, i uključivanje NIF anotacija. Proizvedene NIF datoteke su evaluirane kroz istraživanje triplestore-a korišćenjem SPARQL upita. Na kraju, razmatra se povezivanje Linked ...paralelni korpusi, povezivanje imenovanih entiteta, prepoznavanje imenovanih entiteta, NER, NEL, povezani podaci, NIF, VikipodaciRanka Stanković, Milica Ikonić Nešić, Olja Perisic, Mihailo Škorić, Olivera Kitanović. "Towards Semantic Interoperability: Parallel Corpora as Linked Data Incorporating Named Entity Linking" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024)
-
SrpELTeC: A Serbian Literary Corpus for Distant Reading
U članku je predstavljen SrpELTeC, korpus razvijen u okviru akcije COST Distant Reading for European Literary History (CA16204). Svi romani u SrpELTeC-u su odabrani, pripremljeni i obeleženi korišćenjem zajedničkih principa uspostavljenih za sve jezičke zbirke u Evropskoj zbirci književnog teksta (ELTeC). Navedeni su izazovi i rešenja u pripremi SrpELTeC od nule. Svi romani su ručno kodirani u TEI sa bogatim metapodacima i strukturnim napomenama. Automatska anotacija je uključivala POS-označavanje, lematizaciju i imenovane entitete, oslanjajući se na resurse za obradu ...digital humanities, Serbian literature, text corpora, distant reading , linked data, named entity recognition, text analyticsRanka Stanković, Cvetana Krstev, Duško Vitas. "SrpELTeC: A Serbian Literary Corpus for Distant Reading" in Primerjalna književnost, Research Centre of the Slovenian Academy of Sciences and Arts (2024). https://doi.org/10.3986/pkn.v47.i2.03