Претрага
129 items
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... књижевног и народног језика, I–XX, Београд: САНУ – Институт за српски језик САНУ, 1959–2017. Ристић 2007: Стана Ристић, „Прва лексикографска школа у Институту за српски језик САНУ”, у: Шездесет година института за српски је- зик сану: зборник радова I, Београд: Институт за српски језик САНУ, 131–149. ...
... савремених приступа (ур.Стана Ристић), Београд: Институт за српски језик САНУ, 133–154. Ивановић 2017: Ненад Ивановић, „Један прилог историји српске лексиког- рафије (’Рукописна збирка народних речи’ В. С. Караџића у грађи за Речник САНУ)”, наш језик, XLVIII/3‒4, 57‒65. Јакић 2015: Милена Јакић, „Формално ...
... University of Belgrade). Фекете 1993: Егон Фекете, „О Речнику српскохрватског књижевног и на- родног језика САНУ”, у: сто година лексикографског рада у сану, Београд: САНУ ‒ Институт за српски језик САНУ, 21–49. Џолиф 2011: I Jolliffe, Principal component analysis, Springer Berlin Heidelberg, 1094–1096 ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
Creation of a Training Dataset for Question-Answering Models in Serbian
Razvoj i primena veštačke inteligencije u jezičkim tehnologijama značajno su napredovali poslednjih godina, posebno u domenu zadatka odgovaranja na pitanja (Question Answering - QA). Dok su postojeći resursi za QA zadatke razvijeni za glavne svetske jezike, srpski jezik je relativno zanemaren u ovoj oblasti. Ovaj rad predstavlja inicijativu za kreiranje obimnog i raznovrsnog skupa podataka za obučavanje modela za odgovaranje na pitanja na srpskom jeziku, koji će doprineti unapređenju jezičkih tehnologija za srpski jezik. Pored brojnih istraživanja o jezičkim modelima ...veštačka inteligencija, obrada prirodnog jezika, jezički resursi, anotirani skupovi, ekstrakcija informacija, odgovaranje na pitanjaRanka Stanković, Jovana Rađenović, Maja Ristić, Dragan Stankov. "Creation of a Training Dataset for Question-Answering Models in Serbian" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Prevodni ekvivalenti engleskih pasivnih glagolskih oblika (struktura) u Srpskohrvatskom jeziku
Zorica Stojadinović. Prevodni ekvivalenti engleskih pasivnih glagolskih oblika (struktura) u Srpskohrvatskom jeziku
-
Kategorija glagolskog vida u savremenom jeziku realizovana u finitnim oblicima za prošlost
Zorica Stojadinović. Kategorija glagolskog vida u savremenom jeziku realizovana u finitnim oblicima za prošlost, :
-
Речник САНУ као база терминолошких речника (на примеру речника кулинарства)
... чега је уследило оптичко препознавање карактера, аутоматско пресловљавање и корекција хифенације, а потом и обрада електронским речницима за српски језик (Крстев и други, 2003). Треба напоменути да се електронски речници разликују од машински читљивих речника, јер су електронски речници намењени ...
... уз остале поступке, убрзава и рад на папирној верзији Речника. Извори Поповић-Миџина Катарина, Велики српски кувар. Нови Сад, 1904. Речник српскохрватског књижевног и народног језика. Београд, 1959–2014, I–XIX. Литература 1. Krstev, Cvetana, Duško Vitas and Gordana Pavlović-Lažetić. „Resources ...
... NY, USA: W.W. Norton & Company 11. Cvetana Krstev, Biljana Lazić, “Glagoli u kuhinji i za stolom”, Naučni sastanak slavista u Vukove dane - Srpski jezik i njegovi resursi: teorija, opis i primene, Vol. 44/3, pp. 117- 136, 2015, Međunarodni slavistički centar, Beograd 12. Александра Тртовац, Д ...Рада Стијовић, Олга Сабо, Ранка Станковић. "Речник САНУ као база терминолошких речника (на примеру речника кулинарства)" in Словенска терминологија данас, Београд : Српска академија наука и уметности (2017)
-
English for Geology Students 1 – Dyslexia friendly
Lidija Beko (2023)Lidija Beko. English for Geology Students 1 – Dyslexia friendly, Belgrade : The Faculty of Mining and Geology, 2023
-
Нове технологије за оживљавање старих текстова
удаљено читање, књижевни корпус, обрада српског језика, анотација врстом речи, лематизација, именовани ентитетиЦветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић. "Нове технологије за оживљавање старих текстова" in Зборник радова Међународне научне конференције Дигитална хуманистика и словенско културно наслеђе II, Београд, 28-29 јуни 2021., Београд : Савез славистичких друштава Србије (2023)
-
Веб-алат за управљање грађом Речника САНУ и анотација листића
Грађа на основу које се израђује Речник српскохрватског књижевног и народног језика САНУ, а која садржи материјал из преко 4.500 писаних извора и 300 рукописних збирки речи са подручја народних говора штокавског наречја, забележена је на око 5.000.000 листића. Богат лексички материјал, који обухвата књижевни и народни језик у протекла два века и на основу кога треба да се напише још најмање 15 томова Речника, пружа могућност и за разноврсна лингвистичка и ванлингвистичка истраживања. Из тог разлога се приступило ...Рада Стијовић, Ранка Станковић, Михаило Шкорић. "Веб-алат за управљање грађом Речника САНУ и анотација листића" in Rasprave Instituta za hrvatski jezik i jezikoslovlje, Institute of Croatian Language and Linguistics (2020). https://doi.org/10.31724/rihjj.46.2.32
-
Electronic Dictionaries - from File System to lemon Based Lexical Database
In this paper we discuss some well-known morphological descriptions used in various projects and applications (most notably MULTEXT-East and Unitex) and illustrate the encountered problems on Serbian. We have spotted four groups of problems: the lack of a value for an existing category, the lack of a category, the interdependence of values and categories lacking some description, and the lack of a support for some types of categories. At the same time, various descriptions often describe exactly the same ...... the maintenance of dictionaries of inflected word forms is very important. For instance, inflected forms of jezik are: jezik, jezika, jeziku, jeziče, jezikom, jezici, jezike, jezicima. In the model presented, the table Forms is used to store all forms that are inflected from a lemma, together ...
... use. For instance, the lexi- cal entry jezik ’language, tongue’ has three different senses (presently recorded in SMD), and their textual representa- tion in DELA format is: jezik,N9+DOM=Ling//communication media jezik,N9+Conc+Body+DOM=Anatomy//body part jezik,N9+Conc+Food+Prod+DOM=Culinary//food ...
... (simplified): maternji jezik +DOM=Ling ‘mother tongue’ jezik za zube +DOM=Anatomy ‘tongue behind teeth (keep mouth shut)’ teleći jezik +DOM=Culinary ‘veal tongue’ The same example in the lemon form is: lex_jezik a ontolex:LexicalEntry; lexinfo:partOfSpeech lexinfo:Noun; jezik ontolex:morphologicalPattern ...Ranka Stanković, Cvetana Krstev, Biljana Lazić, Mihailo Škorić. "Electronic Dictionaries - from File System to lemon Based Lexical Database" in Proceedings of the 11th International Conference on Language Resources and Evaluation - W23 6th Workshop on Linked Data in Linguistics : Towards Linguistic Data Science (LDL-2018), LREC 2018, Miyazaki, Japan, May 7-12, 2018, European Language Resources Association (ELRA) (2018)
-
Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data
Овај рад описује студију случаја о генерисању повезаних података креираних на основу обечежених текстуалних корпуса коришћењем формата размене података у обради природних језика (NIF). Као основа за ово истраживање послужио је подскуп корпуса ELTeC, који се састоји од 900 романа из периода 1840-1920 за 9 европских језика. Верзија романа са коментарима, у такозваном TEI level-2 формату, трансформисана је у NIF, формат заснован на RDF/OWL који има за циљ постизање интероперабилности између алата за обраду природних језика, језичких ресурса и ...Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović. "Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj
-
Srbija u OneGeology Europe
Геолошки завод Србије као носилац Пројекта ОneGeologyEurope заједно са Рударско геолошким факултетом и Министарством за природне ресурсе, рударство и просторно планирање су се укључили у међународни Пројекат OneGeology Europe у мају 2013. године у већ поодмаклој фази израде Пројекта. До краја 2013. године испунили су завршене активности које треба да доведу до пуноправног укључења у Пројекат чиме је Република Србија нашла своје место на Геолошкој карти Европе 1:1М. Геолошка карта Србије 1:1М представља компилациону односно поједностављену верзију ОГК 1:500 ...... појма и релације са другим речничким одредницама. Остали језици сваку речничку одредницу преводе на национални језик, при чему се јединствена шифра задржава и има улогу стожера, односно јединственог идентификатора појма на свим језицима базе 1G-E. Његово коришћење је обавеза за све учеснике 1G-E ...
... односно национални добављач података, је добила листу термина на енглеском језику које је преводила на матерњи језик један на један, тако да се интегрисањем свих упарених термина омогућило описивање скупова података на свим језицима учесника пројекта. Кроз раније активности иницијативе 1G-E урађен је геолошки ...
... .sld. Након попуњавања вишејезичне терминолошке база података (листа термина на енглеском језику коју је свака земља учесница преводила на национални језик) имплементиран је интерфејс и на српском језику. То значи да сви заинтересовани корисници уласком на званични сајт оne.geology.org избором српске ...Danka Blagojević, Ranka Stanković, Petar Stejić, Velizar Nikolić. "Srbija u OneGeology Europe" in Zapisnici Srpskog geološkog društva za 2013. godinu, Beograd : Srpsko geološko društvo (2014)
-
Possibilities of retro-digitalized German-Serbian Mining Dictionary
U radu će biti prikazan opis procesa retrodigitalizacije dvojezičnog Nemačko-srpskog rudarskog rečnika iz 1923. godine čiji je autor rudarski inženjer Dragutin Stepanović (Степановић, 1923). Ovaj rečnik je zasnovan na skoro 4 000 leksičkih zapisa koji su prevodilački ekvivalenti ili uputnice. Umesto predgovora autor daje uvid u svoje pismo upućeno “Ministru šuma i rudnika” u kome piše o nameri da zabeleži reči koje se koriste u narodu kako bi izbegao upotrebu nemačkih reči. Iako broj odrednica nije toliko veliki, rečnik ...Biljana Lazić, Olivera Kitanović, Ivan Obradović. "Possibilities of retro-digitalized German-Serbian Mining Dictionary" in E-dictionaries and E-lexicography, Zagreb, 10-11 May 2019, Zagreb : Institut za hrvatski jezik i jezikoslovlje (2019)
-
English for Geology Students. 2
Lidija Beko (2023)... available at: www.dr.rgf.bg.ac.rs Odd ViICl | SANSTILS AO 1049 » HOt TON Lidija Beko ENGLISH FOR GEOLOGY STUDENTS Lidija Beko ENGLESKI JEZIK ZA GEOLOGE Publisher The Faculty of Mining and Geology, Đušina 7, Belgrade www.rgf.bg.ac.rs For the publisher dr Biljana Abolmasov, dean ...Lidija Beko. English for Geology Students. 2, Belgrade : The Faculty of Mining and Geology, 2023
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... (Tovar et al. 2018). Tabela 2-1 Obrasci za prepoznavanje relacije sinonimije (gde su S1 i S2 ontološki koncepti) # Obrazac za engleski jezik Obrazac za srpski jezik 1 S1 (S2) S1 (S2) 2 S1 is often referred to as S2 S1 često se naziva i S2 3 S1 is referred to as S2 S1 se naziva S2 4 S1 alias ...
... koristi istraživački tim Fejsbuka (Roller, Kiela, and Nickel 2018). Tabela 2-2 Obrasci za prepoznavanje obraza reči Obrazac za engleski jezik Obrazac za srpski jezik X which is a (example|class|kind|...) of Y X koji je (primer|klasa|vrsta|...) Y X (and|or) (any|some) other Y X (i|ili) (bilo koji|neki) ...
... onoj meri u kojoj su oni povezani sa rudarstvom. Svaki pojam ima srpski termin kao odrednicu, ponekad praćenu sinonimima, koja je prevedena na četiri jezika - engleski, francuski, nemački i ruski. Međusobna povezanost svih pet jezika data je dodatnim indeksima. Termini nemaju definicije, niti primere ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
English for Geology Students 2 - Dyslexia friendly
Lidija Beko (2023)Lidija Beko. English for Geology Students 2 - Dyslexia friendly, Belgrade : The Faculty of Mining and Geology, 2023
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... ROmeka@RGF описана jе у одељку 4., а у одељку 5. приказане су могућности претраживања похрањених текстуалних ресурса уз коришћење алата и ресурса за српски jезик. Могућности имплементациjе ТЕI смерница4 дате су у одељку 6., док су у одељку 7. дати закључци и идеjе за даљи развоj. 2. Веб платформа Омека ...
... 2, 2017. Научни рад имплементирањем проширених упита. Коришћени су веб сервиси (Stanković et al., 2012) и морфолошки електронски речници за српски jезик (Krstev et al., 2008; Stanković et al., 2016): – за морфолошко проширење упита: http://hlt.rgf.bg.ac.rs/vebran/api/delafs/ključna_reč – за ...
... текстуелних ресурса се могу класификовати у две категориjе: – општи, коjи не зависе од jезика и – проблеми коjи су специфични за поjедини jезик или групу jезика. Проблем при претраживању текстова на српском jезику представљаjу различите кодне шеме као и постоjање два алфабета (ћириличног и латиничног) ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Praktikum iz depozicionih sistema
Dejan Radivojević (2020)Dejan Radivojević. Praktikum iz depozicionih sistema, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2020
-
Parallel Bidirectionally Pretrained Taggers as Feature Generators
In a setting where multiple automatic annotation approaches coexist and advance separately but none completely solve a specific problem, the key might be in their combination and integration. This paper outlines a scalable architecture for Part-of-Speech tagging using multiple standalone annotation systems as feature generators for a stacked classifier. It also explores automatic resource expansion via dataset augmentation and bidirectional training in order to increase the number of taggers and to maximize the impact of the composite system, which ...Ranka Stanković, Mihailo Škorić, Branislava Šandrih Todorović. "Parallel Bidirectionally Pretrained Taggers as Feature Generators" in Applied Sciences, MDPI AG (2022). https://doi.org/10.3390/app12105028
-
Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges
Pojava velikih jezičkih modela (eng. Large Language Models ili LLMs) je značajno uticala na oblast veštačke inteligencije, naročito u oblastima obrade prirodnog jezika i generisanju teksta. Međutim, ključno ograničenje ovih modela leži u nedostatku strukturiranog znanja i sposobnosti zaključivanja, što otežava njihovu primenu u stvarnom svetu, gde se zahteva tačnost iznetih činjenica i zaključivanje na osnovu konteksta. S druge strane, grafovi znanja nude primamljivo rešenje. Oni pružaju bogat izvor strukturiranog znanja, tako što predstavljaju entitete i njihove relacije u ...grafovi znanja, veliki jezički modeli, obrada prirodnog jezika, strukturirano znanje, kvalitet podataka, objašnjiva veštačka inteligencija, bezbednost sadržaja na internetuDanka Jokić, Ranka Stanković, Jelena Jaćimović. "Knowledge Graphs in the Era of Large Language Models: Opportunities and Challenges" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024)
-
Corpus-based bilingual terminology extraction in the power engineering domain
Ovaj rad predstavlja resurse i alate koji se koriste za ekstrkciju i evaluaciju dvojezične, englesko-srpske terminologije u domenu energetike. Resursi se sastoje od postojeće opšte i domenske leksike i domenskog paralelnog korpusa; alati uključuju ekstraktore termina za oba jezika i alat za poravnavanje segmenata koji pripadaju korpusnim rečenicama. Sistem je testiran variranjem funkcije podudaranja koja utvrđuje prisustvo ekstrahovanog termina u poravnatom segmentu (odsečak), u rasponu od veoma labavog do strogog. Procena rezultata je pokazala da je preciznost izdvajanja termina ...Tanja Ivanović, Ranka Stanković, Branislava Šandrih Todorović, Cvetana Krstev. "Corpus-based bilingual terminology extraction in the power engineering domain" in Terminology, John Benjamins Publishing Company (2022). https://doi.org/10.1075/term.20038.iva