Претрага
129 items
-
The Many Faces of SrpKor
Акроним СрпКор означава фамилију електронских корпуса савременог српског језика чија је изградња почела крајем седамдесетих година прошлога века, а која је постала шире видљива заинтересованој истраживачкој заједници објављивањем његове прве верзије на вебу 2002. године. У овом дугом периоду, посебно пре појаве корисних текстуелних ресурса на вебу, развој корпуса се састојао у прикупљању и обради грађе као и у развоју метода обраде корпуса. Наиме, електронски корпус није само колекција текстова у дигиталном облику (како се то, на пример, наводи ...Duško Vitas, Ranka Stanković, Cvetana Krstev. "The Many Faces of SrpKor" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages
Jelena Lazarević, Olivera Kitanović (2024.)Cilj rada je istraživanje kolokabilnosti kao načina na koji se leksičke jedinice povezuju sa rečima iz različitih kategorija, formirajući veće jedinice. Istraživanje semantičkih i sintaksičkih principa ovih kombinacija u španskom i srpskom jeziku fudbala izvedeno je na komparabilnim fudbalskim korpusima SrFudKo i EsFudko, razvijenim u okviru doktorske disertacije Jelene Lazarević pod nazivom: Jezičke odlike diskursa novih medija o fudbalu: kontrastivna analiza na korpusu srpskog i španskog jezika. Korpus fudbala SrFudKo, kreiran na osnovu tekstova o fudbalu sa pet srpskih veb-portala: ...Jelena Lazarević, Olivera Kitanović . "Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.)
-
Речници у дигиталном добу - информатичка подршка за српски језик
Биљана Рујевић (2022)Морфолошки речници српског језика представљају електронски језички ресурс који има значајну историју развоја и коришћења за потребе обраде природних језика. С обзиром на то да су чувани у облику датотека чији је број нарастао па је самим тим управљање речницима постало отежано јавила се потреба за смештањем информација из речника у облик лексикографске базе. Како би се омогућио симултани рад на развоју речника за више корисника јавила се потреба за веб-апликацијом заснованој на лексикографској бази. Како би се размотриле ...Биљана Рујевић. Речници у дигиталном добу - информатичка подршка за српски језик, Београд : [Б. Рујевић], 2022
-
Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit
U digitalnom okruženju južnoslovenskih jezika, analiza emocija u tekstovima na društvenim mrežama postaje sve važnija za razumevanje javnog mnjenja, kreiranje personalizovanog sadržaja i analizu međusobnih interakcija korisnika. U okviru ovog rada predstavljamo detaljnu metodologiju i rezultate označavanja korpusa na srpskom jeziku prema Plutčikovom modelu kategorizacije, koji prepoznaje osam osnovnih emocionalnih kategorija, kao što su radost, tuga, bes, strah, poverenje, gađenje, iščekivanje i iznenađenje. Cilj istraživanja je da se analizira emocionalni sadržaj tekstova preuzetih sa društvenih mreža X (nekada Twitter) ...Milena Šošić, Ranka Stanković, Jelena Graovac. "Social-Emo.Sr: Emotional Multi-Label Categorization of Conversational Messages from Social Networks X and Reddit" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024., University of Belgrade - Faculty of Philology (2024)
-
Аутоматска екстракција дефиниција – допринос убрзању израде речника
дескриптивни речници, метаанализа лексикографских дефиниција, аутоматска екстракција дефиниција, електронски речници, српски језикРада Стијовић, Цветана Крстев, Ранка Станковић. "Аутоматска екстракција дефиниција – допринос убрзању израде речника" in Лексикологија и лексикографија у светлу актуелних проблема, Институт за српски језик САНУ (2021)
-
Frequency and Length of Syllables in Serbian
Marija Radojičić, Biljana Lazić, Sebastijan Kaplar, Ranka Stanković, Ivan Obradović, Ján Mačutek, Lívia Leššová (2019)Basic analyses of several properties of syllables (the rank-frequency distribution, the distribution of length, and the relation between length and frequency) in Serbian is presented. The syllabification algorithm used combines the maximum onset principle and the sonority hierarchy. Results indicate that syllables behave similarly to words as far as mathematical models are concerned, but values of parameters in models for syllables are quite different from those for words.... A., Martinšić-Ipšić, S., Matešić, M. (2015). Postupak automatskoga slogovanja temeljem načela najvećega pristupa i statistika slogova za hrvatski jezik. Govor 32, 3-34. Obradović, I., Obuljen, A., Vitas, D., Krstev, C., Radulović, V. (2010). Canonical syllable types in Serbian. In: Grzybek, P., Kelih ...
... Structures, Functions, Interrelations, Quantitative Perspectives: 145-157. Wien: Praesens. Piper P., Klajn I. (2013). Normativna gramatika srpskog jezika. Novi Sad: Matica srpska. Popescu, I.-I., Altmann, G., Grzybek, P., Jayaram, B.D., Köhler, R., Krupa, V., Mačutek, J., Pustet, R., Uhlířová, L. ...
... Evidence from the syllabification of intervocalic consonants. Language and Speech 40, 103-140. Stanojčić, Ž., Popović L. (1999). Gramatika srpskoga jezika. Beograd: Zavod za udžbenike i nastavna sredstva. Strauss, U., Fan, F., Altmann, G. (2008). Problems in Quantitative Linguistics 1. Lüdenscheid: ...Marija Radojičić, Biljana Lazić, Sebastijan Kaplar, Ranka Stanković, Ivan Obradović, Ján Mačutek, Lívia Leššová. "Frequency and Length of Syllables in Serbian" in Glottometrics (2019)
-
Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model
Ova studija predstavlja analizu sentimenta srpskih starih romana iz perioda 1840-1920, koristeći veliki jezički model (LLM) Mistral za tehniku učenja sa zasnovani na takozvanim "zero" i "few-shot" pokušajima. Glavni pristup uvodi inovacije osmišljavanjem istraživačkih upita (promptova) uključuju tekst sa uputstvom za klasifikaciju bez primera i na osnovu nekoliko primera, omogućavajući jezičkom modelu da klasifikuje osećanja u pozitivne, negativne ili objektivne kategorije. Ova metodologija ima za cilj da pojednostavi analizu osećanja ograničavanjem odgovora, čime se povećava preciznost ...Milica Ikonić Nešić, Saša Petalinkar, Mihailo Škorić, Ranka Stanković, Biljana Rujević. "Advancing Sentiment Analysis in Serbian Literature: A Zero and Few-Shot Learning Approach Using the Mistral Model" in In Proceedings of the Sixth International Conference on Computational Linguistics in Bulgaria (CLIB 2024), BAS (2024)
-
SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian
Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković (2019)У овом раду представљамо модел за избор добрих примера за речник српског језика и развој иницијалних компоненти модела. Метода која се користи заснива се на детаљној анализи различитих лексичких и синтактичких карактеристика у корпусу састављених од примера из пет дигитализованих свезака речника САНУ. Почетни скуп функција био је инспирисан сличним приступом и за друге језике. Дистрибуција карактеристика примера из овог корпуса упоређује се са карактеристиком дистрибуције узорака реченица ексцерпираних из корпуса који садрже различите текстове. Анализа је показала да ...Српски, добри примери из речника, аутоматизација израде речника, издвајање својстава, Машинско учење... for Serbo-Croatian]. SASA Dictionary: Речник српскохрватског књижевног и народног језика САНУ, I–XX (The Dictionary of the Serbo-Croatian Standard and Vernacular Language) (1959–2017). Београд: Институт за српски језик САНУ и САНУ. Stanković, R., Krstev, C., Vitas, D., Vulović, N. & Kitanović, O. ...
... je u svetlu savremenih pristupa. In S. Ristić et al. (eds.) Leksikologija i leksikografija u svetlu savremenih pristupa, Beograd: Institut za srpski jezik SANU, pp. 133–154. [The material of the Dictionary of the SANU - the needs and possibilities of digitization in the light of contemporary approaches ...
... Vukove dane, 31(1), pp. 201–220. (In Serbian, cyrillic.) Popović, Lj. (2004). Red reči u rečenici [Word order in sentences]. Beograd: Društvo za srpski jezik i književnost Srbije. (In Serbian, Cyrillic.) Rätsch, G., Onoda, T., & Müller, K. R. (2001). Soft margins for AdaBoost. Machine learning, 42(3) ...Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković. "SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian" in Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference , Lexical Computing CZ, s.r.o. (2019)
-
FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain
U radu se daje kratak prikaz teorije semantike okvira, na kojoj je zasnovana leksička baza Frejmnet. Predstavljena je koncepcija ove mreže, kao i mogućnosti njene primene. Predstavljena je i leksička analiza koja se primenjuje u projektu izrade Frejmneta i ukazano na razlike između analize zasnovane na okviru u odnosu na analizu zasnovanu na reči. Zatim je prikazano nekoliko povezanih okvira koje prizivaju reči iz domena rizika. U radu je predstavljena i platforma NLTК pomoću koje se mogu koristiti ...... Language Review 27:87–112. Драгићевић, Раjна. 2007. Лексикологиjа српског jезика. Београд: Завод за уџбенике. Марковић, Александра. 2017. “Однос граматике и речника – граматика инхерентна описним речницима српског jезика.” Наш jезик XLVIII (1-2): 27–43. Поповић, Љубомир. 2003. “Интегрални речнички модели ...Aleksandra Marković, Ranka Stanković, Natalija Tomić, Olivera Kitanović. "FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.1.1
-
A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian
Uvredljivi govor na društvenim medijima, uključujući psovke, pogrdni govor i govor mržnje, dostigao je nivo pandemije. Sistem koji bi bio u stanju da detektuje takve tekstove mogao bi da pomogne da internet i društveni mediji postanu bolji virtuelni prostor sa više poštovanja. Istraživanja i komercijalna primena u ovoj oblasti do sada su bili fokusirani uglavnom na engleski jezik. Ovaj rad predstavlja rad na izgradnji AbCoSER-a, prvog korpusa uvredljivog govora na srpskom jeziku. Korpus se sastoji od 6.436 ručno označenih ...Danka Jokić, Ranka Stanković, Cvetana Krstev, Branislava Šandrih. "A Twitter Corpus and Lexicon for Abusive Speech Detection in Serbian" in 3rd Conference on Language, Data and Knowledge (LDK 2021), MDPI AG (2021). https://doi.org/10.4230/OASIcs.LDK.2021.13
-
Српски језик у дигиталном добу -- The Serbian Language in the Digital Age
Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević (2012)... описаћемо улогу српског језика у европскоминформациономдруштвуидаћемооцену текућег стања језичких технологија за српски језик. 9 3 СРПСКИ ЈЕЗИК У ЕВРОПСКОМ ИНФОРМАЦИОНОМ ДРУШТВУ 3.1 ОПШТИ ПОДАЦИ Српски стандардни језик је национални стандардни језик Сра и званични језик у Репулици Срији. Формиран ...
... језич- ким технологијама српског језика. 19 4 JЕЗИЧКE ТЕХНОЛОГИЈE ЗА СРПСКИ ЈЕЗИК Језичке технологије су софтверски системипројекто- вани за рад са природним језицима. Зог тога се ове технологије често подводе под термин „технологија природних језика“. Природни језици се јављају у го- ворном и писаном ...
... први корпус са- временог српског језика, електронски морфолошки речник, паралелни француско-српски и енглеско- српски корпуси литерарних текстова, као и разли- чити софтверски алати развијени су у оквиру зајед- ничких пројеката Математичког факултета и Одсека за српски језик Филолошког факултета у Београду ...Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić, Mladen Stanojević. "Српски језик у дигиталном добу -- The Serbian Language in the Digital Age" in META-NET White Paper Series, G. Rehm, H. Uszkoreit (eds.), Springer (2012)
-
Proširivanje upita zasnovano na leksičkim resursima
U radu je opisano kako se leksički resursi za srpski jezik i softverski alati, razvijeni u okviru Grupe za jezičke tehnologije Univerziteta u Beogradu, mogu koristiti za unapređenje postavljanja upita. Rezultati pretrage mogu biti značajno unapređeni korišćenjem različitih leksičkih resursa, kakvi su morfološki rečnici i semantičke mreže. Izloženi pristup može se iskoristiti i u Sistemu naučnih, tehnoloških i poslovnih informacija, jer je efikasno pretraživanje ovog dragocenog resursa, imajući u vidu njegovu heterogenost i obim, kao i preovladavajući tekstualni sadržaj, ...... Pored korpusa srpskog jezika, kao i višejezičnih paralelnih korpusa, od posebnog su značaja sistem morfoloških rečnika srpskog jezika, kao i semantička mreža za srpski jezik (srpski wordnet) razvijena u okviru međunarodnog projekta Balkanet (Tufiş ed., 2004). Srpski elektronski morfološki rečnik ...
... različite načine u različitim jezicima a relevantan dokument za postavljeni upit može biti i dokument na jeziku koji se razlikuje od jezika upita, pa stoga i višejezično proširenje upita može biti od značaja. 2. LEKSIČKI RESURSI Leksički resursi za srpski jezik se razvijaju u okviru Grupe ...
... kao i preovladavajući tekstualni sadržaj može značajno unaprediti korišćenjem različitih leksičkih resursa. U jezicima sa bogatim morfološkim sistemom, kakav je srpski jezik, standardni način postavljanja upita ispoljava dodatne manjkavosti. Sem toga, jedan isti koncept može biti leksikalizovan ...Ranka Stanković, Ivan Obradović, Cvetana Krstev. "Proširivanje upita zasnovano na leksičkim resursima" in SNTPI 09 - Naučno-stručni skup Sistem naučnih, tehnoloških i poslovnih informacija, Beograd 19. i 20. jun 2009, Beograd : Fakultet informacionih tehnologija (2009)
-
Integracija heterogenih tekstualnih resursa
Ranka Stanković, Ivan Obradović (2007)U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.... kao i višejezičnih paralalenih korpusa, od posebnog su značaja sistem morfoloških rečnika srpskog jezika (SMR), kao i semantička mreža za srpski jezik (srpski wordnet – SWN) razvijena u okviru međunarodnog projekta Balkanet (Tufiş 2004). S obzirom na to da su ovi resursi nastajali tokom dužeg vremena ...
... resursi za srpski jezik se razvijaju u okviru Grupe za jezičke tehnologije na Matematičkom fakultetu Univeziteta u Beogradu (Grupa) već duži niz godina, tako da je danas na raspolaganju veliki broj različitih resursa, razvijenih u značajnom obimu (Vitas et al. 2003). Pored korpusa srpskog jezika, kao ...
... rutina i korišćenja eksternih Perl, Awk, XSLT skriptova iz samog WS4LR okruženja. Mada je WS4LR uglavnom korišćen za srpski jezik, njegova upotreba nije zavisna od jezika. Jedina pretpostavka je da resursi postoje ili da se razvijaju prema opisanim formatima i metodologijama. 3 3. Osnovni ...Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Белешка о дигитализацији речника
У раду ће се анализирати ограничења која проистичу из линеарног процеса традиционалне израде речника на примеру Речника САНУ. Начин да се превазиђу ова ограничења се састоји у формирању електронске лексикографске базе која не представља само пуку дигиталну транскрипцију папирног издања речника. Посебно се указује на чињеницу да текст речника може представљати корпус и приказују се одабрани примери анализе таквог корпуса формираног из текстове 1. и 19. тома Речника САНУ.... 1959–2019: речник српскохрватског књижевног и народног језика сану, књ. I–XX, Београд: Институт за српски језик САНУ. Тасовац 2017: караџић, вук стефановић, српски рјечник: дигитално из- дање (ур. Тома Тасовац) Београд: Институт за српски језик и Центар за дигиталне хуманистичке науке, 2017. ISBN: ...
... Витас 2016: Душко Витас, „Инфраструктура за изучавање и обраду српског језика”, у: зборник института за српски језик сану III (уредник Срето Танасић), Београд: Институт за српски језик САНУ, 115–129. Еткинс и др. 2008: Atkins, B. T. Sue; Michael Rundell. The Oxford Guide to Practical Lexicography. Oxford ...
... Душко М. Витас, Цветана Ј. Крстев, Ранка М. Станковић50 наликује на однос какав постоји између језика који имају писмо и језика који су остали без њега. Квалитетан речнички ресурс за српски језик би могао бити Речник САНУ (РСАНУ 1959–2019, даље само Речник), али, као што је показано у (Витас ...Душко М. Витас, Цветана Ј. Крстев, Ранка М. Станковић. "Белешка о дигитализацији речника" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch3
-
New Language Models for South Slavic Languages
Mihailo Škorić (2024)Izlaganje će predstaviti izazove i perspektive modelovanja južnoslovenskih jezika, sa posebnim osvrtom opšte jezičke modele građene na arhitekturi transformera (BERT, GPT), na dostupne skupove tekstova za obučavanje tih modela, te kvantitet i kvalitet tih skupova. Izlaganje će ponuditi pregled dostupnih skupova i modela, dok će posebna pažnja biti posvećena najnovijim korpusima tekstova. Prvi korpus, Kišobran, predstavlja krovni veb korpus južnoslovenskih jezika i ujedno trenutno najveći korpus tekstova na našim prostorima koji broji preko osamnaest milijardi reči i uključuje sve ...Mihailo Škorić. "New Language Models for South Slavic Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024)
-
Глаголи у кухињи и за столом
Цветана Крстев, Биљана Лазић (2015)У раду је приказано истраживање лексике на српском језику кулинарског домена које се заснива на коришћењу доменског корпуса, електронских лексичких ресурса, пре свега WordNet-а и морфолошких речника, и локалних граматика. Приказане су доменске специфичности ових ресурса, како се користе, и међусобно употпуњују. Посебно је приказано како се коришћењем доменског корпуса могу екстраховати глаголи специфични за кулинарски домен и описати начини њиховог коришћења. Дат је попис глагола са основним подацима који је добијен применом представљених метода.аутоматска обрада, коначни трансдуктори, електронски речници, семантичке мреже, локалне граматике, кулинарство... Маркери приближних мера у кулинарсту у е-речнику c. Ворднет за српски језик и кулинарски домен Развој семантичке мреже ворднет (WordNet) за српски језик је отпочео с пројектом BalkaNet9 2001. године. На крају пројекта 2004. године српски ворднет је имао 7.000 синсетова,10 али његов развој је настављен ...
... пршут – која је српски специфичан коцепт.13 Тако српски ворднет данас има скоро 1.600 синсетова који припадају директно кулинарском домену. Слика 1 Грана у српском ворднету која отпочиње са синсетом намирница. 3. Истраживања кулинарске лексике Истраживачи српског језика бавили су се кулинарском ...
... значајан допринос. 13Треба уочити да овде није од значаја да ли је његушки пршут специфичан за српски језик и културу, већ да није преузет из Принстонског ворднета, па је, према томе, „специфичан српски концепт“. 14 http://www.fil.bg.ac.rs/wp-content/uploads/postdiplomske/obavestenja/teze.pdf ...Цветана Крстев, Биљана Лазић. "Глаголи у кухињи и за столом" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и преимене, Вол. 44/3, Београд : Међународни славистички центар (2015)
-
Integrisanje heterogenih leksičkih resursa
Osnovna aktivnost Grupe za obradu prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena u okviru međunarodnog projekta Balkanet. Radi se o dva heterogena leksička resursa, razvijena na osnovu sasvim različitih modela, koji samim tim sadrže i različite vrste leksičkih informacija. Integracijom ovih resursa, informacije ...... prirodnih jezika na Matematičkom fakulteta Univeziteta u Beogradu je usmerena na razvoj različitih resursa za obradu srpskog jezika. Među njima su posebno značajni sistem morfoloških rečnika srpskog jezika razvijenih u okviru mreže RELEX [1] i semantička mreža (tipa wordnet) za srpski jezik razvijena ...
... tekstova na osnovu proizvoljno izabrane leme iz jednog derivacionog gnezda, uz pomoć konačnih transduktora. • Srpski wordnet (SWN), semantička mreža koncepata za srpski jezik, razvijen je u okviru međunarodnog projekta Balkanet ([2]) koji je zasnovan na modelu razvijenom u okviru projekta ...
... okruženje za integrisanje srpskog MR I SWN izabrana je Microsoft .Net tehnologija, sa C# programskim jezikom. Kako je XML u osnovi mnogih komponenti Visual Studio .NET-a i .NET Framework-a, činjenica da su srpski i ostali balkanski WN u XML formatu olakšava je korišćenje ovih alata. Pri tome, XML Schema ...Ranka Stanković, Cvetana Krstev, Duško Vitas, Ivan Obradović, Gordana Pavlović-Lažetić. "Integrisanje heterogenih leksičkih resursa" in Festivalski katalog 11. Festivala informatičkih dostignuća INFOFEST 2004, 26th September - 2nd October, 2004, Budva, Montenegro, INFOFEST (2004)
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... sadržine, najčešće na dva različita jezika. Treba, međutim, napomenuti da paralelni tekstovi mogu postojati i na istom jeziku, recimo kada se radi o dva različita prevoda istog književnog dela. Paralelni tekstovi se mogu sastojati i od više tekstova, na više jezika, pri čemu je bitno da su svi tekstovi ...
... odgovarajućim prevodom na jednom ili više ciljnih jezika, ovakav format je pogodan i za paralelizovane tekstove koji takođe nastaju prevođenjem sa jednog jezika na drugi. U TMX formatu se koriste ISO standardi za datume, vreme, i oznake država i jezika. Trenutna verzija standarda je TMX 1.4b, mada je ...
... koristiti u istraživanjima iz oblasti dvojezične odnosno višejezične leksikografije, za učenje stranog jezika, za prevođenje, za lingvistička istraživanja ili uporedna izučavanja dva ili više jezika, itd. Treba napomenuti da pored korpusa paralelenih odnosno paralelizovanih tekstova, postoje i uporedni ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... ни назив лексичке релације”) POS врста речи задате леме X: именица (N), придев (A), гла- гол (V) lngIn језик задате леме X, подразумевано српски (sr) lngOut језик резултата, подразумевано српски (sr) alphOut писма резултата: ћирилица (C), латиница (L), кôд аурора (A) или нека њихова комбинација (LC ...
... СрпКор2013. Параметарска датотека (енгл. language parameter file) за српски језик, коју TreeTagger користи као дигитални лексички ресурс за анотацију, настала је као дериват система морфолошких електронских речника српског језика (у даљем тексту: СМР) чији су аутори Цветана Крстев и Душко Витас (Крстев ...
... Вебран гене- рише проширење упита на основу различитих лексичких ресурса српског језика, од којих су најзначајнији: • СМР, систем морфолошких електронских речника српског језика (Крстев 2008), • семантичка мрежа Српски ворднет10 (Крстев и др. 2004), • терминолошке базе Терми11, • онтологија из ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
English for Geology Students. 1
Lidija Beko (2023)... BNAAA ARRAAA E 206 Predgovor Udžbenik Engleski jezik 1 za geologe je univerzitetski priručnik čijije glavni cilj da obezbedi infor- mativnu bazu i bude upotrebljiv akademski model za učenje osnovnih principa i pojmova iz oblasti engleskog jezika za geologe. Čitljivim i razumljivim tekstovima, za ...
... okvira za jezike, pri čemu se čestim podelama na naslove i podnaslove, polaznicima omogućava da ponudili fotografije i vizuelne materijale visokog kvaliteta, koji su pažljivo odabrani sugestijama pozvanih profesora kako bi unapredili autentičnosti realizam geologije i njenog pratećeg jezika. Naučna ...
... istraživanja iz oblasti jezika pokazuju da polaznici najbolje uče kada se aktivno angažuju, na primer u kombinaciji teksta i prakse, teksta i realnog života ili teksta i umetnosti. Kako bismo obezbedili da se studenti sećaju akademskih termina, geoloških koncepata i jezika relevantnog u komunikacionim ...Lidija Beko. English for Geology Students. 1, Belgrade : The Faculty of Mining and Geology, 2023