Skip to main content
BDAR

Slapukų naudojimas

Siekdami užtikrinti geriausią Jūsų naršymo patirtį, šioje svetainėje naudojame slapukus (angl. cookies). Naršydami toliau, patvirtinsite savo sutikimą naudoti slapukus. Savo sutikimą bet kada galėsite atšaukti, pakeisdami interneto naršyklės nustatymus ir ištrindami įrašytus slapukus.

 

Kvietimo numeris

02-106-P

Projekto numeris

02-106-P-0001

Sutarties įsigaliojimo data

2024-09-26 00:00

Projekto vykdytojas

Valstybės skaitmeninių sprendimų agentūra

Vykdytojo kodas

188772433

Veiklų vykdymo pabaigos data

2026-04-30 00:00

Administruojanti institucija

Centrinė projektų valdymo agentūra

Bendra projekto tinkamų finansuoti išlaidų suma

1 343 098,04 €

Projektu sprendžiamos problemos

Projekto metu kuriami skaitmeniniai kalbos ištekliai yra labai svarbūs šių dienų kontekste. Žvelgdami į per pastarąjį dešimtmetį padarytą įspūdingą informacinių technologijų (toliau – IT) pažangą, matome, kad bendrauti išmaniaisiais prietaisais tampa kasdieniniu natūraliu dalyku. Vis dėlto, kalbų technologijos yra iš esmės grindžiamos kalba ir didžioji dalis iki šiol padarytos pažangos yra susijusi tik su viena kalba – anglų. Išsamūs tyrimai ir Europos Parlamento rezoliucija „Kalbų lygybė skaitmeniniame amžiuje“ nustatė ryškų naudojamų kalbų technologijų disbalansą ir ragina imtis veiksmų susiklosčiusiai situacijai keisti. Norvegų, švedų ir danų (toliau – Skandinavų) kalbos vis dažniau vadinamos ateities kalbomis. Skandinavų šalys pirmauja visuose ekonominiuose ir socialiniuose tyrimuose. Šios valstybės priklauso konkurencingiausioms pasaulio šalims. Pasauliniame Šveicarijos tarptautinio valdybos instituto IMD (angl. Index of Multiple Deprivation) konkurencingumo 2024 m. reitinge šios šalys yra pirmame dešimtuke. Kasmet auga Lietuvos ir Skandinavijos komercinių mainų vertė. Artima geografinė padėtis, nedidelės išlaidos ir kvalifikuoti darbuotojai skatina Skandinavijos įmones plėtoti verslą Lietuvoje. Lietuvos įmonės taip pat vis labiau ieško galimybių įsitvirtinti Skandinavijos rinkoje. Žinoma, vienas iš bendradarbiavimo iššūkių yra kalba. Nors šių šalių kalbos ir lietuvių kalba priklauso tai pačiai indoeuropiečių kalbų grupei, tarp jų panašumų mažai. Jos nėra vienalytės, esama daug tarmių. Šios kalbos dažnai painiojamos, skiriasi tam tikromis detalėmis. Lietuvių kalba taip pat yra sudėtinga su savo gramatikos taisyklėmis, linksnių taikymu, sakinio sandara ir yra didelis iššūkis kurti technologijas, leidžiančias teisingai versti iš mūsų kalbos į Skandinavų kalbas. Tokie IT sprendimai yra brangūs, imlūs laikui ir verslas investuoja tik į siauras tekstynų kūrimo sritis, susijusias su jų komerciniais tikslais. Viešasis sektorius, kurdamas tekstynus Skandinavų kalbomis, sudarys sąlygas kurti mašininio vertimo technologijas, kurių pagalba užsienio piliečiai turės galimybę gauti viešąsias el. paslaugas jiems suprantama kalba. Verslui nereikės investuoti kuriant tekstynus – užteks paimti Projekto metu sukurtus tekstynus ir naudoti juos savo veikloje. Taip pat yra labai svarbu, kad šių tekstynų pagalba sukurtomis mašininio vertimo priemonėmis galės naudotis ir emigrantai, gyvenantys Skandinavijos šalyse ir nemokantys, arba mažai mokantys šias kalbas, dėl to patiriantys socialinę atskirtį, negalintys pasinaudoti viešosiomis paslaugomis ir kt. Lietuvoje jau nuo 2004-2006 m. Europos Sąjungos (toliau – ES) struktūrinės paramos kuriami didesni ar mažesni tekstynai pagrindinėmis kalbomis – anglų, prancūzų, vokiečių. Tačiau iki šiol nebuvo kurta tekstynų ispanų kalba. Pastaruosius 15 metų galima stebėti, kaip Lietuvoje auga susidomėjimas ispanų kalba ne tik universitetuose ir aukštosiose mokyklose, bet verslo sektoriuje, privačiose iniciatyvose. Ispanų kalba šių laikų pasaulyje užima vis tvirtesnes pozicijas. Pagal kalbančiųjų skaičių, ispanų kalba patenka į dažniausiai naudojamų kalbų penketuką ir siekia apie penkis šimtus milijonų gyventojų. 21 valstybėje ši kalba yra pripažinta valstybine kalba, ja kalbama penkiuose kontinentuose. Ispanų kalba paplitusi ne tik geografinėje, bet ir virtualioje erdvėje. Todėl labai svarbu kurti ir plėtoti technologijas, gebančias susikalbėti šia klaba. 2022 m. vasario 24 d. Rusijai pradėjus karinę agresiją prieš Ukrainą, ES, reaguodama į situaciją, 2022 m. kovo 4 d. aktyvavo laikinosios apsaugos direktyvą , kuria visiems iš Ukrainos bėgantiems žmonėms, nesvarbu, kuriai kategorijai jie priskiriami, suteikiama galimybė patekti į ES teritoriją prieš jiems grįžtant į savo kilmės vietą. Migracijos departamento duomenimis, šiai dienai Lietuvoje yra daugiau kaip 87 tūkst. karo pabėgėlių iš Ukrainos. Viena didžiausių problemų, su kuria susiduria šie žmonės – kalbos barjeras. Projekto metu kuriami ukrainiečių kalbos daugiakalbis ir vienkalbis tekstynai leis kurti mašininio vertimo priemones, skirtas mažinti socialinę atskirtį karo pabėgėliams. Tai leis jiems suprasti viešojo sektoriaus interneto svetainių turinį, pasinaudoti el. paslaugomis, aktyviau integruotis į darbo rinką. Kurti tekstynus, skirtus mašininio vertimo technologijai, ne tokiomis populiariosiomis (anglų, prancūzų, vokiečių) kalboms, yra kur kas sudėtingiau, nes šios kalbos neturi tiek daug resursų, kurie padėtų tobulinti technologiją. Todėl jaučiama takoskyra tarp kalbų, vertimai atliekami ne taip tiksliai bei kokybiškai. Įvairių kalbų tekstynai yra kuriami ir privataus sektoriaus, ypač didžiųjų IT įmonių, tačiau labai svarbu, kad tekstynus kurtų viešojo sektoriaus institucijos, universitetai, mūsų šalies specialistai. Viešasis sektorius turi stiprią darbo etiką, jų kurti tekstynai užtikrina norminės kalbos vartojimą, teisingai sudarytas sakinių formuluotes, kas didina mašininio vertimo tikslumą. Kuriami tekstynai yra pritaikomi prie teikiamų viešųjų paslaugų, yra suprantami piliečiams. Projekto metu bus kuriami tekstynai 5 kalbomis. Lietuviškai kalbančios visuomenės poreikiams versti tekstus, interneto svetaines ir kitą informaciją naudojantis vertėjų žmogiškaisiais resursais yra beveik neįmanoma ir net netikslinga dėl dinamiškai kintančio tinklalapių turinio, milžiniškų apimčių ir daugelio kitų priežasčių (tinklalapių atrankos kriterijų, neekonomiškumo ir t.t.). Todėl menkiau išsilavinusių asmenų, kaimo vietovių gyventojų, vyresniųjų amžiumi ar kitų, tiesiog nemokančių ukrainiečių, ispanų, norvegų, švedų ar danų kalbų, sąsajos su tolesne progresyvia visuomenės plėtra yra suvaržytos, kas lemia didėjančią socialinę atskirtį. Problema, kuri bus išspręsta įgyvendinus projektą – skirtingų kalbų išteklių, reikalingų dirbtinio intelekto sprendimams, nebuvimas. Įgyvendinant projektą, bus sukurti 5 kompleksiniai lietuvių kalbos ištekliai – lygiagretūs (paraleliniai) daugiakalbiai ir vienkalbiai tekstynai, reikalingi plėtoti dirbtinio intelekto (toliau – DI) technologijas, ispanų, ukrainiečių, norvegų, švedų ir danų kalbomis. Projekto rezultatai taip pat: 1. sudarys sąlygas kurti naujomis technologijomis pagrįstus sprendimus, juos diegti kuriant pažangias skaitmenines paslaugas ir teikti šias paslaugas visuomenei; 2. prisidės prie lietuvių kalbos išsaugojimą ir gyvybingumą palaikančių skaitmeninių išteklių plėtros. Taigi, projektu kuriami nauji kalbos ištekliai yra labai svarbūs Lietuvos ekonomikai, gyventojams, mažina socialinę atskirtį ir prisideda prie DI technologijų plėtros. Projektas prisidės prie Nacionalinio pažangos plano 1.7 uždavinio „Skatinti valstybės skaitmeninimą“ įgyvendinimo.
Daugiau Mažiau

Projekto tikslas

Projekto tikslas - sukurti 5 kompleksinius lietuvių kalbos išteklius - paralelinius ir vienkalbius tekstynus ukrainiečių, norvegų, švedų, danų, ispanų kalbomis. Kiekvieną kompleksinį kalbos išteklių sudarys du tekstynai (nematerialaus turto vienetai) – vienkalbis ir paralelinis (lygiagretusis) tekstynai.

Programos tipas

Naujos kartos Lietuva

Komponentas

Skaitmeninė transformacija ekonomikos augimui
Teritorija, kuriai tenka didžioji dalis projekto lėšų
Regionas Apskritis Savivaldybė
Netaikoma Vilniaus apskritis, Alytaus apskritis, Kauno apskritis, Klaipėdos apskritis, Marijampolės apskritis, Panevėžio apskritis, Šiaulių apskritis, Tauragės apskritis, Telšių apskritis, Utenos apskritis Vilniaus m. sav., Jonavos r. sav., Telšių r. sav., Elektrėnų sav., Molėtų r. sav., Palangos m. sav., Kauno m. sav., Prienų r. sav., Klaipėdos m. sav., Kauno r. sav., Vilkaviškio r. sav., Tauragės r. sav., Klaipėdos r. sav., Alytaus m. sav., Ignalinos r. sav., Kretingos r. sav., Anykščių r. sav., Šiaulių r. sav., Panevėžio m. sav., Šiaulių m. sav., Lazdijų r. sav., Druskininkų sav., Utenos r. sav., Panevėžio r. sav., Biržų r. sav., Varėnos r. sav., Joniškio r. sav., Marijampolės sav., Rokiškio r. sav., Šalčininkų r. sav., Akmenės r. sav., Šakių r. sav., Alytaus r. sav., Kazlų Rūdos sav., Vilniaus r. sav., Rietavo sav., Kaišiadorių r. sav., Pakruojo r. sav., Kelmės r. sav., Ukmergės r. sav., Plungės r. sav., Šilutės r. sav., Mažeikių r. sav., Šilalės r. sav., Švenčionių r. sav., Pagėgių sav., Radviliškio r. sav., Kėdainių r. sav., Jurbarko r. sav., Raseinių r. sav., Trakų r. sav., Neringos sav., Kupiškio r. sav., Kalvarijos sav., Zarasų r. sav., Širvintų r. sav., Pasvalio r. sav., Birštono sav., Visagino sav., Skuodo r. sav.
ES fondas
Veiklos pavadinimas Fondas
Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra Ekonomikos gaivinimo ir atsparumo didinimo priemonė
Finansavimo šaltiniai
Finansavimo šaltinio kodas Finansavimo šaltinio forma Finansavimo šaltinio suma
1. Projektams skiriamos finansavimo lėšos 1 343 098,04 €
1.2. EGADP subsidijos lėšos 1 109 998,39 €
1.6. Valstybės biudžeto lėšos, skirtos ES fondų lėšomis netinkamam finansuoti PVM apmokėti 233 099,65 €
2. Nuosavas įnašas 0,00 €
Projekto veiklos
Sutarties projekto veiklos numeris ir pavadinimas Sutarties poveiklės numeris ir pavadinimas
05-002-01-07-08-02 Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra 05-002-01-07-08-02-02 Kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra (planavimo būdu)
Sutarties intervencinių priemonių srities duomenys
  • 021a - Parama skaitmeninio turinio kūrimui ir platinimui
Mums svarbi Jūsų patirtis naudojantis virtualiu asistentu – palikite atsiliepimą, tai užtruks vos minutę.
Ar radote informaciją, kurios ieškojote?
1 žvaigždutė „Ne, neradau“
5 žvaigždutės „Taip, radau viską“
Virtualus asistentas aktualių kvietimų paeiškai