Procesarea limbajului natural, subiect de interes comun pentru lingviști și informaticieni

21.11.2022
Vizitatori unici: 386

Comunicarea om-calculator în limbaj uman a fost una din problemele, pe care și-au propus să o soluționeze cercetătorii – lingviști și informaticieni – încă de la apariția primelor calculatoare electronice. Extrem de dificilă și aparent fără speranțe într-un rezultat satisfăcător la începutul erei tehnologiilor informaționale, astăzi putem afirma cu certitudine că pentru această provocare avem soluții mai mult decât acceptabile, dovadă fiind sistemele de traducere automată de o calitate bună, operarea prin semnal vocal integrată în orice telefon mobil, conversia text-vorbire-text, asistenții personali cu care poți comunica în limba ta maternă, dar și soluționarea problemelor de procesare a textelor (datelor) nestructurate în vederea obținerii de noi cunoștințe, digitizarea masivă a documentelor din diferite perioade istorice etc.

Acest subiect constituie tematica seriei de conferințe „ConsILR - Resurse și instrumente lingvistice pentru procesarea limbajului natural”, ajunse la cea de a 17-a ediție. Început în anul 2001 cu un atelier de lucru dedicat cercetărilor și elaborărilor respective pentru limba română, evenimentul a luat amploare devenind o conferință internațională, reunind specialiști în lingvistică computațională, informaticieni, lingviști, precum și reprezentanți ai altor științe umaniste, fiind în egală măsură adresată doctoranzilor, studenților și masteranzilor din toate aceste domenii. Vom menționa, că cercetătorii din Republica Moldova nu au lipsit de la niciuna din aceste întruniri.

Ediția din acest an a avut loc în perioada 10-12 noiembrie 2022 la Chișinău, pentru prima oară lucrările fiind desfășurate în afara României, cu o semnificativă participare a cercetătorilor din Ucraina, cărora le-a fost dedicat evenimentul, aducându-se astfel o apreciere eroismului țării vecine, manifestat în luptă cu agresorii ruși. După două ediții online, cauzate de restricțiile pandemiei COVID-19, în sfârșit a apărut posibilitatea să se facă un pas spre normalitate, operându-se într-un format mixt (cu prezență fizică și conexiune la distanță).  În același cadru s-a desfășurat și cel de-al doilea Workshop din cadrul proiectului DeLORo - Artificial Intelligence Models (Deep Learning) Applied in the Analysis of Old Romanian Language (Modele de inteligență artificială (Învățare profundă) aplicate în analiza limbii române vechi).

Conferința a derulat sub egida a două Academii – Academia Română și Academia de Științe a Moldovei, în primul caz responsabilitatea fiind asumată de către Consorțiul de Informatizare pentru Limba Română (acronimul căruia – ConsILR precede denumirea conferinței), care activează în cadrul Secției Știința și Tehnologia Informației, în cel de al doilea – de Secția Științe Exacte și Inginerești.  

Organizatorii-gazdă, de rând cu AȘM, au fost Institutul de Matematică și Informatică “Vladimir Andrunachievici” și Universitatea Tehnică a Moldovei, care au lucrat în strânsă colaborare cu colegii de la Facultatea de Informatică a Universității “A.I.Cuza” din Iași, Institutul de Cercetări pentru Inteligență Artificială “Mihai Drăgănescu” al Academiei Române,  Institutul de Informatică Teoretică (Filiala Iași a Academiei Române), Institutul de Filologie Română “A.Philippide” (Filiala Iași a Academiei Române), Asociația Română de Lingvistică Computațională.  O contribuție importantă au adus-o și membrii comitetului științific din șase țări, prin eforturile cărora a fost substanțial îmbunătățită calitatea lucrărilor.  

Programul conferinței a cuprins 5 secțiuni, care reflectă tendințele actuale în domeniu, anume: Crearea și adnotarea corpusurilor; Instrumente de procesare a limbajului; Resurse lingvistice românești; Patrimoniul digital; Semantica și pragmatica. În cadrul conferinței au fost susținute cinci discursuri principale și anume: Maria Shvedova. „Adnotarea regională în cadrul GRAC, un corpus de referință largă pentru limba ucraineană” (Universitatea Națională Politehnică din Lviv, Ucraina);  Ruslan Mitkov. „Cu puțin ajutor de la NLP: aplicațiile My Language Technology cu impact asupra societății” (Universitatea Wolverhampton, Marea Britanie);  Maciej Ogrodniczuk. „ParlaMint: Corpus comparabil multilingv al dezbaterilor parlamentare” (Institutul de Informatică, Academia de Științe din Polonia);  Christiane Fellbaum. „Scala în lexicon: identificare, construcție, aplicații” (Universitatea Princeton, SUA);  Constantin Orăsan. „Ce ne spune traducerea automată despre sentimente în alte limbi” (Universitatea din Surrey, Marea Britanie). Cercetătorii din Republica Moldova (Academia de Științe a Moldovei, Institutul de Matematică și Informatică “Vladimir Andrunachievici”) au prezentat un referat invitat întitulat „HeDy – o platformă pentru procesarea documentelor eterogene”, în care și-au expus rezultatele ce țin de integrarea metodelor de preprocesare, recunoaștere, transliterare și postprocesare a documentelor contemporane și vechi, care în afară de text conțin și elemente de altă natură: formule, tabele, diagrame etc. De rând cu aceștea, din partea țării noastre au venit cu prezentări importante lingviștii de la Institutul de Filologie Română “B.P.Hașdeu” (dr. Eugenia Mincu) și Universitatea de Stat „Alecu Russo” din Bălți (dr. Mircea Petic, doctorand Alexandru Parahonco).

Și deoarece conferința și-a deschis lucrările în zi de sărbătoare – Ziua internațională a științei pentru pace și dezvoltare – Prezidiul Academiei de Științe a Moldovei a conferit unele distincții participanților la eveniment: Medalia „Nicolae Milescu Spătarul” a Academiei de Științe a Moldovei domnului Dan Ioan Tufiș, membru titular al Academiei Române, doctor în știința calculatoarelor, profesor, director al Institutului de Cercetări pentru Inteligență Artificială „Mihai Drăgănescu” al Academiei Române, pentru merite deosebite în dezvoltarea inteligenței artificiale și contribuții substanțiale în colaborarea științifică cu cercetătorii din Republica Moldova; de aceeași distincție s-a învrednicit și membrul corespondent al Academiei Române, dr. Dan Cristea, cercetător științific principal la Institutul de Informatică Teoretică, filiala Iași a Academiei Române, profesor emerit al Universității „A.I. Cuza” din Iași, pentru merite deosebite în dezvoltarea informaticii  și colaborarea științifică fructuoasă cu cercetătorii din Republica Moldova. O conlucrare extrem de productivă informaticienii din țara noastră o au cu Facultatea de Informatică a Universității din Iași, activitățile comune fiind materializate în participări din ambele părți în comisiile pentru susținerea tezelor de doctorat, stagii de cercetare, organizări de conferințe și editări de volume și reviste.  În semn de apreciere a rezultatelor obținute în cercetarea informatică, precum și a aportului în dezvoltarea relațiilor de colaborare, domnului dr. Adrian Iftene, decan al acestei facultăți, i-a fost conferită diploma Academiei de Științe a Moldovei “Meritul Academic”. Și nu în ultimul rând îl vom menționa pe colegul nostru de la Institutul de Matematică și Informatică “Vladimir Andrunachievici” dr. Alexandru Colesnicov, căruia i-a fost decernată  Medalia „Nicolae Milescu Spătarul”.

Lucrările conferinței au adus contribuții noi și valoroase la dezvoltarea domeniului prelucrării limbajului natural, multe din ele fiind axate pe aplicații pentru limba română. Volumul respectiv va apare în curând la editura Universității “A.I.Cuza” din Iași, urmând să fie indexat în baza de date Web of Science.

 

m.c. Svetlana Cojocaru,

conducător al Secției Științe Exacte și Inginerești

Sursa:
Categorie: