Inteligența Artificială începe să traducă gândurile în cuvinte

Life style 22:52

Ce părea imposibil – să transformi „zgomotul” electric al creierului în fraze lizibile – începe să capete formă în laborator, cu ajutorul inteligenței artificiale. De la texte scrise direct din „vocea interioară”, până la descrieri ale imaginilor din minte, noile interfețe creier–computer promit să redea comunicarea celor blocați în tăcere și să schimbe, pe termen lung, felul în care interacționăm cu lumea.

Femeia stătea perfect nemișcată. Doar respirația îi trăda efortul – ritmică, atentă, aproape calculată. Privirea îi era fixată într-un punct, iar mâna strânsă în pumn părea să țină înăuntru tot ceea ce corpul nu mai putea rosti. Pe ecran, însă, apăreau cuvinte. Încet, literă cu literă, fraze întregi. Fraze pe care nu le putea spune cu voce tare.

Avea cincizeci și doi de ani și fusese paralizată de un accident vascular cerebral cu nouăsprezece ani în urmă. Vorbirea îi rămăsese grav afectată, iar lumea ei se contractase într-un spațiu al comunicării fragmentate. În cadrul unui studiu clinic, medicii i-au implantat o mică matrice de electrozi într-o zonă din partea frontală a creierului. De acolo, semnalele neuronale – acele scântei care însoțesc intenția de a vorbi – erau captate și trimise către un computer. Diferența majoră față de încercările anterioare: algoritmii de învățare automată începeau să recunoască tiparele din activitatea cerebrală nu doar când participantul încerca să rostească, ci și când își imagina cuvintele. „Vocea interioară” se transforma în text, în timp aproape real.

Pentru neurologi, a fost una dintre cele mai apropiate demonstrații de până acum ale așa-numitului „citit al minții” – un termen tentant, dar înșelător. Nu e vorba de acces la gânduri nelimitate, ci de traducerea unor semnale specifice, din zone precise ale creierului, în elemente de limbaj, după o perioadă de antrenare și calibrare. Totuși, faptul că un monolog interior poate fi prins, măcar parțial, de electrozi și decodat de un model AI a schimbat brusc ambiția întregului domeniu: interfețele creier–computer nu mai sunt doar despre mișcare, ci despre comunicare.

În aceeași linie, echipe de cercetare din Japonia au prezentat un pas paralel, la fel de tulburător: o tehnică de „captionare a minții”, capabilă să producă descrieri detaliate ale a ceea ce o persoană vede sau își imaginează. De această dată, nu era nevoie de implanturi; tehnologia a combinat instrumente AI cu scanări cerebrale neinvazive, transformând activitatea neuronală în fraze care descriu conținutul mental. Pentru publicul larg, ideea sună ca science-fiction. Pentru laboratoare, e începutul unei ferestre mai mari către intimitatea cognitivă.

Miza imediată rămâne, însă, una profund umană: comunicarea pentru oamenii care nu o mai pot avea. În ultimii ani, cercetările s-au accelerat în special pentru pacienți cu scleroză laterală amiotrofică – boală neurodegenerativă care poate duce la paralizie și la ceea ce este cunoscut drept „locked-in syndrome”, când mintea rămâne lucidă, dar corpul nu mai răspunde. În experimente anterioare, participanții au reușit să scrie propoziții în engleză imaginându-și gesturi precum „desenarea” literelor în aer. Rezultatul a demonstrat că se poate, dar viteza era încă departe de conversația naturală: aproximativ optsprezece cuvinte pe minut.

Pasul următor a fost mai ambițios: să fie decodate direct cuvintele asociate procesului de vorbire, nu literele „scrise” mental. Într-un test ulterior, un sistem a transformat tentativa de vorbire a unui pacient cu scleroză laterală amiotrofică în text pe ecran cu aproximativ treizeci și două de cuvinte pe minut și o acuratețe de aproape nouăzeci și opt la sută. Chiar și așa, vorbirea naturală are un ritm de ordinul a o sută cincizeci de cuvinte pe minut, iar diferența a rămas, până de curând, prăpastia dintre laborator și viața de zi cu zi.

De ce e atât de greu? Pentru că limbajul nu e doar mișcare. Creierul nu produce „un singur semnal” pentru un cuvânt; generează un mozaic de activități distribuite, în care fiecare fonem – cea mai mică unitate sonoră – are o semnătură subtilă, iar semnificația depinde de context, intenție și ritm. Aici a devenit decisivă inteligența artificială: algoritmii pot învăța tipare din volume mari de date și pot face diferența între semnale care, privite la întâmplare, arată ca zgomot.

În experimentul cu „vorbirea interioară”, cercetătorii au testat dacă există o cale mai ușoară decât tentativa de rostire, care cere efort și devine obositoare. Au conceput sarcini simple, care aproape obligă creierul să „vorbească” în tăcere – de pildă, număratul unor forme după culoare. Semnalele asociate numerelor au putut fi detectate în cortexul motor, sugerând că și vocea din minte trece, în anumite condiții, prin trasee similare cu cele ale vorbirii încercate.

Rezultatele au venit cu nuanțe: pentru fraze imaginare, acuratețea în timp real a urcat până la aproximativ șaptezeci și patru la sută. Pentru sarcini care stimulau vorbirea interioară spontană, performanța a scăzut, dar a rămas peste nivelul hazardului. În situații deschise – când participantului i se cerea să se gândească liber la o replică preferată dintr-un film – textul decodat devenea, în mare parte, incoerent. Concluzia a fost onestă: tehnologia nu poate reda „nefiltrat” și complet vocea interioară, dar poate prinde urme clare ale ei, suficient cât să indice direcția următoare.

Un alt prag important a apărut atunci când cercetătorii au încercat să treacă dincolo de cuvinte. Comunicarea umană înseamnă intonație, accent, viteză, ritm – acele elemente care transformă aceeași propoziție într-o întrebare, o ironie sau o confesiune. Un prototip testat pe un pacient cu tulburare severă de vorbire a reușit să producă voce, nu doar text, iar participantul a putut modula tonalitatea pentru a sugera sens. Într-o demonstrație simplă, a „cântat” melodii, schimbând înălțimea sunetului. Nu a fost perfect – aproximativ șaizeci la sută dintre cuvinte au fost evaluate drept inteligibile – dar direcția a fost limpede: expresivitatea poate fi, în parte, recuperată.

În culise, limitarea nu e doar software. E și hardware. Un creier are miliarde de neuroni și trilioane de conexiuni. Multe dintre experimentele actuale „ascultă” o fracțiune infimă – câteva sute de canale, de pildă două sute cincizeci și șase de electrozi. Cu cât se pot înregistra mai mulți neuroni și mai stabil în timp, cu atât semnalul devine mai bogat, iar decodarea, mai precisă. De aici și cursa pentru implanturi mai performante, mai sigure, mai durabile, pe care unele companii vor să le scoată din laborator și să le transforme în produse comerciale.

Pe o pistă paralelă, cercetarea „minții vizuale” a primit un impuls neașteptat din explozia modelelor generative. În experimente cu imagini, participanții privesc fotografii în timp ce activitatea cerebrală e măsurată prin imagistică funcțională, apoi un algoritm încearcă să reconstruiască ceea ce a fost văzut, trimițând semnalul „tradus” către un generator de imagini. Rezultatele sunt departe de o fotografie perfectă, dar suficient de apropiate încât să sugereze cum împarte creierul informația: zona occipitală codifică aspectele „de bază” – layout, perspectivă, culoare –, în timp ce lobul temporal contribuie la elementele „de sus” – conceptul, categoria, recunoașterea obiectelor.

Și sunetul intră, încet, în aceeași logică. Unele echipe au încercat să reconstruiască muzica ascultată pe baza scanărilor cerebrale. Provocarea e și mai mare, pentru că muzica se schimbă clipă de clipă, iar instrumentele de scanare oferă „cadre” la intervale relativ rare. Chiar și așa, s-a putut reconstitui caracterul general al muzicii și categoria ei, iar cercetătorii au observat ceva surprinzător: în percepția muzicii, informația „semantică” și cea „de jos” nu par să fie la fel de bine separate în creier ca în cazul imaginilor.

Dincolo de promisiunile medicale, apar inevitabil și întrebările incomode. Dacă un sistem poate decoda fragmente din vocea interioară sau din imagini mentale, cine garantează că această fereastră nu va fi forțată, abuzată sau comercializată agresiv? Cât de „voluntar” poate fi consimțământul într-o lume în care oamenii cu dizabilități depind de tehnologie pentru a comunica? Ce înseamnă intimitatea când semnalele din creier devin date, iar datele pot fi stocate, analizate, comparate?

În prezent, realitatea rămâne mai modestă decât mitul „cititului gândurilor”: sistemele funcționează în condiții controlate, pe sarcini bine definite, cu antrenare personalizată și, adesea, cu implanturi invazive. Dar direcția este clară. În următorii ani, pe măsură ce hardware-ul va „auzi” mai mult și AI-ul va înțelege mai bine, interfețele creier–computer ar putea trece de la demonstrații spectaculoase la instrumente cotidiene pentru cei care nu au altă voce.

Iar atunci, întrebarea nu va mai fi doar ce poate face tehnologia, ci ce alegem să facă pentru noi – și ce alegem să nu lăsăm niciodată să facă.