Streamuri Radio Clasic

Top News

Nu toate modelele de inteligență artificială (IA) „open source” sunt de fapt deschise

Top News 12:05

Multe dintre modelele de limbaj mare care alimentează chatboții se revendică a fi deschise, dar restricționează accesul la cod și datele de antrenament.

Giganți tehnologici precum Meta și Microsoft își descriu modelele de inteligență artificială (IA) drept „open source” fără a dezvălui informații importante despre tehnologia de bază, afirmă cercetătorii care au analizat o serie de modele populare de chatboți. Definiția open source în contextul modelelor IA nu este încă stabilită, dar susținătorii spun că o deschidere completă stimulează știința și este esențială pentru a face IA responsabilă. Definirea exactă a termenului open source este probabil să devină din ce în ce mai importantă odată cu intrarea în vigoare a Legii Inteligenței Artificiale a Uniunii Europene. Această legislație va aplica reglementări mai puțin stricte pentru modelele clasificate ca deschise.

Unele companii mari culeg beneficiile declarării modelelor lor ca fiind open source, în timp ce încearcă „să scape cu dezvăluirea a cât mai puține informații posibile”, spune Mark Dingemanse, un specialist în știința limbajului la Universitatea Radboud din Nijmegen, Olanda. Această practică este cunoscută sub denumirea de open-washing.

„Spre surprinderea noastră, jucătorii mici, cu resurse relativ puține, fac un efort suplimentar”, spune Dingemanse, care împreună cu colegul său Andreas Liesenfeld, un lingvist computațional, au creat un clasament al celor mai deschise și mai puțin deschise modele. Ei și-au publicat concluziile pe 5 iunie în cadrul Conferinței ACM 2024 privind Echitatea, Responsabilitatea și Transparența. Studiul elimină „multă agitație și exagerări în jurul dezbaterii actuale despre open-sourcing”, spune Abeba Birhane, cercetător în științe cognitive la Trinity College Dublin și consilier în materie de responsabilitate IA la Mozilla Foundation, o organizație non-profit cu sediul în Mountain View, California.

Ce înseamnaă de fapt Open Source?

Termenul open source provine din software, unde înseamnă acces la codul sursă și fără limitări în utilizarea sau distribuția unui program. Dar, având în vedere complexitatea modelelor mari de IA și volumele uriașe de date implicate, realizarea acestora ca open source este departe de a fi simplă, iar experții încă lucrează la definirea conceptului de IA open source. Dezvăluirea tuturor aspectelor unui model nu este întotdeauna de dorit pentru companii, deoarece le poate expune la riscuri comerciale sau legale, spune Dingemanse. Alții argumentează că eliberarea completă a modelelor riscă să fie folosită în mod abuziv.

Dar a fi etichetat ca open source poate aduce și mari beneficii. Dezvoltatorii pot obține deja avantaje de relații publice prezentându-se ca fiind riguroși și transparenți. Și în curând vor exista și implicații legale. Legea IA a UE, care a fost adoptată în acest an, va excepta modelele open source de uz general, până la o anumită dimensiune, de la cerințele extinse de transparență și le va supune unor obligații mai reduse și încă nedefinite. „Este corect să spunem că termenul open source va căpăta o importanță juridică fără precedent în țările guvernate de Legea IA a UE”, spune Dingemanse.

În studiul lor, Dingemanse și Liesenfeld au evaluat 40 de modele mari de limbaj — sisteme care învață să genereze text prin asocierea cuvintelor și frazelor în volume mari de date. Toate aceste modele pretind a fi „open source” sau „deschise”. Cei doi au creat un clasament al deschiderii evaluând modelele pe 14 parametri, inclusiv disponibilitatea codului și a datelor de antrenament, ce documentație este publicată și cât de ușor este de accesat modelul. Pentru fiecare parametru, au evaluat dacă modelele erau deschise, parțial deschise sau închise. Această abordare pe o scară glisantă a analizei deschiderii este una utilă și practică, spune Amanda Brock, director executiv al OpenUK, o organizație non-profit cu sediul la Londra care se concentrează pe tehnologia deschisă.

Cercetătorii au descoperit că multe modele care pretind a fi deschise sau open source — inclusiv Llama de la Meta și Gemma de la Google DeepMind — sunt, de fapt, doar „open weight”. Asta înseamnă că cercetătorii externi pot accesa și utiliza modelele antrenate, dar nu le pot inspecta sau personaliza. De asemenea, nu pot înțelege pe deplin cum au fost adaptate pentru sarcini specifice; de exemplu, folosind feedback uman. „Nu dezvălui multe,dar pot revendica căsunt deschiși deschidere,” spune Dingemanse. Ceea ce este deosebit de îngrijorător, spun autorii, este lipsa de transparență în privința datelor pe care modelele sunt antrenate. Aproximativ jumătate dintre modelele pe care le-au analizat nu oferă detalii despre seturile de date, dincolo de descrieri generice, spun ei.

Un purtător de cuvânt al Google spune că compania este „precisă în ceea ce privește limbajul” folosit pentru a descrie modelele, alegând să eticheteze Gemma LLM ca fiind deschisă, mai degrabă decât open source. „Conceptele existente de open-source nu pot fi întotdeauna aplicate direct la sistemele de IA,” au adăugat ei. Microsoft încearcă să fie „cât mai precisă posibil în ceea ce privește ceea ce este disponibil și în ce măsură”, spune un purtător de cuvânt. „Alegem să facem artefacte precum modele, coduri, instrumente și seturi de date disponibile publicului, deoarece comunitățile de dezvoltatori și cercetători au un rol important în avansarea tehnologiei IA.” Meta nu a răspuns la o solicitare de comentarii din partea revistei Nature. Modelele realizate de firme mai mici și grupuri de cercetare au tendința de a fi mai deschise decât cele ale marilor companii de tehnologie, a constatat analiza. Autorii subliniază BLOOM, construit de o colaborare internațională, în mare parte academică, ca un exemplu de IA cu adevărat open source.

 „Peer review” devine demodat

Cercetările științifice detaliind modelele sunt extrem de rare, au descoperit cei doi. Revizuirea colegială pare să fi „căzut aproape complet în afara modei”, fiind înlocuită de postări pe bloguri cu exemple alese pe sprânceană sau preprinturi corporative care sunt sărace în detalii. Companiile „ar putea lansa un document frumos, atractiv pe site-ul lor, care pare foarte tehnic. Dar dacă îl examinezi cu atenție, nu există nicio specificație despre ce date au intrat în acel sistem,” spune Dingemanse. Nu este încă clar câte dintre aceste modele vor se încadra în definiția UE de open source. Conform legii, aceasta ar trebui să se refere la modelele care sunt lansate sub o licență „liberă și deschisă” care, de exemplu, permite utilizatorilor să modifice un model, dar nu spune nimic despre accesul la datele de antrenament. Refinarea acestei definiții va constitui probabil „un punct de presiune unic care va fi vizat de lobiștii corporativi și de marile companii”, afirmă articolul.

Și deschiderea contează pentru știință, spune Dingemanse, deoarece este esențială pentru reproducibilitate. „Dacă nu o poți reproduce, este greu de spus că este știință,” spune el. Singura modalitate prin care cercetătorii pot inova este prin ajustarea modelelor, iar pentru a face acest lucru au nevoie de suficiente informații pentru a-și construi propriile versiuni. Nu doar atât, dar modelele trebuie să fie deschise pentru a fi examinate. „Dacă nu putem privi în interior pentru a ști cum este făcut cârnatul, nu știm nici dacă să fim impresionați de el,” spune Dingemanse. De exemplu, s-ar putea să nu fie o realizare pentru un model să treacă un anumit examen dacă a fost antrenat pe multe exemple ale testului. Și fără responsabilitatea datelor, nimeni nu știe dacă au fost folosite date nepotrivite sau cu drepturi de autor, adaugă el.

Liesenfeld spune că cei doi speră să ajute alți cercetători să evite „să cadă în aceleași capcane în care am căzut noi”, atunci când caută modele de utilizat în predare și cercetare.

Articolul a fost preluat – vezi Sursa

Top News 4 ore ago

Consultările interne din PSD pentru rămânerea la guvernare se intensifică

Președintele PSD, Sorin Grindeanu, a anunțat extinderea consultărilor interne privind rămânerea la guvernare, inițiate...

Top News 6 ore ago

Populația din Tulcea, avertizată prin mesaj Ro-Alert în urma unui atac rusesc în Ucraina

Locuitorii din nordul județului Tulcea au fost avertizați printr-un mesaj Ro-Alert, miercuri seara, în...

Top News 7 ore ago

Administrația Trump acuză Universitatea UCLA de discriminare împotriva evreilor

Administrația Trump a depus o plângere împotriva Universității din California, Los Angeles (UCLA), acuzând-o...

Top News 8 ore ago

Reforma în administrație: Ordonanța a fost trimisă la Monitorul Oficial

Premierul Ilie Bolojan a anunțat că Ordonanța privind reforma în administrație a fost trimisă...

Top News 8 ore ago

România, lider european în inflație, cu o creștere de 8,5% a prețurilor în ianuarie 2026

România continuă să dețină cea mai mare rată a inflației din Uniunea Europeană, înregistrând...

Top News 9 ore ago

Decesele cauzate de gripă cresc în județul Sibiu, al șaptelea caz confirmat

O femeie de 81 de ani din Agnita a decedat din cauza gripei, fiind...

arad, bărbat condamnat, complicitate mama, decizia instanței, viol fiica partenereiSursă foto: Shutterstock
Top News 9 ore ago

O nouă metodă de stimulare cerebrală promite tratamente rapide pentru depresie

Cercetătorii de la UCLA Health au dezvoltat o abordare inovatoare de stimulare magnetică transcraniană...

Top News 10 ore ago

Putin avertizează asupra unor posibile atacuri ucrainene asupra gazoductelor din Marea Neagră

Liderul rus Vladimir Putin a ordonat serviciului de securitate FSB să întărească protecția infrastructurii...

Top News 10 ore ago

Anul 2027 va fi dedicat lui Ilie Năstase, iar 2026 lui Traian Vuia și Grigore Moisil

Senatul României a adoptat miercuri, în plen, o serie de propuneri legislative care stabilesc...

Top News 10 ore ago

Discursul lui Trump despre Starea Națiunii, marcat de controverse și proteste

Discursul-record al președintelui Donald Trump privind Starea Națiunii a fost marcat de atacuri politice...

Top News 10 ore ago

„Vivo per lei” – o declarație muzicală de iubire la Filarmonica Târgu Mureș

Primăvara aduce la Târgu Mureș un spectacol-eveniment dedicat femeii și feminității: tenorul Ștefan von...

Top News 11 ore ago

Orașele gazdă amenință cu anularea festivalurilor pentru suporterii Cupei Mondiale

Mai multe orașe gazdă ale Cupei Mondiale amenință că vor anula festivalurile destinate suporterilor...

Top News 11 ore ago

Patru morți și zece răniți în urma unui atac cu drone asupra unei uzine chimice din Rusia

Un atac cu drone asupra uzinei chimice Dorogobuzh din regiunea Smolensk a dus la...

Top News 11 ore ago

Alegerea noului Avocat al Poporului are loc pe 10 martie în Parlament

Plenul comun al Camerei Deputaților și Senatului se va reuni pe 10 martie, începând...

Top News o zi ago

Procentul rușilor care susțin războiul a scăzut semnificativ

Procentul cetățenilor ruși care sprijină în mod ferm războiul a scăzut la 14%, conform...

Top News o zi ago

Scurgerile de informații din dosarele DNA, subiect de discuție în interviurile pentru funcții de conducere

Ministrul Justiției, Radu Marinescu, a adresat întrebări legate de scurgerile de informații din dosarele...

Top News o zi ago

Amendă de 14 milioane de lire sterline pentru Reddit

Reddit a fost sancționată cu o amendă de peste 14 milioane de lire sterline...

Top News o zi ago

Imprevizibilitatea lui Trump, percepută de majoritatea americanilor odată cu înaintarea în vârstă

Un sondaj de opinie relevat că 61% dintre americani consideră că Donald Trump devine...

Top News o zi ago

Trump menține tarifele vamale la 10% pentru UE și Marea Britanie, incertitudinea persistă

Președintele SUA, Donald Trump, a decis să nu majoreze tarifele vamale globale la 15%,...

Top News o zi ago

Kelemen Hunor își exprimă susținerea pentru Viktor Orban la alegerile din Ungaria

Kelemen Hunor, președintele UDMR, a anunțat că îl susține pe premierul Viktor Orban în...

Top News o zi ago

Emma Răducanu devine imaginea Uniqlo

Emma Răducanu a fost numită noua imagine a brandului japonez Uniqlo, după ce a...

Departamentul pentru Securitate Internă, Hakeem Jeffries, John Thune, paralizie bugetară, practici poliției de imigrareSursă foto: Shutterstock
Top News 2 zile ago

SUA impun tarif global de 10% pentru majoritatea importurilor, sub planul inițial de 15%

Statele Unite au implementat, începând de marți, o taxă suplimentară de 10% pentru majoritatea...

Top News 2 zile ago

Zeci de percheziții în opt județe și în Capitală la o grupare de infractori care au înșelat bănci

Peste 50 de percheziții au fost efectuate de polițiștii din Brașov în opt județe...

Top News 2 zile ago

Christian Horner vorbește despre demiterea sa de la RedBull și rolul lui Helmut Marko

Christian Horner, fostul șef al echipei RedBull Racing, a discutat despre demiterea sa, subliniind...