Top News

Nu toate modelele de inteligență artificială (IA) „open source” sunt de fapt deschise

Top News 12:05

Multe dintre modelele de limbaj mare care alimentează chatboții se revendică a fi deschise, dar restricționează accesul la cod și datele de antrenament.

Giganți tehnologici precum Meta și Microsoft își descriu modelele de inteligență artificială (IA) drept „open source” fără a dezvălui informații importante despre tehnologia de bază, afirmă cercetătorii care au analizat o serie de modele populare de chatboți. Definiția open source în contextul modelelor IA nu este încă stabilită, dar susținătorii spun că o deschidere completă stimulează știința și este esențială pentru a face IA responsabilă. Definirea exactă a termenului open source este probabil să devină din ce în ce mai importantă odată cu intrarea în vigoare a Legii Inteligenței Artificiale a Uniunii Europene. Această legislație va aplica reglementări mai puțin stricte pentru modelele clasificate ca deschise.

Unele companii mari culeg beneficiile declarării modelelor lor ca fiind open source, în timp ce încearcă „să scape cu dezvăluirea a cât mai puține informații posibile”, spune Mark Dingemanse, un specialist în știința limbajului la Universitatea Radboud din Nijmegen, Olanda. Această practică este cunoscută sub denumirea de open-washing.

„Spre surprinderea noastră, jucătorii mici, cu resurse relativ puține, fac un efort suplimentar”, spune Dingemanse, care împreună cu colegul său Andreas Liesenfeld, un lingvist computațional, au creat un clasament al celor mai deschise și mai puțin deschise modele. Ei și-au publicat concluziile pe 5 iunie în cadrul Conferinței ACM 2024 privind Echitatea, Responsabilitatea și Transparența. Studiul elimină „multă agitație și exagerări în jurul dezbaterii actuale despre open-sourcing”, spune Abeba Birhane, cercetător în științe cognitive la Trinity College Dublin și consilier în materie de responsabilitate IA la Mozilla Foundation, o organizație non-profit cu sediul în Mountain View, California.

Ce înseamnaă de fapt Open Source?

Termenul open source provine din software, unde înseamnă acces la codul sursă și fără limitări în utilizarea sau distribuția unui program. Dar, având în vedere complexitatea modelelor mari de IA și volumele uriașe de date implicate, realizarea acestora ca open source este departe de a fi simplă, iar experții încă lucrează la definirea conceptului de IA open source. Dezvăluirea tuturor aspectelor unui model nu este întotdeauna de dorit pentru companii, deoarece le poate expune la riscuri comerciale sau legale, spune Dingemanse. Alții argumentează că eliberarea completă a modelelor riscă să fie folosită în mod abuziv.

Dar a fi etichetat ca open source poate aduce și mari beneficii. Dezvoltatorii pot obține deja avantaje de relații publice prezentându-se ca fiind riguroși și transparenți. Și în curând vor exista și implicații legale. Legea IA a UE, care a fost adoptată în acest an, va excepta modelele open source de uz general, până la o anumită dimensiune, de la cerințele extinse de transparență și le va supune unor obligații mai reduse și încă nedefinite. „Este corect să spunem că termenul open source va căpăta o importanță juridică fără precedent în țările guvernate de Legea IA a UE”, spune Dingemanse.

În studiul lor, Dingemanse și Liesenfeld au evaluat 40 de modele mari de limbaj — sisteme care învață să genereze text prin asocierea cuvintelor și frazelor în volume mari de date. Toate aceste modele pretind a fi „open source” sau „deschise”. Cei doi au creat un clasament al deschiderii evaluând modelele pe 14 parametri, inclusiv disponibilitatea codului și a datelor de antrenament, ce documentație este publicată și cât de ușor este de accesat modelul. Pentru fiecare parametru, au evaluat dacă modelele erau deschise, parțial deschise sau închise. Această abordare pe o scară glisantă a analizei deschiderii este una utilă și practică, spune Amanda Brock, director executiv al OpenUK, o organizație non-profit cu sediul la Londra care se concentrează pe tehnologia deschisă.

Cercetătorii au descoperit că multe modele care pretind a fi deschise sau open source — inclusiv Llama de la Meta și Gemma de la Google DeepMind — sunt, de fapt, doar „open weight”. Asta înseamnă că cercetătorii externi pot accesa și utiliza modelele antrenate, dar nu le pot inspecta sau personaliza. De asemenea, nu pot înțelege pe deplin cum au fost adaptate pentru sarcini specifice; de exemplu, folosind feedback uman. „Nu dezvălui multe,dar pot revendica căsunt deschiși deschidere,” spune Dingemanse. Ceea ce este deosebit de îngrijorător, spun autorii, este lipsa de transparență în privința datelor pe care modelele sunt antrenate. Aproximativ jumătate dintre modelele pe care le-au analizat nu oferă detalii despre seturile de date, dincolo de descrieri generice, spun ei.

Un purtător de cuvânt al Google spune că compania este „precisă în ceea ce privește limbajul” folosit pentru a descrie modelele, alegând să eticheteze Gemma LLM ca fiind deschisă, mai degrabă decât open source. „Conceptele existente de open-source nu pot fi întotdeauna aplicate direct la sistemele de IA,” au adăugat ei. Microsoft încearcă să fie „cât mai precisă posibil în ceea ce privește ceea ce este disponibil și în ce măsură”, spune un purtător de cuvânt. „Alegem să facem artefacte precum modele, coduri, instrumente și seturi de date disponibile publicului, deoarece comunitățile de dezvoltatori și cercetători au un rol important în avansarea tehnologiei IA.” Meta nu a răspuns la o solicitare de comentarii din partea revistei Nature. Modelele realizate de firme mai mici și grupuri de cercetare au tendința de a fi mai deschise decât cele ale marilor companii de tehnologie, a constatat analiza. Autorii subliniază BLOOM, construit de o colaborare internațională, în mare parte academică, ca un exemplu de IA cu adevărat open source.

 „Peer review” devine demodat

Cercetările științifice detaliind modelele sunt extrem de rare, au descoperit cei doi. Revizuirea colegială pare să fi „căzut aproape complet în afara modei”, fiind înlocuită de postări pe bloguri cu exemple alese pe sprânceană sau preprinturi corporative care sunt sărace în detalii. Companiile „ar putea lansa un document frumos, atractiv pe site-ul lor, care pare foarte tehnic. Dar dacă îl examinezi cu atenție, nu există nicio specificație despre ce date au intrat în acel sistem,” spune Dingemanse. Nu este încă clar câte dintre aceste modele vor se încadra în definiția UE de open source. Conform legii, aceasta ar trebui să se refere la modelele care sunt lansate sub o licență „liberă și deschisă” care, de exemplu, permite utilizatorilor să modifice un model, dar nu spune nimic despre accesul la datele de antrenament. Refinarea acestei definiții va constitui probabil „un punct de presiune unic care va fi vizat de lobiștii corporativi și de marile companii”, afirmă articolul.

Și deschiderea contează pentru știință, spune Dingemanse, deoarece este esențială pentru reproducibilitate. „Dacă nu o poți reproduce, este greu de spus că este știință,” spune el. Singura modalitate prin care cercetătorii pot inova este prin ajustarea modelelor, iar pentru a face acest lucru au nevoie de suficiente informații pentru a-și construi propriile versiuni. Nu doar atât, dar modelele trebuie să fie deschise pentru a fi examinate. „Dacă nu putem privi în interior pentru a ști cum este făcut cârnatul, nu știm nici dacă să fim impresionați de el,” spune Dingemanse. De exemplu, s-ar putea să nu fie o realizare pentru un model să treacă un anumit examen dacă a fost antrenat pe multe exemple ale testului. Și fără responsabilitatea datelor, nimeni nu știe dacă au fost folosite date nepotrivite sau cu drepturi de autor, adaugă el.

Liesenfeld spune că cei doi speră să ajute alți cercetători să evite „să cadă în aceleași capcane în care am căzut noi”, atunci când caută modele de utilizat în predare și cercetare.

Articolul a fost preluat – vezi Sursa


Descoperă mai multe la Radio Clasic

Abonează-te ca să primești ultimele articole prin email.

inundatie Muzeul Luvru, Laurence des Cars, Rachida Dati, sala Duchâtel, scurgere de apaSursă foto: Shutterstock
Top News 2 minute ago

O inundație la Muzeul Luvru determină închiderea temporară a mai multor săli

O inundație considerată o „situație de urgență” a avut loc la Muzeul Luvru, afectând...

Citeste mai mult
baietii destepti, Ilie Bolojan, preturi energie, producție energie, sistem energeticSursă foto: Shutterstock
Top News 8 minute ago

Prețurile la energie vor scădea abia în câțiva ani, avertizează Ilie Bolojan

Premierul Ilie Bolojan a declarat că prețurile la energie electrică pot scădea cu 10-20%...

Citeste mai mult
campanie decredibilizare, Curtea de Apel București, încrederea populației, justiția în România, Liana Arsenie
Top News 12 minute ago

Șefa CAB avertizează asupra unei campanii de decredibilizare a judecătorilor

Șefa Curții de Apel București, Liana Arsenie, a anunțat existența unei campanii de decredibilizare...

Citeste mai mult
Top News 15 minute ago

Revenirea economică a României: Ce anunță premierul Ilie Bolojan pentru 2026

Premierul Ilie Bolojan a declarat că recesiunea din România se va încheia în a...

Citeste mai mult
Top News 42 de minute ago

Incendiu devastator în Sectorul 6 al Capitalei: bilanț tragic

Un incendiu puternic a izbucnit vineri pe Bulevardul Constructorilor, provocând moartea unei persoane și...

Citeste mai mult
Top News 2 ore ago

Ce efecte are recesiunea tehnică asupra Bursei de Valori București?

Bursa de Valori București a deschis ședința de vineri în scădere pe toți indicii,...

Citeste mai mult
Top News 2 ore ago

Ciolacu denunță manipularea statisticilor economice pentru a ascunde recesiunea

Marcel Ciolacu, fost premier social-democrat, acuză actuala guvernare de manipularea datelor economice pentru a...

Citeste mai mult
Federația Română de Fotbal, program Liga Națiunilor, România Bosnia, România Polonia, România SuediaSursă foto: Shutterstock
Top News 3 ore ago

România își cunoaște programul din Liga Națiunilor: meciuri cu Polonia, Suedia și Bosnia

România a fost repartizată într-o grupă cu Polonia, Suedia și Bosnia-Herțegovina în Liga Națiunilor,...

Citeste mai mult
Top News 3 ore ago

Sorin Grindeanu critică guvernarea după recesiunea României: „Nu va mai fi deloc”

Sorin Grindeanu a declarat că PSD își asumă responsabilitatea pentru recesiunea României, dar a...

Citeste mai mult
Top News 4 ore ago

Reacția lui Ilie Bolojan la recesiunea României: O corecție necesară pentru economie

Premierul Ilie Bolojan a comentat intrarea României în recesiune tehnică, subliniind că aceasta este...

Citeste mai mult
Top News 4 ore ago

Alocația universală în Spania: 200 de euro pe lună pentru fiecare copil

Guvernul spaniol a propus o alocație universală de 200 de euro lunar pentru fiecare...

Citeste mai mult
economie României, INS contracție PIB, recesiune tehnică, România recesiune, scădere PIB 2025Sursă foto: Shutterstock
Top News 5 ore ago

România a intrat în recesiune tehnică: detalii despre contracția PIB

România a intrat în recesiune tehnică, conform Institutului Național de Statistică, care a raportat...

Citeste mai mult
achiziție Carrefour, brand KORRA, Carrefour Romania, frații Pavăl, Pavăl HoldingSursă foto: Shutterstock
Top News 5 ore ago

Carrefour România: O nouă etapă în retailul românesc sub conducerea fraților Dedeman

Frații Pavăl, proprietarii Dedeman, au preluat Carrefour România, iar brandul ar putea fi înlocuit...

Citeste mai mult
Top News 6 ore ago

Beaudry și Cizeron: Aur olimpic în ciuda controverselor personale

Laurence Fournier Beaudry și Guillaume Cizeron au câștigat medalia de aur la dans pe...

Citeste mai mult
Top News 6 ore ago

Biatlon, schi fond și snowboard cross: Sportivii români în competiție la Olimpiadă

Sportivii români vor participa vineri la probele de biatlon, schi fond și snowboard cross...

Citeste mai mult
comisia europeana, google, investigatie UE, licitații publicitate, publicitate onlineSursă foto: Shutterstock
Top News 6 ore ago

Google, sub lupa autorităților europene pentru practicile de publicitate online

Google, parte a grupului Alphabet, este sub investigație din partea autorităților europene pentru modul...

Citeste mai mult
Top News 6 ore ago

Rusia anunță absența de la prima reuniune a Consiliului Păcii

Rusia a confirmat că nu va trimite delegați la reuniunea inaugurală a Consiliului Păcii,...

Citeste mai mult
Top News 6 ore ago

Conferința de la München: Un moment crucial pentru securitatea europeană și relațiile transatlantice

Conferința de Securitate de la München (MSC) din 2026 se desfășoară într-un context internațional...

Citeste mai mult
competitia din China, costuri tarifare, Mercedes-Benz Group, Ola Källenius, profit anualSursă foto: Shutterstock
Top News 6 ore ago

Grupul Mercedes-Benz anunță pierderi semnificative din cauza tarifelor comerciale

Mercedes-Benz Group a raportat o scădere drastică a profitului anual, înjumătățit din cauza costurilor...

Citeste mai mult
Top News 6 ore ago

Noul interes pentru fostul Sidex Galați: Investitori mari cer caietul de sarcini

Mai mulți investitori au solicitat caietul de sarcini pentru licitația combinatului siderurgic Liberty Galați,...

Citeste mai mult
economia europeana, liderii europeni, Mario Draghi, măsuri urgente, prețurile la energieSursă foto: Shutterstock
Top News 6 ore ago

Avertismentul lui Mario Draghi: Măsuri urgente necesare pentru economia europeană

Fostul premier italian Mario Draghi a avertizat liderii europeni despre deteriorarea economiei, subliniind necesitatea...

Citeste mai mult
Top News 6 ore ago

Valul de demisii la Spitalul Județean Brașov: 6 medici plecați în februarie

Spitalul Clinic Județean de Urgență Brașov se confruntă cu o criză de personal, înregistrând...

Citeste mai mult
Administrația Națională de Meteorologie, regimul pluviometric excedentar, sfârșit de iarnă, temperaturi peste normal, vremea schimbă registrulSursă foto: Shutterstock
Top News 6 ore ago

Vremea se schimbă radical: Meteorologii anunță un sfârșit de iarnă neobișnuit

România va experimenta o perioadă mai caldă decât normalul calendaristic, conform prognozei Administrației Naționale...

Citeste mai mult
Top News 7 ore ago

Moșii de Iarnă 2026: Ritualuri și tradiții pentru pomenirea celor adormiți

Moșii de Iarnă, sărbătoriți pe 14 februarie 2026, implică ritualuri de pomenire și ofrande...

Citeste mai mult

Descoperă mai multe la Radio Clasic

Abonează-te acum ca să citești în continuare și să ai acces la întreaga arhivă.

Continuă lectura