Streamuri Radio Clasic

Sci Tech

Carson College, ChatGPT stiintific, Cicek WSU, ipoteze stiintifice, studiu ChatGPTSursă foto: Shutterstock

Studiu: ChatGPT a avut dificultăți în evaluarea ipotezelor științifice

Sci Tech 07:26

Un nou studiu a testat ChatGPT pe peste 700 de ipoteze științifice, cerându-i să stabilească dacă acestea sunt adevărate sau false. Rezultatele au arătat o acuratețe limitată și un nivel semnificativ de inconsistență, inclusiv la întrebări identice repetate. Cercetarea indică probleme mai ales în identificarea afirmațiilor false și recomandă prudență în utilizarea IA pentru decizii importante.

Echipa de cercetători a evaluat peste 700 de ipoteze și a adresat aceeași întrebare de 10 ori pentru fiecare caz, pentru a măsura consecvența răspunsurilor. Când experimentul a fost realizat pentru prima dată în 2024, ChatGPT a răspuns corect în 76,5% din situații, iar într-un test de urmărire din 2025 precizia a crescut la 80%. După ajustarea rezultatelor pentru a ține cont de ghicirea aleatorie, performanța sistemului a fost estimată la doar aproximativ 60% peste nivelul șansei. Cea mai mare dificultate a apărut la identificarea afirmațiilor false, corect etichetate în doar 16,4% din cazuri.

Studiul a evidențiat și o inconsistență notabilă a răspunsurilor. Chiar și atunci când a primit exact aceeași solicitare de 10 ori, ChatGPT a oferit răspunsuri consecvente în aproximativ 73% din cazuri. Potrivit lui Cicek, profesor asociat la Departamentul de Marketing și Afaceri Internaționale din cadrul Carson College of Business al WSU și autor principal al publicației, au existat situații în care sistemul a alternat între „adevărat” și „fals” pentru aceeași întrebare, inclusiv cazuri cu cinci răspunsuri „adevărat” și cinci „fals”.

Concluziile cercetării indică necesitatea prudenței atunci când sistemele de inteligență artificială sunt folosite în decizii importante, mai ales în contexte care cer raționament nuanțat sau complex. Autorii arată că, deși IA generativă poate produce un limbaj fluent și convingător, aceasta nu demonstrează încă același nivel de înțelegere conceptuală. Pe baza acestor rezultate, cercetătorii recomandă liderilor de afaceri să verifice informațiile generate de IA și să înțeleagă mai bine limitele practice ale acestor sisteme.

Deși analiza s-a concentrat pe ChatGPT, Cicek a spus că experimente similare realizate cu alte instrumente de inteligență artificială au produs rezultate comparabile. Lucrarea se sprijină și pe cercetări anterioare care îndeamnă la prudență față de entuziasmul excesiv legat de IA. Un sondaj național din 2024 a arătat, de asemenea, că consumatorii erau mai puțin dispuși să cumpere produse atunci când acestea erau promovate cu accent pe inteligența artificială.

cercetătorii de la Anthropic, comportamente distructive, inteligența artificială, părtinire narativă, Sindromul TerminatorSursă foto: Shutterstock
Sci Tech 6 zile ago

Roboții învață comportamente distructive din poveștile umane, nu din răutate

Sindromul 'Terminator': Roboții învață comportamente distructive din povești Cercetătorii de la Anthropic au descoperit...

Sci Tech o săptămână ago

OpenAI transformă angajații în milionari prin vânzarea acțiunilor de miliarde de dolari

Cel mai profitabil „bilet la loterie”: OpenAI transformă angajații în milionari OpenAI a permis...

deșeuri de eucalipt, filtrarea aerului, poluare, purificarea apei, scoarta de copacSursă foto: Shutterstock
Sci Tech 2 săptămâni ago

Scoarța de eucalipt, soluție inovatoare pentru poluarea apei și aerului

Soluția inovatoare pentru poluare: scoarța de copac Deșeurile din scoarța de eucalipt pot fi...

Sci Tech 2 săptămâni ago

Utilizatorii Gmail, avertizați să verifice setările de confidențialitate urgent

Milioane de utilizatori Gmail, avertizați să verifice urgent o setare Milioane de utilizatori Gmail...

Sci Tech 3 săptămâni ago

GPT-6, anunțat printre glume cu „goblini”

Sam Altman a alimentat speculațiile despre GPT-6 printr-o glumă aparent minoră, făcută în contextul...

Sursă foto: Shutterstock
Sci Tech 3 săptămâni ago

Inteligența artificială redă speranța în cazuri de infertilitate

O nouă tehnologie bazată pe inteligență artificială reușește să găsească spermatozoizi acolo unde medicii...

Sursă foto: Shutterstock
Sci Tech 3 săptămâni ago

Chatboții prietenoși pot greși mai mult

Modelele de inteligență artificială antrenate să răspundă într-un ton cald, empatic și prietenos ar...

Sci Tech 3 săptămâni ago

China blochează achiziția Meta de 2 miliarde de dolari a startupului AI Manus

China obligă Meta să renunțe la achiziția de 2 miliarde de dolari a startupului...

Sci Tech 3 săptămâni ago

David Silver, fost cercetător Google, atrage 1,1 miliarde de dolari pentru startup-ul AI

Un fost cercetător Google DeepMind atrage 1,1 miliarde de dolari pentru un startup AI...

Sci Tech 3 săptămâni ago

Aspirina, noua armă împotriva cancerului

Un medicament vechi de mii de ani, folosit astăzi mai ales împotriva durerii și...

Sci Tech 3 săptămâni ago

OpenAI şi Anthropic atrag directori din marile companii de software

Războiul pentru talente în inteligenţa artificială: OpenAI şi Anthropic recrutează directori din software Marile...

Sci Tech 4 săptămâni ago

Google investește 40 de miliarde de dolari în startupul Anthropic pentru inteligența artificială

Google investește până la 40 de miliarde de dolari în Anthropic pentru AI Alphabet,...

Sci Tech 4 săptămâni ago

OZN-urile revin în centrul atenției

Interesul pentru OZN-uri și viața extraterestră a cunoscut o revenire spectaculoasă în ultimii ani,...

3 milioane dolari, dependenta retele sociale, Kaley, Meta, YoutubeSursă foto: Shutterstock
Sci Tech 4 săptămâni ago

Tim Cook: Transformarea Apple într-un gigant de 4.000 de miliarde de dolari

Tim Cook, liderul Apple, a transformat compania într-un gigant de 4.000 de miliarde de...

Sursă foto: Shutterstock
Sci Tech o lună ago

Munca ascunsă din spatele inteligenței artificiale

În spatele promisiunilor despre viitorul spectaculos al inteligenței artificiale se conturează o realitate mult...

Brad Smith, Ericsson, Microsoft, suveranitate digitala, Trusted Tech AllianceSursă foto: Shutterstock
Sci Tech o lună ago

Giganții tech sub presiune: Investitorii cer detalii despre impactul ecologic al centrelor de date

Giganții tech sub presiune: Investitorii cer transparență privind impactul asupra mediului Amazon, Microsoft și...

Sci Tech o lună ago

De ce nu am mai trimis oameni pe Lună în ultimele cinci decenii?

De ce oamenii nu au mai revenit pe Lună timp de peste 50 de...

Sci Tech o lună ago

Echipajul Artemis II stabilește un nou record de distanță față de Pământ

Echipajul Artemis II stabilește un nou record pentru distanța parcursă de oameni față de...

Sci Tech 2 luni ago

Probleme tehnice la toaleta capsulei Orion, la câteva ore după lansarea Artemis 2

O defecțiune a fost observată la toaleta capsulei Orion, la scurt timp după lansarea...

Sci Tech 2 luni ago

Misiunea Artemis II: Astronauții NASA încep călătoria spre Lună

Echipajul misiunii Artemis II a decolat cu succes spre Lună, marcând o etapă istorică...

Sci Tech 2 luni ago

Planeta care sfidează regulile cosmosului

O planetă aflată la aproximativ două sute optzeci de ani-lumină de Pământ obligă astronomii...

Sci Tech 2 luni ago

Studiu: chatboții își flatează utilizatorii și oferă sfaturi potențial dăunătoare

Cercetători de la Universitatea Stanford au publicat joi în revista Science un studiu care...

Sci Tech 2 luni ago

OpenAI închide Sora și încheie parteneriatul cu Disney

OpenAI a anunțat închiderea aplicației de generare video Sora și încheierea parteneriatului de conținut...

Brad Smith, Ericsson, Microsoft, suveranitate digitala, Trusted Tech AllianceSursă foto: Shutterstock
Sci Tech 2 luni ago

Microsoft ar putea elimina cerința contului online la configurarea Windows 11

Scott Hanselman, vicepreședinte și membru al echipei tehnice Microsoft, a răspuns pe X că...