Carson College, ChatGPT stiintific, Cicek WSU, ipoteze stiintifice, studiu ChatGPT

Sursă foto: Shutterstock

Studiu: ChatGPT a avut dificultăți în evaluarea ipotezelor științifice

Sci Tech 07:26

Un nou studiu a testat ChatGPT pe peste 700 de ipoteze științifice, cerându-i să stabilească dacă acestea sunt adevărate sau false. Rezultatele au arătat o acuratețe limitată și un nivel semnificativ de inconsistență, inclusiv la întrebări identice repetate. Cercetarea indică probleme mai ales în identificarea afirmațiilor false și recomandă prudență în utilizarea IA pentru decizii importante.

Echipa de cercetători a evaluat peste 700 de ipoteze și a adresat aceeași întrebare de 10 ori pentru fiecare caz, pentru a măsura consecvența răspunsurilor. Când experimentul a fost realizat pentru prima dată în 2024, ChatGPT a răspuns corect în 76,5% din situații, iar într-un test de urmărire din 2025 precizia a crescut la 80%. După ajustarea rezultatelor pentru a ține cont de ghicirea aleatorie, performanța sistemului a fost estimată la doar aproximativ 60% peste nivelul șansei. Cea mai mare dificultate a apărut la identificarea afirmațiilor false, corect etichetate în doar 16,4% din cazuri.

Studiul a evidențiat și o inconsistență notabilă a răspunsurilor. Chiar și atunci când a primit exact aceeași solicitare de 10 ori, ChatGPT a oferit răspunsuri consecvente în aproximativ 73% din cazuri. Potrivit lui Cicek, profesor asociat la Departamentul de Marketing și Afaceri Internaționale din cadrul Carson College of Business al WSU și autor principal al publicației, au existat situații în care sistemul a alternat între „adevărat” și „fals” pentru aceeași întrebare, inclusiv cazuri cu cinci răspunsuri „adevărat” și cinci „fals”.

Concluziile cercetării indică necesitatea prudenței atunci când sistemele de inteligență artificială sunt folosite în decizii importante, mai ales în contexte care cer raționament nuanțat sau complex. Autorii arată că, deși IA generativă poate produce un limbaj fluent și convingător, aceasta nu demonstrează încă același nivel de înțelegere conceptuală. Pe baza acestor rezultate, cercetătorii recomandă liderilor de afaceri să verifice informațiile generate de IA și să înțeleagă mai bine limitele practice ale acestor sisteme.

Deși analiza s-a concentrat pe ChatGPT, Cicek a spus că experimente similare realizate cu alte instrumente de inteligență artificială au produs rezultate comparabile. Lucrarea se sprijină și pe cercetări anterioare care îndeamnă la prudență față de entuziasmul excesiv legat de IA. Un sondaj național din 2024 a arătat, de asemenea, că consumatorii erau mai puțin dispuși să cumpere produse atunci când acestea erau promovate cu accent pe inteligența artificială.

Radio Clasic

Studiu: ChatGPT a avut dificultăți în evaluarea ipotezelor științifice

Sci Tech

Studiu: ChatGPT a avut dificultăți în evaluarea ipotezelor științifice

Google a lansat un instrument AI pentru prognoza viiturilor urbane

Meta introduce funcții de control parental pentru utilizatorii tineri ai WhatsApp

Utilizatorii Signal și WhatsApp, țintiți de atacuri cibernetice atribuite Rusiei

Pas important în diagnosticarea Alzheimer: un instrument cu 93% precizie

Vegetarienii au un risc mai scăzut de a dezvolta cinci tipuri de cancer

Virusul sincițial respirator, o amenințare serioasă pentru copii și adulți

Șeful Google ar putea obține un venit record de 692 de milioane de dolari în trei ani

Ministrul Energiei: Creșterile de prețuri la carburanți sunt mai mici decât în alte țări europene

Google deschide un centru de inteligență artificială la Berlin

NASA pregătește lansarea misiunii Artemis II, care va transporta patru astronauți în jurul Lunii

Extinderea inteligenței artificiale ar putea genera locuri de muncă în zona euro

Starlink, operator de internet prin satelit, își deschide subsidiară în România

O nouă metodă de stimulare cerebrală promite tratamente rapide pentru depresie

Volvo Cars se confruntă cu provocări majore după rechemarea a peste 40.000 de SUV-uri electrice EX30

Doi experți români în securitate cibernetică lansează o platformă AI inovatoare

WhatsApp introduce funcția de programare a mesajelor pentru utilizatori

OpenAI preconizează cheltuieli de 600 miliarde de dolari pentru capacitatea de calcul

Data lansării misiunii Artemis II de către NASA, programată pentru 6 martie

OVES Enterprise lansează Sahara, racheta românească cu inteligență artificială

Un expert din Silicon Valley avertizează asupra riscurilor inteligenței artificiale

Insulina sub formă de gel: o alternativă la injecțiile diabetice

Numărul cazurilor de cancer în Uniunea Europeană continuă să crească

Baidu lansează OpenClaw în aplicația sa de căutare pentru 700 de milioane de utilizatori

Bărbații care achiziționează pastile ilegale pentru disfuncția erectilă riscă sănătatea

Sci Tech - Ultimele articole

Producătorul John Deere investește în roboți umanoizi pentru viitorul agriculturii

Uniunea Europeană lansează proiectul NanoIC pentru dezvoltarea cipurilor europene

Microsoft și Ericsson anunță o alianță globală pentru încrederea digitală

Rețeaua IRIS2: Provocări și așteptări în competiția cu Starlink

Șase planete se aliniază pe cer în februarie: cum și când să le observi

Secretul unui joc roman antic descifrat cu ajutorul inteligenței artificiale

Vaccinarea anti-HPV la bărbați: importanța și impactul acesteia

Materiale inovatoare: Cercetătorii dezvoltă un hibrid revoluționar din sticlă și plastic

Schimbările climatice medievale: cum au influențat invaziile vikingilor

Elon Musk își redefinește viziunea: SpaceX va construi un oraș pe Lună