Streamuri Radio Clasic

Sci Tech

Carson College, ChatGPT stiintific, Cicek WSU, ipoteze stiintifice, studiu ChatGPTSursă foto: Shutterstock

Studiu: ChatGPT a avut dificultăți în evaluarea ipotezelor științifice

Sci Tech 07:26

Un nou studiu a testat ChatGPT pe peste 700 de ipoteze științifice, cerându-i să stabilească dacă acestea sunt adevărate sau false. Rezultatele au arătat o acuratețe limitată și un nivel semnificativ de inconsistență, inclusiv la întrebări identice repetate. Cercetarea indică probleme mai ales în identificarea afirmațiilor false și recomandă prudență în utilizarea IA pentru decizii importante.

Echipa de cercetători a evaluat peste 700 de ipoteze și a adresat aceeași întrebare de 10 ori pentru fiecare caz, pentru a măsura consecvența răspunsurilor. Când experimentul a fost realizat pentru prima dată în 2024, ChatGPT a răspuns corect în 76,5% din situații, iar într-un test de urmărire din 2025 precizia a crescut la 80%. După ajustarea rezultatelor pentru a ține cont de ghicirea aleatorie, performanța sistemului a fost estimată la doar aproximativ 60% peste nivelul șansei. Cea mai mare dificultate a apărut la identificarea afirmațiilor false, corect etichetate în doar 16,4% din cazuri.

Studiul a evidențiat și o inconsistență notabilă a răspunsurilor. Chiar și atunci când a primit exact aceeași solicitare de 10 ori, ChatGPT a oferit răspunsuri consecvente în aproximativ 73% din cazuri. Potrivit lui Cicek, profesor asociat la Departamentul de Marketing și Afaceri Internaționale din cadrul Carson College of Business al WSU și autor principal al publicației, au existat situații în care sistemul a alternat între „adevărat” și „fals” pentru aceeași întrebare, inclusiv cazuri cu cinci răspunsuri „adevărat” și cinci „fals”.

Concluziile cercetării indică necesitatea prudenței atunci când sistemele de inteligență artificială sunt folosite în decizii importante, mai ales în contexte care cer raționament nuanțat sau complex. Autorii arată că, deși IA generativă poate produce un limbaj fluent și convingător, aceasta nu demonstrează încă același nivel de înțelegere conceptuală. Pe baza acestor rezultate, cercetătorii recomandă liderilor de afaceri să verifice informațiile generate de IA și să înțeleagă mai bine limitele practice ale acestor sisteme.

Deși analiza s-a concentrat pe ChatGPT, Cicek a spus că experimente similare realizate cu alte instrumente de inteligență artificială au produs rezultate comparabile. Lucrarea se sprijină și pe cercetări anterioare care îndeamnă la prudență față de entuziasmul excesiv legat de IA. Un sondaj național din 2024 a arătat, de asemenea, că consumatorii erau mai puțin dispuși să cumpere produse atunci când acestea erau promovate cu accent pe inteligența artificială.

comisia europeana, google, investigatie UE, licitații publicitate, publicitate onlineSursă foto: Shutterstock
Sci Tech 5 zile ago

Google a lansat un instrument AI pentru prognoza viiturilor urbane

Google a prezentat Groundsource, un instrument de predicție a viiturilor care folosește modelul Gemini...

aplicatie de stat, blocare WhatsApp, Pavel Durov, Roskomnadzor, Rusia WhatsAppSursă foto: Shutterstock
Sci Tech 6 zile ago

Meta introduce funcții de control parental pentru utilizatorii tineri ai WhatsApp

Meta a lansat o nouă funcție de control parental pe WhatsApp, destinată utilizatorilor sub...

aplicatie de stat, blocare WhatsApp, Pavel Durov, Roskomnadzor, Rusia WhatsAppSursă foto: Shutterstock
Sci Tech o săptămână ago

Utilizatorii Signal și WhatsApp, țintiți de atacuri cibernetice atribuite Rusiei

Serviciul de Informații și Securitate al Țărilor de Jos (AIVD) a emis un avertisment...

Alzheimer, diagnosticare timpurie, Institutul Politehnic Worcester, inteligența artificială, pierdere volum cerebralSursă foto: Shutterstock
Sci Tech o săptămână ago

Pas important în diagnosticarea Alzheimer: un instrument cu 93% precizie

Cercetătorii de la Institutul Politehnic Worcester din Massachusetts au dezvoltat un instrument bazat pe...

British Journal of Cancer, dieta vegetariana, Dr Carrie Daniel, Moffitt Cancer Center, riscul de cancerSursă foto: Shutterstock
Sci Tech o săptămână ago

Vegetarienii au un risc mai scăzut de a dezvolta cinci tipuri de cancer

Un studiu recent publicat în British Journal of Cancer arată că dieta vegetariană reduce...

Sci Tech o săptămână ago

Virusul sincițial respirator, o amenințare serioasă pentru copii și adulți

Infecția cu virusul sincițial respirator (VSR) devine tot mai frecventă, având o rată de...

comisia europeana, google, investigatie UE, licitații publicitate, publicitate onlineSursă foto: Shutterstock
Sci Tech 2 săptămâni ago

Șeful Google ar putea obține un venit record de 692 de milioane de dolari în trei ani

Șeful Google, Sundar Pichai, ar putea câștiga până la 692 de milioane de dolari...

Sci Tech 2 săptămâni ago

Ministrul Energiei: Creșterile de prețuri la carburanți sunt mai mici decât în alte țări europene

Ministrul Energiei, Bogdan Ivan, a declarat că, în contextul creșterilor de prețuri la carburanți...

Sci Tech 2 săptămâni ago

Google deschide un centru de inteligență artificială la Berlin

Google a inaugurat un centru de inteligență artificială la Berlin, având ca scop sprijinirea...

Sci Tech 2 săptămâni ago

NASA pregătește lansarea misiunii Artemis II, care va transporta patru astronauți în jurul Lunii

NASA a anunțat că racheta Artemis II este pregătită pentru lansare în aprilie, după...

Sci Tech 2 săptămâni ago

Extinderea inteligenței artificiale ar putea genera locuri de muncă în zona euro

Banca Centrală Europeană (BCE) anticipează că utilizarea extinsă a inteligenței artificiale (AI) de către...

Sci Tech 3 săptămâni ago

Starlink, operator de internet prin satelit, își deschide subsidiară în România

Starlink, serviciul de internet prin satelit gestionat de SpaceX, a anunțat înființarea unei subsidiare...

arad, bărbat condamnat, complicitate mama, decizia instanței, viol fiica partenereiSursă foto: Shutterstock
Sci Tech 3 săptămâni ago

O nouă metodă de stimulare cerebrală promite tratamente rapide pentru depresie

Cercetătorii de la UCLA Health au dezvoltat o abordare inovatoare de stimulare magnetică transcraniană...

Geely, module baterii, riscul de incendiu, SUV-uri electrice EX30, Volvo CarsSursă foto: Shutterstock
Sci Tech 3 săptămâni ago

Volvo Cars se confruntă cu provocări majore după rechemarea a peste 40.000 de SUV-uri electrice EX30

Volvo Cars a decis să recheme global 40.323 de SUV-uri electrice EX30, din cauza...

Sci Tech 3 săptămâni ago

Doi experți români în securitate cibernetică lansează o platformă AI inovatoare

Doi români cu experiență în securitate cibernetică au lansat AISafe Labs, o platformă AI...

aplicatie de stat, blocare WhatsApp, Pavel Durov, Roskomnadzor, Rusia WhatsAppSursă foto: Shutterstock
Sci Tech 3 săptămâni ago

WhatsApp introduce funcția de programare a mesajelor pentru utilizatori

WhatsApp a anunțat dezvoltarea unei funcții care va permite utilizatorilor să programeze mesaje pentru...

Sci Tech 3 săptămâni ago

OpenAI preconizează cheltuieli de 600 miliarde de dolari pentru capacitatea de calcul

OpenAI estimează cheltuieli de aproximativ 600 de miliarde de dolari pentru capacitatea de calcul...

Sci Tech 4 săptămâni ago

Data lansării misiunii Artemis II de către NASA, programată pentru 6 martie

Oficialii NASA au anunțat că misiunea Artemis II, care va transporta patru astronauți în...

Sci Tech 4 săptămâni ago

OVES Enterprise lansează Sahara, racheta românească cu inteligență artificială

OVES Enterprise a dezvăluit Sahara, prima rachetă de croazieră dezvoltată în România, integrând tehnologie...

Sci Tech o lună ago

Un expert din Silicon Valley avertizează asupra riscurilor inteligenței artificiale

Steve Yegge, un inginer de software cu experiență, subliniază necesitatea limitării utilizării inteligenței artificiale...

Sci Tech o lună ago

Insulina sub formă de gel: o alternativă la injecțiile diabetice

O nouă abordare terapeutică ar putea transforma modul în care pacienții cu diabet își...

Sci Tech o lună ago

Numărul cazurilor de cancer în Uniunea Europeană continuă să crească

Cancerul rămâne a doua cauză de deces în Uniunea Europeană, iar numărul cazurilor noi...

Sci Tech o lună ago

Baidu lansează OpenClaw în aplicația sa de căutare pentru 700 de milioane de utilizatori

Gigantul tehnologic chinez Baidu va integra agentul de inteligență artificială OpenClaw în aplicația sa...

Sci Tech o lună ago

Bărbații care achiziționează pastile ilegale pentru disfuncția erectilă riscă sănătatea

Bărbații care cumpără pastile ilegale pentru disfuncția erectilă sunt expuși unor riscuri semnificative pentru...