Studiu: chatboții își flatează utilizatorii și oferă sfaturi potențial dăunătoare

Sci Tech 07:19

Cercetători de la Universitatea Stanford au publicat joi în revista Science un studiu care arată că asistenții cu inteligență artificială tind să-și flateze și să-și valideze utilizatorii, oferind astfel sfaturi nepotrivite sau dăunătoare. Cercetarea a testat 11 sisteme de top și a constatat comportamente excesiv de agreabile și afirmative ale chatboților în interacțiunile cu oameni.

Studiul a evaluat 11 sisteme de inteligență artificială și a constatat că toate au prezentat grade diferite de lingușire, definită ca un comportament excesiv de agreabil și afirmativ. Autorii subliniază că problema nu este doar oferirea de recomandări nepotrivite, ci și faptul că oamenii acordă mai multă încredere inteligenței artificiale și preferă răspunsurile acesteia atunci când chatboții le justifică convingerile.

Cercetătorii de la Universitatea Stanford avertizează că acest tip de defect tehnologic, deja asociat în unele cazuri cu manifestări delirante sau suicidare în rândul persoanelor vulnerabile, este omniprezent în interacțiunile cu chatboții și suficient de subtil pentru a trece neobservat. Experimentul a comparat răspunsurile asistenților populari furnizați de companii precum Anthropic, Google, Meta și OpenAI cu cele ale utilizatorilor de pe un forum de sfaturi de pe Reddit și a constatat că chatboții au confirmat acțiunile unui utilizator, în medie, cu 49% mai des decât alți oameni, inclusiv în cazuri care implică înșelăciune, conduită ilegală sau comportament social iresponsabil.

Radio Clasic

Studiu: chatboții își flatează utilizatorii și oferă sfaturi potențial dăunătoare

Sci Tech

Studiu: chatboții își flatează utilizatorii și oferă sfaturi potențial dăunătoare

OpenAI închide Sora și încheie parteneriatul cu Disney

Microsoft ar putea elimina cerința contului online la configurarea Windows 11

Webb detectează atmosferă surprinzătoare la super-Pământul TOI-561 b

Bacterie reprogramată pentru a livra medicamentul anticancer direct în tumori

Microsoft anunță schimbări majore pentru Windows 11 ca răspuns la critici

NASA readuce racheta Artemis la platforma de lansare după reparații la sistemul de heliu

Primul prototip funcțional de baterie cuantică, prezentat de cercetători australieni

Malware sofisticat pentru iPhone, identificat pe zeci de site-uri din Ucraina

Studiu: ChatGPT a avut dificultăți în evaluarea ipotezelor științifice

Google a lansat un instrument AI pentru prognoza viiturilor urbane

Meta introduce funcții de control parental pentru utilizatorii tineri ai WhatsApp

Utilizatorii Signal și WhatsApp, țintiți de atacuri cibernetice atribuite Rusiei

Pas important în diagnosticarea Alzheimer: un instrument cu 93% precizie

Vegetarienii au un risc mai scăzut de a dezvolta cinci tipuri de cancer

Virusul sincițial respirator, o amenințare serioasă pentru copii și adulți

Șeful Google ar putea obține un venit record de 692 de milioane de dolari în trei ani

Ministrul Energiei: Creșterile de prețuri la carburanți sunt mai mici decât în alte țări europene

Google deschide un centru de inteligență artificială la Berlin

NASA pregătește lansarea misiunii Artemis II, care va transporta patru astronauți în jurul Lunii

Extinderea inteligenței artificiale ar putea genera locuri de muncă în zona euro

Starlink, operator de internet prin satelit, își deschide subsidiară în România

O nouă metodă de stimulare cerebrală promite tratamente rapide pentru depresie

Volvo Cars se confruntă cu provocări majore după rechemarea a peste 40.000 de SUV-uri electrice EX30

Doi experți români în securitate cibernetică lansează o platformă AI inovatoare

Sci Tech - Ultimele articole

WhatsApp introduce funcția de programare a mesajelor pentru utilizatori

OpenAI preconizează cheltuieli de 600 miliarde de dolari pentru capacitatea de calcul

Data lansării misiunii Artemis II de către NASA, programată pentru 6 martie

OVES Enterprise lansează Sahara, racheta românească cu inteligență artificială

Un expert din Silicon Valley avertizează asupra riscurilor inteligenței artificiale

Insulina sub formă de gel: o alternativă la injecțiile diabetice

Numărul cazurilor de cancer în Uniunea Europeană continuă să crească

Baidu lansează OpenClaw în aplicația sa de căutare pentru 700 de milioane de utilizatori

Bărbații care achiziționează pastile ilegale pentru disfuncția erectilă riscă sănătatea

Producătorul John Deere investește în roboți umanoizi pentru viitorul agriculturii