Getting your Trinity Audio player ready...
|
Un nou model de inteligență artificială, DeepSeek-R1, a captat rapid atenția comunității științifice datorită performanței sale remarcabile și a accesibilității sale financiare. Lansat recent de o companie din China, acest model open-source concurează cu cele mai avansate modele de raționament disponibile, oferind cercetătorilor o oportunitate unică de a-și dezvolta propriile soluții bazate pe AI.
Performanță comparabilă cu modelele de top
Testele inițiale indică faptul că DeepSeek-R1 poate rezolva probleme complexe de matematică și știință la un nivel similar cu modelul o1, lansat în septembrie de OpenAI, lider în industrie. Deși R1 nu reușește încă să rezolve toate sarcinile pe care cercetătorii și le-ar dori, acesta le oferă posibilitatea de a antrena modele personalizate pentru domeniile lor de studiu.
„Având în vedere performanța sa excelentă și costul redus, credem că DeepSeek-R1 va încuraja mai mulți cercetători să testeze modelele de limbaj în activitatea lor zilnică, fără a se îngrijora de costuri,” afirmă Huan Sun, cercetător în inteligență artificială la Universitatea de Stat din Ohio.
Un model deschis și accesibil
Spre deosebire de modelele proprietare, DeepSeek-R1 oferă o API accesibilă la un cost semnificativ mai mic și permite utilizarea gratuită prin chatbot-ul DeepThink. Mai mult, cercetătorii pot descărca modelul și îl pot rula pe propriile servere, o opțiune indisponibilă pentru competitori precum o1.
De la lansarea sa pe 20 ianuarie, numeroși cercetători au început să-și creeze propriile modele de raționament inspirate din R1. Conform datelor de pe Hugging Face, o platformă open-science pentru AI, DeepSeek-R1 a fost descărcat de peste trei milioane de ori într-o singură săptămână.
Aplicații în știință și matematică
DeepSeek-R1 a fost testat pe sarcini științifice bazate pe date reale, din domenii precum bioinformatica, chimia computațională și neuroștiințele cognitive. Modelul a obținut rezultate comparabile cu ale lui o1 în analiza și vizualizarea datelor, deși ambele modele au reușit să rezolve corect doar o treime din provocările testate. Un avantaj major al R1 este costul de rulare de 13 ori mai mic decât al lui o1, deși timpul de procesare este ușor mai lent.
În matematică, DeepSeek-R1 a demonstrat deja potențial ridicat. Frieder Simon, matematician și informatician la Universitatea Oxford, l-a testat în domeniul analizei funcționale și a considerat argumentele modelului mai promițătoare decât cele ale lui o1. Cu toate acestea, Simon subliniază că utilizarea eficientă a acestor modele necesită competențe avansate din partea cercetătorilor pentru a distinge între demonstrațiile corecte și cele eronate.
De ce DeepSeek-R1 generează entuziasm
Unul dintre principalele motive pentru care DeepSeek-R1 atrage atât de mult interes este faptul că este disponibil în regim open-weight, ceea ce înseamnă că cercetătorii pot accesa și modifica conexiunile învățate ale algoritmului. Prin tehnici precum fine-tuning, modelul poate fi optimizat pentru sarcini specifice, inclusiv programare în domeniul științific.
Această flexibilitate îl face un instrument valoros pentru cercetători, care pot adapta DeepSeek-R1 la nevoile specifice ale domeniului lor, fără restricțiile impuse de modelele închise.
Articol preluat din Nature
Descoperă mai multe la Radio Clasic FM
Abonează-te ca să primești ultimele articole prin email.