OpenAI dezvăluie două noi modele de procesare a limbajului natural
Producătorul ChatGPT a lansat două modele de inteligență artificială deschise, primele după o perioadă de cinci ani în care a lansat exclusiv modele închise. Cel mai puternic dintre cele două, gpt-oss-120b, rulează pe un sistem cu o singură placă video Nvidia, în timp ce gpt-oss-20b poate fi utilizat pe un laptop cu 16GB de memorie RAM.
Conform testelor sintetice prezentate de companie, performanța celor două modele se situează sub celelalte modele ale companiei, dar le depășește pe celelalte modele deschise disponibile pe piață.
Deschiderea noilor modele ridică anumite întrebări. Acestea nu sunt capabile să execute toate sarcinile pe care le pot realiza celelalte modele ale companiei. În momentul în care se confruntă cu sarcini pe care nu le pot rezolva, modelele deschise au capacitatea de a se conecta, prin cloud, la modelele mai avansate ale companiei.
Un alt aspect important este că OpenAI nu a făcut publice sursele datelor pe care au fost antrenate noile modele, ceea ce contravine practicilor obișnuite pentru modelele de AI cu adevărat deschise. De asemenea, noile modele se confruntă cu problema halucinațiilor, având o rată de halucinații de 49% respectiv 53%, ceea ce indică o lipsă de încredere în jumătate din răspunsurile generate.
Noile modele OpenAI sunt disponibile pentru descărcare de pe Hugging Face.