Meta Platforms dezvăluie o inovație revoluționară: un nou „model AI global” destinat roboților și vehiculelor autonome
Meta Platforms a lansat un nou „model AI al lumii”, destinat să îmbunătățească înțelegerea mediului tridimensional și a mișcărilor obiectelor fizice de către roboți și vehicule autonome. Modelul open-source, denumit V-JEPA 2, este capabil să înțeleagă, să prezică și să planifice în lumea fizică.
Acest tip de „model al lumii” își propune să reproducă logica lumii reale, creând o simulare internă a realității pentru ca inteligența artificială să poată învăța, planifica și lua decizii într-o manieră similară cu cea umană. De exemplu, V-JEPA 2 recunoaște că o minge care cade de pe o masă va atinge pământul sau că un obiect ascuns privirii nu dispare pur și simplu.
Inteligența artificială reprezintă o prioritate pentru CEO-ul Meta, Mark Zuckerberg, în contextul competiției acerbă cu OpenAI, Microsoft și Google. Conform unor surse, Meta intenționează să investească 14 miliarde de dolari în firma de AI Scale AI și să-l angajeze pe CEO-ul acesteia, Alexandr Wang, pentru a-și consolida strategia de AI.
Modelul V-JEPA 2 este promovat ca un instrument esențial pentru roboți de livrare și mașini autonome, care trebuie să navigheze în lumea reală în timp real. Spre deosebire de modelele tradiționale care folosesc cantități mari de date etichetate sau filmări video, V-JEPA 2 raționează într-un spațiu simplificat „latent”, înțelegând cum se mișcă și interacționează obiectele.
Yann LeCunn, șeful AI de la Meta, a declarat că „a permite mașinilor să înțeleagă lumea fizică este foarte diferit de a le face să înțeleagă limbajul”. El a explicat că „un model al lumii este ca un geamăn digital abstract al realității, pe care AI-ul îl poate consulta pentru a înțelege lumea și a prezice consecințele acțiunilor sale, putând astfel să planifice un curs de acțiune pentru a îndeplini o sarcină dată”.
Modelele AI de tip „world model” au atras tot mai mult interes în comunitatea de cercetare, deoarece specialiștii caută să depășească modelele lingvistice care stau la baza aplicațiilor generative, cum ar fi ChatGPT de la OpenAI și Gemini de la Google. În septembrie anul trecut, cercetătoarea AI Fei-Fei Li a strâns 230 de milioane de dolari pentru startup-ul World Labs, care își propune să creeze „modele mari ale lumii” pentru o mai bună înțelegere a structurii mediului fizic. Între timp, divizia DeepMind a Google dezvoltă propriul model numit Genie, care poate simula jocuri și medii 3D în timp real.