NVIDIA Cosmos en massiv öppen källkod video världsmodell tränad på 20 MILJONER timmar video


  • Plattformen är tränad på 9000 biljoner tokens, inklusive 20 miljoner timmar av robotik- och kördata
  • Cosmos WFM erbjuder 8X bättre komprimering och 12X snabbare databehandling genom sin tokenizer
  • Modellerna finns i storlekar från 4 till 14 miljarder parametrar för olika användningsområden
  • Inbyggda säkerhetsfunktioner filtrerar olämpligt innehåll och applicerar digitala vattenstämplar
  • Plattformen accelererar datakurering 20X genom NVIDIA NeMo Curator
  • Prestandan överträffar baslinjemodeller med upp till 14X högre framgångsgrad för posestimering
  • Systemet är öppet licensierat för att möjliggöra storskalig utveckling utan höga ingångskostnader

NVIDIA har lanserat Cosmos, en ny plattform för att accelerera utvecklingen av fysisk AI-system som autonoma fordon och robotar. Cosmos inkluderar generativa världsmodeller, avancerade tokenizers och en accelererad videobearbetningspipeline som är optimerad för NVIDIA:s datormoln-GPU:er.

Plattformen är tränad på miljontals timmar av kör och robotikvideodata och tillhandahålls under öppen licensiering för att demokratisera utvecklingen av fysisk AI. Den kombinerar avancerade videomodeller med fysikmedvetna funktioner och omfattande säkerhetsmekanismer för att accelerera utvecklingen av fysiska AI-system.

Adoption

Ledande företag som Uber, Waabi, Wayve och Foretellix har redan börjat använda Cosmos för olika applikationer relaterade till autonoma fordon och robotik.

Tillgänglighet

Cosmos WFMs finns nu tillgängliga på Hugging Face och NVIDIA NGC-katalogen. De kommer snart att finnas som fullständigt optimerade NVIDIA NIM-microservices.

https://www.nvidia.com/en-us/ai/cosmos