Wan är en avancerad AI-modell för videogenerering utvecklad av Alibaba Groups Tongyi Lab. Modellen utmärker sig genom sin förmåga att generera högkvalitativa videor baserade på text och bilder.
Wan är en omfattande och öppen uppsättning videomodeller som flyttar gränserna för videogenerering. Den erbjuder toppmodern prestanda, stöd för konsumentgrafikkort, flera uppgifter inklusive text-till-video och bild-till-video, samt en kraftfull video-VAE.
- Modellen finns i två huvudversioner: en 14B-modell för hög kvalitet och en 1.3B-modell som kräver mindre grafikminne (8.19 GB VRAM).
- Stödjer flera uppgifter som text-till-video, bild-till-video, videoredigering och text-till-bild.
- Använder en ny 3D-kausal VAE-arkitektur kallad Wan-VAE för effektiv videokomprimering.
- Presterar bättre än både öppna och stängda modeller i omfattande utvärderingar.
- Kan köras på både enskilda och flera GPU:er med olika optimeringsalternativ.
- Erbjuder promptutökning via både lokala modeller och Dashscope API för förbättrad generering.
- Tränad på noggrant kurerad och rensad data för hög kvalitet och mångfald.
- Licensierad under Apache 2.0 med tydliga riktlinjer för användning.









