Alibaba har nyligen lanserat över 100 nya öppna AI-modeller och ett innovativt verktyg för text-till-video-generering, vilket markerar ett betydande steg i företagets strävan att stärka sin position inom AI-teknologi. Dessa nyheter presenterades under företagets årliga Apsara-konferens.
Nya AI-modeller från Alibaba
Alibaba introducerade en ny serie av stora språkmodeller (LLM) som kallas Qwen 2.5. Dessa modeller är utformade för att hantera en mängd olika uppgifter inom områden som matematik, programmering och flerspråkig kommunikation. Modellerna varierar i storlek från 0,5 miljarder till hela 72 miljarder parametrar, vilket gör dem anpassningsbara för både enklare och mer komplexa uppgifter.
Enligt Alibaba har dessa modeller redan laddats ner över 40 miljoner gånger från plattformar som Hugging Face och Modelscope. Företaget framhäver att de nya modellerna erbjuder förbättrade funktioner jämfört med tidigare versioner, vilket gör dem mer effektiva för användning inom olika sektorer, inklusive spelutveckling och vetenskaplig forskning.
Text-till-video-verktyg
Det nya text-till-video-verktyget, som ingår i Alibabas Tongyi Wanxiang-modellfamilj, kan generera högkvalitativa videor baserat på textkommandon på både kinesiska och engelska. Detta verktyg använder en avancerad diffusionsarkitektur för att förbättra videokvaliteten och kan även omvandla stillbilder till dynamiska videor i olika stilar, inklusive realistiska scener och 3D-animationer.
Varför släpper dessa nya öppna AI-modeller?
Strategisk Betydelse
Denna lansering är inte bara en teknologisk prestation utan också en strategisk åtgärd för Alibaba i kampen mot både inhemska konkurrenter som Baidu och Huawei samt internationella giganter som Microsoft och OpenAI.
Genom att erbjuda dessa modeller som öppna källkodsprodukter hoppas Alibaba kunna attrahera forskare, akademiker och företag globalt, vilket kan leda till ökad användning av deras molntjänster.
https://huggingface.co/Qwen
https://huggingface.co/ali-vilab