Nya diffusionsmodeller lånar teknik från AI-bildsyntes för 10x hastighetsökning


Diffusionsmodeller är en typ av generativ AI-teknik som i stället för att generera text sekventiellt, vilket gör autoregressiva modeller, börjar med att skapa en grov skiss av texten och förfinar den över flera omgångar. Denna metodianvändning består av två huvudsteg: först tillsätter modellen Gaussisk brus till indata och lär sig sedan att återställ data genom att ta bort detta brus steg för steg.

Inception Labs har nyligen lanserat Mercury en AI-språkmodell som utnyttjar diffusionsmodeller för att uppnå betydande hastighetsökningar i textgenerering. Detta steg markerar en drift mot en ny generation av stora språkmodeller (LLM), som skiljer sig markant från traditionella autoregressiva modeller.

Här är ett test från deras playground som du kan besöka här : https://chat.inceptionlabs.ai

Mercury har rapporterats vara upp till 10 gånger snabbare än de mest hastighetsoptimerade traditionella LLM:erna, med kapaciteten att hantera över 1000 tokens per sekund jämfört med ungefär 200 tokens per sekund för äldre modeller. Detta gör Mercury särskilt effektiv i uppgifter som kodgenerering, där den uppnår hastigheter som överträffar andra kommersiella modeller, exempelvis GPT-4o Mini.

Bred applicerbarhet

Mercury och dess underliggande diffusionsmodeller är inte bara begränsade till textgenerering; de har potential att användas inom olika modaliteter, inklusive bild, video och ljud, vilket gör dem till ett kraftfullt verktyg för multimodala AI-applikationer.

I takt med att fler företag och forskare investerar i denna teknik kan vi förvänta oss en växande användning av diffusionsmodeller inom AI-generering. Informationen tyder på att detta kan bli en paradigmförändrande utveckling för hur AI-tillämpningar designas och implementeras.

Trots att diffusionsmodeller visar lovande resultat, har de ännu inte fått ett brett genomslag jämfört med autoregressiva modeller. Detta beror delvis på utmaningar som högre beräkningskostnader och svårigheter med att kontrollera genereringen. Dock tyder nyligen publicerade studier från prestigefyllda institutioner på att diffusionsmodeller kan vara på väg att få ett genombrott inom AI-textgenerering, vilket öppnar upp för nya möjligheter inom områden som kodgenerering och naturlig språkbehandling.

inceptionlabs.ai

Playground Mercury Coder

Get latest posts delivered right to your inbox