IBMs släpper öppen källkod Granite 4.0 Nano – kompakt LLM för laptop och mobil


  • IBM släpper fyra nya kompakta AI-modeller (350 miljoner – 1,5 miljarder parametrar) som kan köras lokalt.
  • Modellerna fungerar på vanliga laptops, mobiler och i webbläsaren utan molntjänster.
  • Släpps under Apache 2.0-licens.

Det är överraskande att IBM har tagit ett modigt steg mot mer tillgänglig AI genom att släppa Granite 4.0 Nano som öppen källkod, En familj av fyra kompakta språkmodeller som faktiskt kan köras på din laptop eller telefon. 

Granite 4.0 modellerna: 

  • Granite-4.0-H-1B
  • Granite-4.0-H-350M
  • Granite-4.0-1B
  • Granite-4.0-350M – Transformer-based variant

Dessa modeller är små nog att köra direkt i din webbläsare utan att behöva ladda upp data till molnet. Du kan testa dem redan nu på IBMs Granite Playground.

Prestanda som överraskar

Modellerna presterar bra på Qualcomms senaste NPU:er når Granite-4.0-Micro 36,4 tokens per sekund på X2 Elite-datorer och 28,7 tokens per sekund på smartphones med Snapdragon 8 Elite Gen 5.

En 3 miljarders parametermodell med 128K token context length behöver bara 4 GB minne kanske tillräckligt litet för att köras på en Raspberry Pi.

Så här kommer du igång

Vill du testa Granite 4.0 Nano? Det finns flera sätt att komma igång. Du kan köra modellerna lokalt på din laptop, mobil eller till och med direkt i webbläsaren med WebGPU-acceleration.

IBMs Granite Playground: https://www.ibm.com/granite/playground

Granite WebGPU HuggingFace: https://huggingface.co/spaces/ibm-granite/Granite-4.0-Nano-WebGPU

För utvecklare finns modellerna tillgängliga på Hugging Face, Docker och IBMs egen watsonx.ai plattform. Alla modeller är öppen källkod med Apache 2.0-licens, vilket betyder att du fritt kan använda och modifiera dem.

Mer info: