WebDev Arena är en kostnadsfri öppen plattform där två LLMs tävlar mot varandra i webbutveckling. Användaren skriver en prompt och ser två kodexempel i realtid, där användaren sedan röstar fram det bästa alternativet.
Plattform är för att utvärdera stora språkmodellers (LLM) förmåga inom webbutveckling. Genom samarbete med E2B har de skapat en säker och effektiv miljö där olika LLMs kan tävla mot varandra i att bygga webbapplikationer. Plattformen har framgångsrikt hanterat över 230 000 sandlådor och möjliggjort mer än 50 000 modelljämförelser, där säkerhet, prestanda och isolering varit centrala aspekter.
- Plattformen använder E2B-sandlådor som startar på cirka 150ms och garanterar säker kodkörning i isolerade miljöer.
- Systemet hanterar automatiskt beroenden och stödjer olika tekniska ramverk för olika LLM-modeller.
- Claude 3.5 Sonnet leder för närvarande topplistan följt av DeepSeek-R1.
- Implementeringen av E2B tog endast två timmar att slutföra.
- Systemet kan hantera både kodtolkning och webbutvecklingsläge för olika användningsområden.









