Perplexity släpper R1-1776 en DeepSeek-R1-justering som tar bort kinesisk censur


  • Ursprungliga DeepSeek-R1 vägrade svara på känsliga ämnen och gav förprogrammerade CCP-vänliga svar.
  • Perplexity samlade in 40 000 flerspråkiga frågor relaterade till 300 censurerade ämnen för efterträning.
  • Ett speciellt klassificeringssystem utvecklades för att identifiera censurerade ämnen.
  • Modellen tränades med Nvidia’s NeMo 2.0-ramverk för att behålla kvalitet och prestanda.
  • Omfattande utvärdering genomfördes med över 1000 testexempel på känsliga ämnen.
  • Modellen behöll sina matematiska och logiska förmågor efter avcentreringen.
  • R1 1776 är nu tillgänglig som öppen källkod via HuggingFace.

PerplexityAI har lanserat R1-1776 en modifierad version av språkmodellen DeepSeek-R1. Denna nya modell har specifikt utformats för att eliminera begränsningar relaterade till kinesisk censur samtidigt som den behåller sina imponerande resonemangs- och analysförmågor, Den är öppenkällkod och går att ladda ner från Huggingface.

R1-1776 post-träning för censurfria svar

För att skapa R1-1776 genomförde PerplexityAI en omfattande utvecklingsprocess som inkluderade flera viktiga steg. Modellen bygger på DeepSeek-R1:s grundläggande arkitektur, som redan visat sig ha exceptionella resonemangsförmågor jämförbara med ledande modeller som o1 och o3-mini.

Trots borttagandet av censur bibehöll modellen sina kärnförmågor, inklusive avancerad resonemangsförmåga och matematiska färdigheter, vilket bekräftades genom tester på flera benchmarks. Den noggrant designade post-träningen säkerställde att modellen kunde hantera kontroversiella frågor utan att kompromissa med dess precision eller funktionalitet.

Utvecklingsprocessen involverade:

  • Samling av en omfattande datamängd bestående av 40 000 multilingvala. frågor fokuserade på tidigare censurerade ämnen.
  • Expertbedömning av cirka 300 censurerade ämnesområden.
  • Implementering av en multilingual censurklassificerare för att säkerställa faktamässiga och relevanta svar.
  • Användning av NVIDIA’s NeMo 2.0-ramverk för att finslipa modellen utan att kompromissa med dess grundläggande förmågor.

Tillgänglighet och framtida planer

R1-1776 är tillgänglig för användare genom flera kanaler:

  • Modellvikter finns publicerade på Hugging Face-plattformen.
  • Direkt åtkomst erbjuds via Sonar API.
  • PerplexityAI överväger att öppna källkoden för både träning och inferens i framtiden.

Detta initiativ representerar ett betydande steg mot mer transparent och opartisk informationsdelning inom AI-sektorn. Genom att kombinera DeepSeek-R1:s avancerade resonemangsförmåga med ökad öppenhet skapar PerplexityAI en plattform som kan ge mer balanserade och omfattande svar på komplexa frågor.

https://www.perplexity.ai/hub/blog/open-sourcing-r1-1776

https://huggingface.co/perplexity-ai/r1-1776

Get latest posts delivered right to your inbox