- Ursprungliga DeepSeek-R1 vägrade svara på känsliga ämnen och gav förprogrammerade CCP-vänliga svar.
- Perplexity samlade in 40 000 flerspråkiga frågor relaterade till 300 censurerade ämnen för efterträning.
- Ett speciellt klassificeringssystem utvecklades för att identifiera censurerade ämnen.
- Modellen tränades med Nvidia’s NeMo 2.0-ramverk för att behålla kvalitet och prestanda.
- Omfattande utvärdering genomfördes med över 1000 testexempel på känsliga ämnen.
- Modellen behöll sina matematiska och logiska förmågor efter avcentreringen.
- R1 1776 är nu tillgänglig som öppen källkod via HuggingFace.
PerplexityAI har lanserat R1-1776 en modifierad version av språkmodellen DeepSeek-R1. Denna nya modell har specifikt utformats för att eliminera begränsningar relaterade till kinesisk censur samtidigt som den behåller sina imponerande resonemangs- och analysförmågor, Den är öppenkällkod och går att ladda ner från Huggingface.
R1-1776 post-träning för censurfria svar
För att skapa R1-1776 genomförde PerplexityAI en omfattande utvecklingsprocess som inkluderade flera viktiga steg. Modellen bygger på DeepSeek-R1:s grundläggande arkitektur, som redan visat sig ha exceptionella resonemangsförmågor jämförbara med ledande modeller som o1 och o3-mini.
Trots borttagandet av censur bibehöll modellen sina kärnförmågor, inklusive avancerad resonemangsförmåga och matematiska färdigheter, vilket bekräftades genom tester på flera benchmarks. Den noggrant designade post-träningen säkerställde att modellen kunde hantera kontroversiella frågor utan att kompromissa med dess precision eller funktionalitet.

Utvecklingsprocessen involverade:
- Samling av en omfattande datamängd bestående av 40 000 multilingvala. frågor fokuserade på tidigare censurerade ämnen.
- Expertbedömning av cirka 300 censurerade ämnesområden.
- Implementering av en multilingual censurklassificerare för att säkerställa faktamässiga och relevanta svar.
- Användning av NVIDIA’s NeMo 2.0-ramverk för att finslipa modellen utan att kompromissa med dess grundläggande förmågor.
Tillgänglighet och framtida planer
R1-1776 är tillgänglig för användare genom flera kanaler:
- Modellvikter finns publicerade på Hugging Face-plattformen.
- Direkt åtkomst erbjuds via Sonar API.
- PerplexityAI överväger att öppna källkoden för både träning och inferens i framtiden.
Detta initiativ representerar ett betydande steg mot mer transparent och opartisk informationsdelning inom AI-sektorn. Genom att kombinera DeepSeek-R1:s avancerade resonemangsförmåga med ökad öppenhet skapar PerplexityAI en plattform som kan ge mer balanserade och omfattande svar på komplexa frågor.
https://www.perplexity.ai/hub/blog/open-sourcing-r1-1776
https://huggingface.co/perplexity-ai/r1-1776
Get latest posts delivered right to your inbox
Leave a Reply