Perplexity släpper R1-1776 en DeepSeek-R1-justering som tar bort kinesisk censur

Ursprungliga DeepSeek-R1 vägrade svara på känsliga ämnen och gav förprogrammerade CCP-vänliga svar.
Perplexity samlade in 40 000 flerspråkiga frågor relaterade till 300 censurerade ämnen för efterträning.
Ett speciellt klassificeringssystem utvecklades för att identifiera censurerade ämnen.
Modellen tränades med Nvidia’s NeMo 2.0-ramverk för att behålla kvalitet och prestanda.
Omfattande utvärdering genomfördes med över 1000 testexempel på känsliga ämnen.
Modellen behöll sina matematiska och logiska förmågor efter avcentreringen.
R1 1776 är nu tillgänglig som öppen källkod via HuggingFace.

PerplexityAI har lanserat R1-1776 en modifierad version av språkmodellen DeepSeek-R1. Denna nya modell har specifikt utformats för att eliminera begränsningar relaterade till kinesisk censur samtidigt som den behåller sina imponerande resonemangs- och analysförmågor, Den är öppenkällkod och går att ladda ner från Huggingface.

R1-1776 post-träning för censurfria svar

För att skapa R1-1776 genomförde PerplexityAI en omfattande utvecklingsprocess som inkluderade flera viktiga steg. Modellen bygger på DeepSeek-R1:s grundläggande arkitektur, som redan visat sig ha exceptionella resonemangsförmågor jämförbara med ledande modeller som o1 och o3-mini.

Trots borttagandet av censur bibehöll modellen sina kärnförmågor, inklusive avancerad resonemangsförmåga och matematiska färdigheter, vilket bekräftades genom tester på flera benchmarks. Den noggrant designade post-träningen säkerställde att modellen kunde hantera kontroversiella frågor utan att kompromissa med dess precision eller funktionalitet.

Utvecklingsprocessen involverade:

Samling av en omfattande datamängd bestående av 40 000 multilingvala. frågor fokuserade på tidigare censurerade ämnen.
Expertbedömning av cirka 300 censurerade ämnesområden.
Implementering av en multilingual censurklassificerare för att säkerställa faktamässiga och relevanta svar.
Användning av NVIDIA’s NeMo 2.0-ramverk för att finslipa modellen utan att kompromissa med dess grundläggande förmågor.

Tillgänglighet och framtida planer

R1-1776 är tillgänglig för användare genom flera kanaler:

Modellvikter finns publicerade på Hugging Face-plattformen.
Direkt åtkomst erbjuds via Sonar API.
PerplexityAI överväger att öppna källkoden för både träning och inferens i framtiden.

Detta initiativ representerar ett betydande steg mot mer transparent och opartisk informationsdelning inom AI-sektorn. Genom att kombinera DeepSeek-R1:s avancerade resonemangsförmåga med ökad öppenhet skapar PerplexityAI en plattform som kan ge mer balanserade och omfattande svar på komplexa frågor.

https://www.perplexity.ai/hub/blog/open-sourcing-r1-1776

https://huggingface.co/perplexity-ai/r1-1776

Get latest posts delivered right to your inbox

Perplexity släpper R1-1776 en DeepSeek-R1-justering som tar bort kinesisk censur

R1-1776 post-träning för censurfria svar

Utvecklingsprocessen involverade:

Tillgänglighet och framtida planer

Revolutionizing Customer Relationships with AI: Key Lessons from Krishna Raj Raja’s Book ‘Support Experience’

Why Time is QA Tester’s Superpower and Pressure its Kryptonite!

Med Claude Explains kan Claude nu skapa egna blogginlägg

Why Analog AI Could Be the Future of Energy-Efficient Computing