Mozillas röstigenkänning AI stödjer 180 språk


Common Voice är ett initiativ från Mozilla som syftar till att förb ättra röstigenkänning genom att samla in och validera röstdata från riktiga människor. Projektet strävar efter att göra röstteknologi mer tillgänglig och öppen för alla, vilket kan stimulera innovation inom området. Genom att engagera användare att donera sina röster och hjälpa till med validering, bygger de en omfattande databas för utveckling av röstsystem.

Bakgrund och syfte

Common Voice lanserades ursprungligen av Mozilla 2017 med målet att skapa en öppen källkodsdatabas med talade meningar som kan användas för att träna AI-modeller för röstigenkänning. Projektet var ett svar på den begränsade tillgängligheten till högkvalitativa röstdata, som ofta är dyra eller proprietära.

Genom att erbjuda en plattform där människor kan donera sina röster frivilligt, strävar Common Voice efter att skapa en mer diversifierad och representativ databas av mänskligt tal. Detta kan i sin tur leda till mer precisa och inkluderande röstigenkänningsystem.

Common Voice-plattformen erbjuder flera unika funktioner:

  1. Öppen källkod: Alla data samlas in under en Creative Commons Zero-licens, vilket gör dem fritt tillgängliga för vem som helst att använda och modifiera.

  1. Språkmångfald: Med stöd för 180 språk täcker plattformen en betydande del av världens språkliga mångfald.

  1. Användargenererad data: Människor kan bidra med sina egna röster och meningar, vilket skapar en mer autentisk representation av mänskligt tal i olika kontexter.

  1. Samhällsengagemang: Projektet uppmuntrar aktivt deltagande från språkgemenskaper runt om i världen för att utveckla och förbättra databasen.

Tekniska detaljer

Common Voice-plattformen är byggd på öppen källkodsteknik och finns tillgänglig på GitHub. Den använder sig av moderna webbteknologier för att skapa en användarvänlig gränssnitt där människor kan donera sina röster och bidra till projektet.

Plattformen inkluderar funktioner som möjliggör inspelning, validering och kategorisering av röstdata. Detta säkerställer att de samlade datorna håller hög kvalitet och är lämpliga för träning av AI-modeller.

https://commonvoice.mozilla.org/sv-SE