Voce comună

voce comună

Tip de set de date vocale [d] șicrowdsourcing
Dezvoltator Fundația Mozilla
Limbi de interfață Multilingv ( lista de limbi )
Prima editie 19 iunie 2017  ( 19-06-2017 )
Licență Creative Commons CC0
Site-ul web commonvoice.mozilla.org
 Fișiere media la Wikimedia Commons

Common Voice  este un proiect crowdsource lansat de Mozilla pentru a crea o bază de date gratuită pentru software-ul de recunoaștere a vorbirii . Proiectul este susținut de voluntari care înregistrează exemple de propoziții cu un microfon și ascultă înregistrările altor utilizatori. Propozițiile transcrise vor fi compilate într- o bază de date de voturi disponibilă sub licența de domeniu public CC0 . Această licență asigură că dezvoltatorii pot folosi această bază de date pentru aplicații de voce fără restricții sau costuri.

Common Voice a apărut ca răspuns la asistenții vocali ai marilor companii precum Amazon Echo , Siri sau Google Assistant .

Baza de date vocală

Baza de date English Common Voice este a doua cea mai mare bază de date vocală disponibilă gratuit după LibriSpeech. Până la data publicării primelor date, pe 29 noiembrie 2017, peste 20.000 de utilizatori din întreaga lume înregistraseră 400.000 de propuneri confirmate, cu o durată totală de 500 de ore. [unu]

În februarie 2019, a fost lansat primul lot de limbi. Include 18 limbi: engleză , franceză , germană și chineză mandarină , dar și limbi mai puțin obișnuite, cum ar fi galeza și kabila . În total, a inclus aproape 1.400 de ore de date vocale înregistrate de la peste 42.000 de colaboratori. [2]

Note

  1. Anunțând lansarea inițială a modelului Mozilla de recunoaștere a vorbirii cu sursă deschisă și a setului de date vocale . blogul mozilla.org (29 noiembrie 2017). Consultat la 14 februarie 2020. Arhivat din original la 29 noiembrie 2017.
  2. Mozilla actualizează setul de date Common Voice cu 1.400 de ore de vorbire în 18 limbi . Venture Beat (28 februarie 2019). Preluat la 14 februarie 2020. Arhivat din original la 4 martie 2019.