domenica 23 luglio 2017

Project Common Voice, Mozilla lancia il riconoscimento vocale open source

lastampa.it
carlo lavalle

Il progetto punta a raccogliere almeno 10 mila ore di voci registrate in vari accenti per rendere la tecnologia di riconoscimento vocale accessibile e tutti



Mozilla lancia Project Common Voice, un’iniziativa per registrare in crowdsourcing la voce del maggior numero possibile di utenti. L’obiettivo è sviluppare un sistema aperto e accessibile a ogni sviluppatore per consentire a tutti di realizzare app basate sulla tecnologia di riconoscimento vocale.
La voce è diventata un mezzo attraverso il quale sempre più si interagisce con computer e dispositivi. Apple Amazon, Microsoft, Google, hanno ad esempio integrato la tecnologia di speech recognition in cellulari e gadget realizzando assistenti vocali come Siri, Alexa, Cortana e Google Assistant. Molti pensano che controllo e interazione via voce siano componenti chiave di una tendenza destinata ancora di più a prevalere in futuro.

Ma, secondo Mozilla Foundation, la fondazione che sviluppa il browser Firefox, il settore è dominato da una concezione chiusa e proprietaria. Che potrebbe impedire a start-up e nuovi soggetti di beneficiare di questa tecnologia creando un fossato insormontabile con un nucleo ristretto di grandi società già presenti sul mercato.

Per questo è nato Project Common Voice, che richiede agli utenti web di contribuire al progetto registrando la propria voce. Un’operazione semplice da eseguire. Basta, infatti, andare sul sito, premere un pulsante e leggere la frase (in inglese) messa in evidenza al centro della pagina web. Una volta registrato l’audio è possibile anche riascoltare quanto letto e, eventualmente, cancellare ed effettuare di nuovo la registrazione. Che, una volta inviata, ricade sotto la licenza Creative Commons CC-0.

Al momento, la base minima per poter rendere funzionante il database, che verrà messo a disposizione di tutti in modo gratuito, sono almeno 10mila ore di audio di voci registrate in vari accenti. Gli sviluppatori saranno così in grado di realizzare le loro applicazioni, dagli assistenti digitali ai traduttori in tempo reale, sostiene Mozilla, che conta di rendere accessibile la sua collezione vocale entro la fine dell’anno.