Mozilla gibt Sprachdatensammlung frei
-
-
Hier der offizielle Artikel dazu:
https://blog.mozilla.org/press-de/2019/…prachdatensatz/Zunächst einmal: Was Mozilla mit Common Voice geschafft hat, ist einzigartig. Das ist der weltweit größte Sprachdatensatz, der komplett frei nutzbar ist. Bislang ist Spracherkennung ja komplett in den Händen der ganz Großen: Amazon, Google, Apple und Microsoft. Echte Open Source-Alternativen werden durch Mozillas Einsatz überhaupt erst möglich. Und wir können wohl alle erahnen, welche Rolle Spracherkennung in der Zukunft noch spielen wird. Darum halte ich das auch für das derzeit wichtigste Projekt von Mozilla neben Firefox.
Aber auch Mozilla DeepSpeech macht sich:
ZitatBereits heute ist DeepSpeech dank der Daten aus dem Projekt Common Voice und aus anderen Quellen dazu in der Lage, Sprache mit menschlicher Genauigkeit und in Echtzeit in Text zu konvertieren – und zwar noch während der Ton gestreamt wird. Dies ermöglicht die Transkription von Vorträgen, Telefonaten, Fernsehsendungen, Radiosendungen und anderen Livestreams, während sie stattfinden.
Die DeepSpeech-Engine wird aktuell auch bereits von einigen anderen Organisationen eingesetzt: Etwa im Projekt Mycroft, einem sprachbasierten Open-Source-Assistenten. Oder im Rahmen des Projekts Leon, einem persönlichen Assistenten, der auf Open-Source basiert. Oder auch in FusionPBX, einem Telefonvermittlungssystem, das Telefonnachrichten für ein privates Unternehmen transkribiert. Zukünftig soll Deep Speech auch in kleineren Geräten wie Smartphones und In-Car-Systemen eingesetzt werden und so Produktinnovationen innerhalb und außerhalb von Mozilla vorantreiben.