Mozilla veröffentlicht Common Voice Corpus 12.0
-
Sören Hentzschel -
24. Januar 2023 um 23:13 -
630 Mal gelesen -
0 Antworten
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 12.0 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mit dem vor kurzem veröffentlichten Common Voice Corpus 12.0 wächst der deutschsprachige Datensatz von 1.234 auf 1.283 Stunden an. Insgesamt deckt Mozilla Common Voice mit der neuen Version jetzt 104 Sprachen mit insgesamt 26.119 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht.
Zum Download der Mozilla Common Voice Datensätze
Der Beitrag Mozilla veröffentlicht Common Voice Corpus 12.0 erschien zuerst auf soeren-hentzschel.at.