Mozilla veröffentlicht Common Voice Corpus 7.0
-
Sören Hentzschel -
3. August 2021 um 21:27 -
741 Mal gelesen -
0 Antworten
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Nun hat Mozilla Version 7.0 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Erst im April dieses Jahres hatten Mozilla und Nvidia eine Partnerschaft bekannt gegeben, in deren Rahmen auch eine Investition seitens Nvidia in Höhe von 1,5 Millionen Dollar in Common Voice angekündigt worden ist.
Mit dem nun veröffentlichten Common Voice Corpus 7.0 umfasst die Menge der aufgenommenen Sprachdaten nun knapp 14.000 Stunden gegenüber den noch etwas mehr als 9.000 Stunden in Version 6.1. Mit 16 zusätzlichen Sprachen deckt Mozilla Common Voice jetzt außerdem 76 Sprachen ab.
Zum Download der Mozilla Common Voice Datensätze
Der Beitrag Mozilla veröffentlicht Common Voice Corpus 7.0 erschien zuerst auf soeren-hentzschel.at.