icon bookmark-bicon bookmarkicon cameraicon checkicon chevron downicon chevron lefticon chevron righticon chevron upicon closeicon v-compressicon downloadicon editicon v-expandicon fbicon fileicon filtericon flag ruicon full chevron downicon full chevron lefticon full chevron righticon full chevron upicon gpicon insicon mailicon moveicon-musicicon mutedicon nomutedicon okicon v-pauseicon v-playicon searchicon shareicon sign inicon sign upicon stepbackicon stepforicon swipe downicon tagicon tagsicon tgicon trashicon twicon vkicon yt

Mozilla macht riesigen Datensatz menschlicher Stimmen verfügbar

Mozilla macht riesigen Datensatz menschlicher Stimmen verfügbar
Mozilla macht riesigen Datensatz menschlicher Stimmen verfügbar
Der Hersteller des Firefox-Browsers hat den größten Datensatz menschlicher Stimmen verfügbar gemacht, der komplett von Freiwilligen eingesprochen wurde. Mit dem Projekt "Common Voice" soll der weltweit vielfältigste Sprachdatensatz erstellt werden. Das Unternehmen Mozilla mit Sitz in San Francisco will damit vor allem kleineren Herstellern und Crowdfunding-Projekten ohne Lizenzgebühren ermöglichen, eigene Spracherkennungssysteme zu entwickeln.

Der Datensatz von Mozilla umfasst nach Angaben des Unternehmens 18 verschiedene Sprachen, darunter Englisch, Französisch, Deutsch und Mandarin, aber auch beispielsweise Walisisch und Kabyle, eine algerische Berbersprache. Der Datensatz summiert sich zu fast 1.400 Stunden aufgezeichneter Sprachdaten von mehr als 42.000 Mitwirkenden. Die von Mozilla eingesammelten Daten stehen unter der "CC0"-Lizenz zur Verfügung. Das ist die freizügigste Variante der Creative-Commons-Lizenzen. Die Projekt-Teilnehmer haben dabei freiwillig auch Metadaten wie Alter, Geschlecht und Akzent angegeben. "Damit werden gemeinsam mit ihren Aufzeichnungen weitere Informationen gespeichert, mit denen Sprach-Engines noch besser trainiert werden können", heißt es in dem Blog-Eintrag von Mozilla.

Mehr zum ThemaAufstand der Maschinen pünktlich zum Frühstück? Amazons "Alexa" verweigert europaweit Dienst

Bislang dominieren die großen Internetkonzerne wie Google, Microsoft, IBM, Amazon und Apple den Markt für Spracherkennung. Wichtiger Akteur ist außerdem das Unternehmen Nuance, dessen Technik hinter der Spracherkennung von Apples Siri steckt. (dpa)

Diese Webseite verwendet Cookies. Klicken Sie hier, um mehr zu erfahren

Cookies zulassen