Taigi SST Voice

Derzeit ist die Datenmenge begrenzt und die Trainingsressourcen sind unzureichend, was zu Herausforderungen bei der Genauigkeit führt.

Zur Verbesserung der Genauigkeit des SST-Systems suchen wir derzeit Mitwirkende für die Datensammlung und -annotation.

Zum Mitwirkenden-Formular

Nach dem Hochladen einer Taigi-Audiodatei führt die KI die Transkription (SST) durch und liefert 5 empfohlene Ergebnisse. Der angezeigte Text kann auch per KI-Sprachsynthese wiedergegeben werden.

Sie können auch direkt die Aufnahmeversion ausprobieren.

Audiodatei hochladen

WAV / MP3, maximal 3 MB

FAQ

Ist die Erkennungsgenauigkeit schlecht?
Derzeit sind nicht genügend Trainingsdaten vorhanden. Wenn das Audio Rauschen enthält oder von schlechter Qualität ist, kann die Erkennungsgenauigkeit beeinträchtigt werden.<br>Bitte laden Sie klare Audioaufnahmen hoch (mit wenig Rauschen).<br>Je besser die Audioqualität, desto besser die Erkennungsergebnisse.<br>Derzeit liefern hochwertige Audioquellen wie Fernsehsendungen oder YouTube-Videos stabilere Ergebnisse.<br>
Was ist der Unterschied zwischen der Aufnahme- und der Upload-Version?
Die Aufnahmeversion überträgt Audio direkt vom Mikrofon des Browsers zur Erkennung. Die Upload-Version eignet sich für die Stapelverarbeitung vorhandener Audiodateien (z. B. WAV, MP3).
Was ist SST (Speech-to-Text)?
SST (Speech-to-Text, Spracherkennung) ist eine KI-Technologie, die Audiodaten automatisch in Text umwandelt.<br>Das Taigi SST-System auf dieser Website erkennt Taigi-Sprache und bietet 5 Transkriptionsoptionen.<br>Der transkribierte Text kann auch per KI-Sprachsynthese wiedergegeben werden.<br>Es kann für das Erlernen von Taigi, das Erstellen von Untertiteln und die Dokumentenerstellung verwendet werden.<br>Wir arbeiten kontinuierlich daran, die Erkennungsgenauigkeit zu verbessern.<br>
Wird die Romanisierung (Tailo) angezeigt?
Das aktuelle Modell unterstützt die Anzeige der Romanisierung (Tailo) noch nicht.<br>Derzeit werden in den Erkennungsergebnissen nur Taigi-Zeichen angezeigt.<br>Ein neues Modell wird entwickelt, um künftig die Romanisierung anzuzeigen.<br>