Attualmente la quantità di dati è limitata e le risorse di addestramento sono insufficienti, il che comporta alcune sfide in termini di accuratezza.

Per migliorare l'accuratezza del sistema STT, stiamo attualmente cercando collaboratori per la raccolta e l'annotazione dei dati.

Vai al modulo di iscrizione

🎤 Riconoscimento vocale AI da file audio Taigi

Dopo aver caricato un file audio Taigi, l'AI eseguirà la trascrizione (STT) e fornirà 5 risultati suggeriti. Il testo visualizzato può anche essere riprodotto tramite sintesi vocale AI.

Puoi anche provare direttamente la versione di registrazione.

Carica file audio

WAV / MP3, massimo 3 MB

o lub

Clicca su "Avvia registrazione" e parla nel microfono. Quando hai finito, clicca su "Ferma".

FAQ

La precisione del riconoscimento è bassa?
Attualmente non ci sono abbastanza dati di addestramento. Se l'audio contiene rumore o è di bassa qualità, la precisione del riconoscimento potrebbe diminuire.
Ti consigliamo di caricare registrazioni audio chiare (con poco rumore).
Maggiore è la qualità dell'audio, migliori saranno i risultati del riconoscimento.
Al momento, fonti audio di alta qualità come programmi TV o video di YouTube producono risultati più stabili.

Se ti fermi troppo a lungo durante la registrazione, potrebbe esserci del rumore all'inizio del file audio, che può influire sulla precisione del riconoscimento. Inizia a parlare immediatamente dopo aver cliccato su "Avvia registrazione".
Qual è la differenza tra la versione di registrazione e quella di caricamento?
La versione di registrazione trasmette l'audio direttamente dal microfono del browser per il riconoscimento. La versione di caricamento è utile per elaborare in batch file audio esistenti (come WAV, MP3).
Cos'è il STT (Speech-to-Text)?
Il STT (Speech-to-Text, riconoscimento vocale) è una tecnologia AI che converte automaticamente i dati audio in testo.
Il sistema Taigi STT su questo sito riconosce il parlato Taigi e fornisce 5 opzioni di trascrizione.
Il testo trascritto può anche essere riprodotto tramite sintesi vocale AI.
Può essere utilizzato per l'apprendimento del Taigi, la creazione di sottotitoli e la redazione di documenti.
Stiamo lavorando continuamente per migliorare la precisione del riconoscimento.
La romanizzazione (Tailo) verrà visualizzata?
Il modello attuale non supporta ancora la visualizzazione della romanizzazione (Tailo).
Attualmente i risultati del riconoscimento mostrano solo caratteri Taigi.
Un nuovo modello è in fase di sviluppo per supportare la visualizzazione della romanizzazione in futuro.