Taigi SST Voice 2

Actualmente, la cantidad de datos es limitada y los recursos de entrenamiento son insuficientes, por lo que existen algunos desafíos en la precisión.

Para mejorar la precisión del sistema SST, actualmente estamos buscando colaboradores para la recopilación y anotación de datos.

Ir al formulario de solicitud de colaboración

Después de subir un archivo de audio de Taigi, la IA realizará la transcripción (SST) y proporcionará 5 resultados sugeridos. El texto mostrado también puede reproducirse mediante síntesis de voz con IA.

También puede probar directamente la versión de grabación.

Record Your Voice

Haga clic en el botón "Iniciar grabación" y hable al micrófono. Cuando termine, haga clic en el botón "Detener".

FAQ

¿La precisión del reconocimiento es baja?
Actualmente no hay suficientes datos de entrenamiento. Si el audio contiene ruido o tiene mala calidad, la precisión del reconocimiento puede disminuir.<br>Por favor, suba grabaciones de audio claras (con poco ruido).<br>A mayor calidad del audio, mejores serán los resultados del reconocimiento.<br>Actualmente, las fuentes de audio de alta calidad, como programas de televisión o videos de YouTube, tienden a producir resultados más estables.<br>
Si se pausa demasiado tiempo durante la grabación, pueden generarse ruidos al inicio del audio, lo que puede afectar la precisión del reconocimiento. Por favor, comience a hablar inmediatamente después de presionar el botón "Iniciar grabación".
¿Cuál es la diferencia entre la versión de grabación y la versión de subida?
La versión de grabación transmite el audio directamente desde el micrófono de su navegador para su reconocimiento. La versión de subida es útil para procesar por lotes archivos de audio existentes (como WAV, MP3).
¿Qué es SST (Speech-to-Text)?
SST (Speech-to-Text, reconocimiento de voz) es una tecnología de IA que convierte automáticamente datos de audio en texto.<br>El sistema SST de Taigi en este sitio web reconoce el habla en Taigi y proporciona 5 opciones de transcripción.<br>El texto transcrito también se puede reproducir mediante síntesis de voz con IA.<br>Se puede utilizar para el aprendizaje del Taigi, la creación de subtítulos y la preparación de documentos.<br>Estamos trabajando continuamente para mejorar la precisión del reconocimiento.<br>
¿Se mostrará la romanización (Tailo)?
El modelo actual aún no admite la visualización de la romanización (Tailo).<br>Actualmente, los resultados de reconocimiento solo muestran caracteres en Taigi.<br>Estamos desarrollando un nuevo modelo que permitirá mostrar la romanización en el futuro.<br>