Taigi SST Voice

현재 데이터 양이 부족하고 학습 리소스가 제한적이므로 정확도에 일정한 한계가 있습니다.

SST 시스템의 정확도를 높이기 위해 현재 데이터 수집 및 주석 작업에 협력자를 모집하고 있습니다.

협력 신청서로 이동

Taigi 오디오 파일을 업로드하면 AI가 전사(SST)를 수행하고 5개의 추천 결과를 제공합니다. 표시된 텍스트는 AI 음성 합성을 통해 재생할 수도 있습니다.

녹음 버전도 직접 체험할 수 있습니다.

오디오 파일 업로드

WAV / MP3 등, 최대 3MB

FAQ

인식 정확도가 낮은가요?
현재 학습 데이터가 충분하지 않습니다. 오디오에 잡음이 많거나 음질이 나쁘면 인식 정확도가 떨어질 수 있습니다.<br>잡음이 적고 깨끗한 오디오를 업로드해 주세요.<br>음질이 좋을수록 인식 결과도 더 좋아집니다.<br>현재는 TV 프로그램이나 YouTube 동영상처럼 상대적으로 고품질 음원을 사용하는 것이 더 안정적인 결과를 얻을 수 있습니다.<br>
녹음 버전과 업로드 버전의 차이는 무엇인가요?
녹음 버전은 브라우저의 마이크를 통해 직접 오디오를 전송하여 인식합니다. 업로드 버전은 기존 오디오 파일(WAV, MP3 등)을 일괄 처리할 때 유용합니다.
SST(Speech-to-Text)란 무엇인가요?
SST(Speech-to-Text, 음성 인식)는 오디오 데이터를 자동으로 텍스트로 변환하는 AI 기술입니다.<br>이 사이트의 Taigi SST 시스템은 Taigi 음성을 인식하고 5가지 전사 후보 결과를 제공합니다.<br>전사된 텍스트는 AI 음성으로 바로 재생할 수도 있습니다.<br>Taigi 학습, 자막 제작, 자료 정리에 활용할 수 있습니다.<br>저희는 인식 정확도를 지속적으로 개선하고 있습니다.<br>
로마자(Tailo)는 표시되나요?
현재 모델은 로마자(Tailo) 표시를 지원하지 않습니다.<br>현재 인식 결과는 Taigi 한자만 표시됩니다.<br>새로운 모델을 개발 중이며, 향후 로마자 표시 기능도 지원할 예정입니다.<br>