현재 데이터 양이 부족하고 학습 리소스가 제한적이므로 정확도에 일정한 한계가 있습니다.

STT 시스템의 정확도를 높이기 위해 현재 데이터 수집 및 주석 작업에 협력자를 모집하고 있습니다.

협력 신청서로 이동

🎤 Taigi AI 오디오 파일 음성 인식

Taigi 오디오 파일을 업로드하면 AI가 전사(STT)를 수행하고 5개의 추천 결과를 제공합니다. 표시된 텍스트는 AI 음성 합성을 통해 재생할 수도 있습니다.

녹음 버전도 직접 체험할 수 있습니다.

오디오 파일 업로드

WAV / MP3 등, 최대 3MB

또는

녹음 시작' 버튼을 클릭한 후 마이크에 대고 말해 주세요. 끝나면 '정지' 버튼을 클릭해 주세요.

FAQ

인식 정확도가 낮은가요?
현재 학습 데이터가 충분하지 않습니다. 오디오에 잡음이 많거나 음질이 나쁘면 인식 정확도가 떨어질 수 있습니다.
잡음이 적고 깨끗한 오디오를 업로드해 주세요.
음질이 좋을수록 인식 결과도 더 좋아집니다.
현재는 TV 프로그램이나 YouTube 동영상처럼 상대적으로 고품질 음원을 사용하는 것이 더 안정적인 결과를 얻을 수 있습니다.

녹음 중 중간에 너무 오래 멈추면 오디오 시작 부분에 잡음이 발생하여 인식 정확도에 영향을 줄 수 있습니다. '녹음 시작' 버튼을 누른 후 바로 말해 주세요.
녹음 버전과 업로드 버전의 차이는 무엇인가요?
녹음 버전은 브라우저의 마이크를 통해 직접 오디오를 전송하여 인식합니다. 업로드 버전은 기존 오디오 파일(WAV, MP3 등)을 일괄 처리할 때 유용합니다.
STT(Speech-to-Text)란 무엇인가요?
STT(Speech-to-Text, 음성 인식)는 오디오 데이터를 자동으로 텍스트로 변환하는 AI 기술입니다.
이 사이트의 Taigi STT 시스템은 Taigi 음성을 인식하고 5가지 전사 후보 결과를 제공합니다.
전사된 텍스트는 AI 음성으로 바로 재생할 수도 있습니다.
Taigi 학습, 자막 제작, 자료 정리에 활용할 수 있습니다.
저희는 인식 정확도를 지속적으로 개선하고 있습니다.
로마자(Tailo)는 표시되나요?
현재 모델은 로마자(Tailo) 표시를 지원하지 않습니다.
현재 인식 결과는 Taigi 한자만 표시됩니다.
새로운 모델을 개발 중이며, 향후 로마자 표시 기능도 지원할 예정입니다.