目前資料量較少,學習資源有限,精準度尚有一定挑戰。

為提升 STT 系統之精準度,這馬佇咧徵求資料收集佮標註協力者

前往協力申請表單

🎤 台語 AI 語音辨識

上傳台語音訊後,AI 將執行文字轉寫(STT),並提供 5 個建議結果。顯示之文字嘛會用直接播放朗讀。

嘛會用直接錄音試用

上傳音訊檔案

WAV / MP3 等,最大 3 MB

請揤「開始錄音」按鈕,對mài-khuh講話。結束了後請揤「停止」按鈕。

FAQ

辨識精準度敢會無好?
目前猶無夠額的學習資料,若音訊有雜音抑是音質無好,辨識準確率可能會降低。
請盡量上傳清楚的音訊(雜音較少的錄音)。
音質越好的音訊,辨識結果會越好。
目前較適合使用電視節目、YouTube 影片等相對高品質的音源,辨識結果會較為穩定。

若錄音時中央扽蹬較久,音訊開頭較會產生雜音,影響辨識精準度,請揤開始錄音了後馬上開始講話。
錄音版佮上傳版有啥物無仝?
錄音版會直接透過瀏覽器的mài-khuh傳送音訊並進行辨識。上傳版適合用佇phue仔分析現有的音訊檔案(例如:WAV、MP3)。
STT(Speech-to-Text)是啥物?
STT(Speech-to-Text,語音辨識)是一種會通共語音資料自動轉換為文字的 AI 技術。
本網站的台語 STT 系統會用辨識台語語音,並提供 5 種轉寫候選結果。
轉寫後的結果嘛會用直接以 AI 語音播放。
可應用佇台語學習、字幕製作、資料整理等場景。
阮將繼續拍拚提升辨識精準度。
羅馬字(臺羅)敢會顯示?
目前的模型猶未支援羅馬字(臺羅)顯示。
目前的辨識結果只會顯示台語漢字。
新模型佇咧開發中,未來嘛將提供羅馬字顯示功能。