2023年11月19日

AI幫你聽聲辨字

視障者都曉得利用 OCR 光學字元辨識的功能可以將圖像裡的文字轉換為可供電腦編輯的文字,如此便能夠以 NVDA 讀出原本無法閱讀內含文字資訊的圖片/照片或圖片型式的 PDF 檔案,同樣的道理能不能將內含說話聲音的影片或聲音檔案也經過辨識轉換為文字呢?