## Whisper Official doc https://platform.openai.com/docs/guides/speech-to-text/prompting ## 問題 語音轉文字,諧音字詞判斷錯誤 ## 方法邏輯 1. 用語意校正 - prompt - gpt-4o (後處理) 2. 用語音校正 - 發音越相近,編碼約相近。計算相似度距離 3. 其他後處理 - 在jieba斷詞後以自定義字典抓出專有名詞。 - hard code校正幾個比較困難的詞 ## 嘗試 - 加上自定義字典(從knowledge graph提取出來的詞)做斷詞:沒有比較好,發現過度矯正的問題。output.txt 為jieba斷詞字典的結果,蠻正確的 - 加上聲調:有改進