MYNOTE.md 630 B

Whisper Official doc

https://platform.openai.com/docs/guides/speech-to-text/prompting

問題

語音轉文字,諧音字詞判斷錯誤

方法邏輯

  1. 用語意校正
  2. prompt
  3. gpt-4o (後處理)

  4. 用語音校正

  5. 發音越相近,編碼約相近。計算相似度距離

  6. 其他後處理

  7. 在jieba斷詞後以自定義字典抓出專有名詞。

  8. hard code校正幾個比較困難的詞

嘗試

  • 加上自定義字典(從knowledge graph提取出來的詞)做斷詞:沒有比較好,發現過度矯正的問題。output.txt 為jieba斷詞字典的結果,蠻正確的
  • 加上聲調:有改進