text_processing.py 1.7 KB

12345678910111213141516171819202122232425262728293031
  1. def remove_unwanted_content(answer):
  2. ## 可以試試用prompt排除
  3. unwanted_phrases = [
  4. "<<SYS>> 你是一個來自台灣的AI助理,名字叫TAIDE,樂於用繁體中文幫助使用者,會根據問題提供相關答案。> <</SYS>>",
  5. "TAIDE 敬上",
  6. "你是一個來自台灣的AI助理,我的名字是 TAIDE,我很高興用繁體中文幫助您!請告訴我如何才能為您服務呢?",
  7. "此處無需提供文件或上下文,因為已經在先前的回應中提及過。若真有需要,可再次詢問相關內容。",
  8. "If you have any further questions or need additional assistance, please do not hesitate to contact us. Thank you!",
  9. "我在這裡可以告訴你",
  10. "根據提供的資訊,",
  11. "根據您的問題,",
  12. "請注意,以上資訊僅供參考。",
  13. "如果您還有其他問題,請隨時問我。",
  14. "希望這個資訊對您有幫助。",
  15. "很高興能為您解答這個問題。",
  16. "這些信息是根據我所知道的最新資料提供的。",
  17. "如果您需要更詳細的資訊,建議您查看官方網站或直接聯繫相關單位。",
  18. "我很抱歉,作為AI助理,我無法知道您所提及的特定文件或上下文。",
  19. "若無法自行判斷,請將問題寄送至test@email.com,我們將很樂意進一步協助您。",
  20. "若您還有其他疑問,歡迎將問題寄至test@email.com以便獲得進一步協助。"
  21. "[/INST]",
  22. "[/ANS]"
  23. ]
  24. for phrase in unwanted_phrases:
  25. answer = answer.replace(phrase, "")
  26. answer = answer.strip()
  27. answer = '\n'.join(line for line in answer.splitlines() if line.strip())
  28. return answer