+++
title = "什麼是 RAG, Retrieval-Augmented Generation"
date = "2024-09-05T00:39:46+02:00"
tags = ["ai","genai","llm"]
categories = ["ai"]
banner = "https://miro.medium.com/v2/resize:fit:1400/format:webp/0*20w5F7gcSYAGf-nf"
+++
在快節奏的人工智慧世界中,語言模型經歷了顯著的演變。從早期的簡單的基於規則的系統到我們今天看到的複雜的神經網絡,每一步都顯著擴展了人工智慧在語言方面的能力。這趟旅程的關鍵發展是檢索增強生成(RAG)的引入。
RAG 代表了傳統語言模型與創新的整合:它將資訊檢索直接整合到生成過程中。可以把它想像成一個人工智慧,可以在做出回應之前在文字庫中找到訊息,從而使其知識更豐富、上下文感知能力更強。此功能不僅僅是一項改進,而且是遊戲規則的改變者。它使模型能夠產生不僅準確而且深入了解相關現實世界資訊的回應。
什麼是檢索增強生成 (RAG)?
在傳統的語言模型中,反應僅根據訓練階段預先學習的模式和資訊產生。然而,這些模型本質上受到它們所訓練的數據的限制,通常會導致可能缺乏深度或特定知識的反應。 RAG 透過在生成過程中根據需要引入外部資料來解決此限制。它的工作原理如下:當進行查詢時,RAG 系統首先從大型資料集或知識庫中檢索相關信息,然後使用該信息來通知和指導響應的生成。
RAG架構
它是一個複雜的系統,旨在透過將大型語言模型與強大的檢索機制相結合來增強大型語言模型的功能。_它本質上是一個由兩部分組成的過程,涉及檢索器組件和生成器組件。_讓我們分解一下每個組件及其在整個流程中的角色:
圖片來源:https://snorkel.ai/which-is-better-retrieval-augmentation-rag-or-fine-tuning-both/
檢索器組件:
- 功能:檢索器的工作是尋找可以幫助回答查詢的相關文件或資訊。它接受輸入查詢並蒐索資料庫以檢索可能對產生回應有用的信息。
尋回犬的類型:
- 密集檢索器:它們使用基於神經網路的方法來創建文字的密集向量嵌入。當文本的含義比確切的措辭更重要時,它們往往會表現得更好,因為嵌入捕獲了語義相似性。
- 稀疏檢索器:它們依賴 TF-IDF 或 BM25 等術語匹配技術。它們擅長尋找具有精確關鍵字匹配的文檔,這在查詢包含唯一或罕見術語時特別有用。
發電機組件:
- 功能:生成器是產生最終文字輸出的語言模型。它採用輸入查詢和檢索器檢索到的上下文來產生連貫且相關的回應。
- 與檢索器的交互作用:生成器不是孤立工作的;它使用檢索器提供的上下文來通知其回應,確保輸出不僅合理,而且細節豐富且準確。
檢索增強生成 (RAG) 系統的工作流程
圖片來源:https://www.anyscale.com/blog/a-compressive-guide-for-building-rag-based-llm-applications-part-1
- 查詢處理:一切從查詢開始。這可以是問題、提示或您希望語言模型回應的任何輸入。
- 嵌入模型:然後將查詢傳遞到嵌入模型。該模型將查詢轉換為向量,這是系統可以理解和處理的數字表示形式。
- 向量資料庫 (DB) 檢索:查詢向量用於在向量資料庫中進行搜尋。此資料庫包含模型可用於產生回應的潛在上下文的預先計算向量。系統根據向量與查詢向量的匹配程度來檢索最相關的上下文。
- 檢索到的上下文:然後將檢索到的上下文傳遞到大型語言模型 (LLM)。這些上下文包含法學碩士用來產生知識豐富且準確的回應的資訊。
- LLM 回應產生: LLM 會考慮原始查詢和檢索到的上下文來產生全面且相關的回應。它綜合來自上下文的訊息,以確保回應不僅基於其預先存在的知識,而且還透過檢索到的資料中的特定細節進行增強。
- 最終回應:最後,法學碩士輸出回應,該回應現在由過程中檢索到的外部資料通知,使其更加準確和詳細。
選擇檢索器:密集檢索器和稀疏檢索器之間的選擇通常取決於資料庫的性質和預期查詢的類型。密集檢索器的計算量更大,但可以捕獲深層語義關係,而稀疏檢索器對於特定術語匹配更快、更好。
混合模型:一些 RAG 系統可能使用混合檢索器,結合密集和稀疏技術來平衡權衡並利用這兩種方法
RAG的應用:
檢索增強生成(RAG)在人工智慧領域的許多領域都有應用,顯著提高了語言模型產生的輸出的品質和相關性。
增強聊天機器人和對話代理:
- 客戶支援:配備 RAG 的聊天機器人可以檢索產品資訊、常見問題解答和支援文檔,以便對客戶的詢問提供詳細而準確的答案。
- 個人助理:虛擬個人助理使用 RAG 來提取即時數據,例如天氣資訊或新聞,使他們的互動更具上下文相關性和幫助性。
提高自動內容產生的準確性和深度:
- 內容創作:新聞人工智慧工具使用 RAG 來獲取相關事實和數據,從而產生富含最新資訊且需要較少人工編輯的文章。
- 文案寫作:行銷機器人利用 RAG 透過引用產品規格和評論資料庫來產生產品描述和廣告文案,這些描述和廣告文案不僅具有創意,而且事實上也是正確的。
在問答系統中的應用:
- 教育平台: RAG 用於教育技術,透過從教育資料庫檢索信息,為學生提供複雜主題的詳細解釋和附加背景。
- 研究:人工智慧系統透過引用大量學術論文並產生相關研究摘要,幫助研究人員找到科學問題的答案。
在各領域使用RAG的好處:
- 醫療保健: RAG 驅動的系統可以透過從醫學期刊和患者記錄中提取資訊來幫助醫療專業人員,以根據最新研究提出診斷或治療建議。
- 客戶服務:透過檢索公司政策和客戶歷史記錄,RAG 允許服務代理提供個人化且準確的建議,從而提高客戶滿意度。
- 教育:教師可以利用基於 RAG 的工具來創建客製化的課程計畫和學習材料,這些計畫和學習材料借鑒了廣泛的教育內容,為學生提供了不同的視角。
其他應用:
- 法律援助: RAG系統可以透過取得相關判例法和法規來協助法律研究,以協助起草法律文件或準備案件。
- 翻譯服務:將 RAG 與翻譯模型結合,透過引用雙語文本語料庫來提供上下文感知翻譯,考慮文化細微差別和慣用表達。
在這些應用程式中使用 RAG 不僅可以根據靜態知識庫產生輸出,還可以透過最相關和最新的可用資料動態獲取輸出,從而產生更精確、資訊豐富且值得信賴的 AI 生成內容。
實施 RAG 的挑戰:
- 複雜性:檢索和生成過程的結合增加了模型架構的複雜性,使得開發和維護更具挑戰性。
- 可擴展性:有效管理和搜尋大型資料庫很困難,尤其是隨著文件大小和數量的增長。
- 延遲:檢索過程可能會引入延遲,影響系統的回應時間,這對於需要即時互動的應用程式(例如會話代理)至關重要。
- 同步:使檢索資料庫保持最新資訊需要一個同步機制,該機制可以在不降低效能的情況下處理不斷的更新。
目前 RAG 模型的局限性:
- 情境限制:當產生回應所需的上下文超出模型輸入視窗的大小限制時,RAG 模型可能會遇到困難。
- 檢索錯誤:產生的回應的品質在很大程度上取決於檢索步驟的品質;如果檢索到不相關的訊息,這一代人將遭受損失。
- 偏差: RAG 模型可能會無意中傳播甚至放大它們檢索資訊的資料來源中存在的偏差。
潛在的改進領域:
- 更好的整合:檢索和產生組件的更平滑整合可以提高模型處理複雜查詢的能力。
- 增強的檢索演算法:更複雜的檢索演算法可以提供更準確和相關的上下文,從而提高生成內容的整體品質。
- 自適應學習:結合允許模型從檢索成功和失敗中學習的機制可以隨著時間的推移完善系統。
資料依賴性和檢索來源:
- 資料品質: RAG 系統的有效性與檢索資料庫中資料的品質直接相關。品質差或過時的資訊可能會導致不正確的輸出。
- 來源可靠性:確保資訊來源可靠且權威至關重要,特別是對於醫療保健和教育等應用程式。
- 隱私和安全:在處理個人資料或專有內容等敏感資訊時,資料隱私和安全受到嚴重關注。
新興趨勢和正在進行的研究:
- 跨模態檢索:擴展 RAG 功能,不僅可以檢索文字訊息,還可以檢索影像和視訊等其他模態的數據,從而實現更豐富的多模態響應。
- 持續學習:開發從每次互動中學習的 RAG 系統,從而隨著時間的推移提高其檢索和生成能力,而無需重新訓練。
- 互動式檢索:增強檢索過程的互動性,讓生成器詢問更多資訊或澄清,就像人類在對話中一樣。
- 領域適應:針對特定領域(例如法律或醫學)客製化 RAG 模型,以提高資訊檢索的相關性和準確性。
未來潛在的增強功能:
- 個人化:整合使用者個人資料和歷史互動以個人化回應,使 RAG 模型在客戶服務和推薦系統中更加有效。
- 知識基礎:使用外部知識庫不僅用於檢索,還用於將回應基於可驗證的事實,這對於教育和資訊應用至關重要。
- 高效索引:採用更有效率的資料結構和演算法對資料庫進行索引,以加快檢索速度並降低計算成本。