📌 - YouTube
Original URL: https://www.youtube.com/watch?v=qMc0v2OUK3s
📌 - YouTube
⓵ ã€å®¹æ˜“懂 Easy Know】
想åƒä¸€ä¸‹ï¼Œä½ æœ‰ä¸€æœ¬å¾ˆå¤§å¾ˆå¤§çš„æ›¸ï¼Œè£¡é¢æœ‰å¾ˆå¤šå¾ˆå¤šæ•…äº‹ã€‚ä½ å•ä¸€å€‹å¾ˆè°æ˜Žçš„æœ‹å‹ä¸€å€‹é—œæ–¼æ›¸è£¡æŸå€‹æ•…事的å•é¡Œï¼Œä½†ä½ åªçµ¦ä»–çœ‹äº†æ•´æœ¬æ›¸ã€‚çµæžœæœ‹å‹æ‰¾ä¸åˆ°é‚£å€‹æ•…事在哪裡,就開始亂猜亂講,雖然è½èµ·ä¾†å¾ˆçœŸï¼Œä½†å…¶å¯¦æ ¹æœ¬æ˜¯éŒ¯çš„。這就åƒAI有時候會亂說話一樣。
RAGé€™å€‹æ–¹æ³•å‘¢ï¼Œå°±åƒæ˜¯ä½ è®Šè°æ˜Žäº†ï¼ä½ åœ¨å•æœ‹å‹å•題之å‰ï¼Œå…ˆç”¨ä¸€å€‹ç‰¹åˆ¥çš„工具,把這本大書裡所有å¯èƒ½å’Œä½ çš„å•題有關的å°ç‰‡æ®µéƒ½æ‰¾å‡ºä¾†ã€‚ç„¶å¾Œï¼Œä½ åªæŠŠé€™äº›æ‰¾åˆ°çš„å°ç‰‡æ®µæ‹¿çµ¦ä½ çš„è°æ˜Žæœ‹å‹çœ‹ï¼Œå†å•ä»–å•題。這樣一來,朋å‹å°±æ›´å®¹æ˜“在這些相關的å°ç‰‡æ®µè£¡æ‰¾åˆ°æ£ç¢ºç”æ¡ˆï¼Œä¸æœƒå†äº‚猜了。這個特別的工具就是把文å—變æˆä¸€ç¨®åƒåœ°åœ–上的點一樣的æ±è¥¿ï¼Œæ„æ€ç›¸ä¼¼çš„æ–‡å—會在地圖上é 得很近,這樣就能快速找到相關的內容囉ï¼
----------
â“¶ ã€ç¸½çµ Overall Summary】
é€™æ®µå½±ç‰‡æ·±å…¥æŽ¢è¨Žäº†å¤§åž‹èªžè¨€æ¨¡åž‹åœ¨è™•ç†æœªæ›¾è¦‹éŽæˆ–篇幅é¾å¤§çš„內部文件時容易產生「幻覺ã€çš„å•é¡Œï¼Œå³æ¨¡åž‹æœƒè‡ªä¿¡åœ°çµ¦å‡ºçœ‹ä¼¼åˆç†ä½†å¯¦éš›ä¸Šèˆ‡æ–‡ä»¶å…§å®¹ç„¡é—œçš„éŒ¯èª¤ç”æ¡ˆã€‚為了解決這個å•題,影片介紹了「檢索增強生æˆã€ï¼ˆRetrieval Augmented Generation, RAG)這種架構。
RAG çš„æ ¸å¿ƒæ€æƒ³æ˜¯ï¼Œåœ¨å°‡å•題æäº¤çµ¦å¤§åž‹èªžè¨€æ¨¡åž‹ä¹‹å‰ï¼Œå…ˆå¾žåŽŸå§‹æ–‡ä»¶ä¸æª¢ç´¢å‡ºèˆ‡å•題高度相關的內容,然後將這些相關內容作為é¡å¤–的上下文資訊一åŒç™¼é€çµ¦æ¨¡åž‹ã€‚這樣åšå¯ä»¥å¤§å¹…減少模型產生幻覺的風險。
å¯¦ç¾ RAG 架構需è¦å¹¾å€‹é—œéµæ¥é©Ÿå’Œçµ„件。首先是將原始長文件切分æˆè¼ƒå°çš„æ–‡æœ¬ã€Œå¡Šã€ï¼ˆChunking)。接著,使用一種稱為「嵌入模型ã€ï¼ˆEmbedding modelï¼‰çš„ç‰¹æ®Šæ¨¡åž‹ï¼Œå°‡é€™äº›æ–‡æœ¬å¡Šè½‰æ›æˆå›ºå®šé•·åº¦çš„æ•¸å—陣列或稱為å‘é‡ã€‚這些å‘é‡ä¿ç•™äº†åŽŸå§‹æ–‡æœ¬çš„èªžç¾©ä¿¡æ¯ï¼Œä¸”èªžç¾©ç›¸ä¼¼çš„æ–‡æœ¬æœƒè¢«è½‰æ›æˆåœ¨å¤šç¶ç©ºé–“ä¸å½¼æ¤é è¿‘çš„å‘é‡ã€‚這些文本å‘é‡èˆ‡å…¶å°æ‡‰çš„原始文本塊,通常會儲å˜åœ¨ä¸€ç¨®å°ˆé–€è¨è¨ˆç”¨æ–¼é«˜æ•ˆæœå°‹å‘é‡ä¹‹é–“相似度的「å‘é‡è³‡æ–™åº«ã€ï¼ˆVector Database)ä¸ã€‚
當使用者æå‡ºå•é¡Œæ™‚ï¼ŒåŒæ¨£å…ˆä½¿ç”¨åµŒå…¥æ¨¡åž‹å°‡å•題轉æ›ç‚ºå‘é‡ã€‚然後,利用å‘é‡è³‡æ–™åº«å°‹æ‰¾èˆ‡å•題å‘é‡è·é›¢æœ€è¿‘的文本塊å‘é‡ï¼Œå–å‡ºå…¶å°æ‡‰çš„原始文本塊。最後,將這些檢索到的相關文本塊與使用者å•é¡Œä¸€ä½µè¼¸å…¥å¤§åž‹èªžè¨€æ¨¡åž‹ï¼Œç”±æ¨¡åž‹æ ¹æ“šé€™äº›ä¸Šä¸‹æ–‡ç”Ÿæˆç”案。
然而,影片也指出 RAG 並éžå®Œç¾Žç„¡ç¼ºã€‚å…¶ä¸»è¦æŒ‘æˆ°åŒ…æ‹¬ï¼šæ–‡ä»¶åˆ‡å¡Šçš„å›°é›£æ€§ï¼Œå°¤å…¶æ˜¯åœ¨è¤‡é›œçµæ§‹çš„æ–‡ç« ä¸ï¼Œå¯èƒ½å°Žè‡´é—œéµä¸Šä¸‹æ–‡è¢«åˆ‡æ–·æˆ–é—œè¯æ€§å–ªå¤±ï¼›ä»¥åŠ RAG 缺ä¹å°æ–‡ä»¶çš„æ•´é«”è¦–è§’ï¼Œå°æ–¼éœ€è¦å…¨å±€ç†è§£è€Œéžç‰¹å®šç‰‡æ®µçš„å•é¡Œï¼ˆä¾‹å¦‚çµ±è¨ˆæ–‡ä»¶ä¸æŸå€‹è©žå‡ºç¾çš„æ¬¡æ•¸ï¼‰ï¼ŒRAG 的效果ä¸ä½³ã€‚影片èªç‚º RAG åœ¨ç¾æœ‰å¤§åž‹æ¨¡åž‹ä¸Šä¸‹æ–‡çª—å£é™åˆ¶ä¸‹æ˜¯ä¸€ç¨®æ¬Šè¡¡å’Œå¦¥å”,並期待未來能出ç¾è¶…è¶Š RAG 的新一代架構。
----------
â“· ã€è§€é»ž Viewpoints】
å¤§åž‹èªžè¨€æ¨¡åž‹åœ¨è™•ç†æœªè¦‹éŽæˆ–éŽé•·çš„特定文件時,容易出ç¾ã€Œå¹»è¦ºã€ï¼Œå³ç”¢ç”Ÿè½èµ·ä¾†åˆç†ä½†å¯¦éš›éŒ¯èª¤çš„回ç”。
RAG(檢索增強生æˆï¼‰æ˜¯ä¸€ç¨®è§£æ±ºæ¨¡åž‹å¹»è¦ºå•é¡Œçš„æž¶æ§‹ï¼Œå…¶æ ¸å¿ƒæ˜¯å…ˆæ‰¾åˆ°ç›¸é—œè³‡è¨Šå†è®“模型生æˆã€‚
RAG çš„é‹ä½œåŒ…å«å°‡æ–‡ä»¶ã€Œåˆ‡å¡Šã€(Chunking)ã€ä½¿ç”¨ã€ŒåµŒå…¥æ¨¡åž‹ã€(Embedding model) 將文本轉為å‘é‡ã€å°‡å‘é‡å„²å˜åˆ°ã€Œå‘é‡è³‡æ–™åº«ã€(Vector Database)ï¼Œä»¥åŠæ ¹æ“šå•題å‘é‡å¾žè³‡æ–™åº«æª¢ç´¢æœ€ç›¸ä¼¼çš„æ–‡æœ¬å¡Šã€‚
嵌入模型將文本壓縮æˆå›ºå®šé•·åº¦çš„å‘é‡ï¼Œèªžç¾©ç›¸ä¼¼çš„æ–‡æœ¬æœƒè¢«è½‰æ›æˆè·é›¢è¼ƒè¿‘çš„å‘é‡ï¼Œé€™å¯ç”¨æ–¼è¡¡é‡æ–‡æœ¬ä¹‹é–“的相關性。
å‘é‡è³‡æ–™åº«å°ˆé–€ç”¨æ–¼å„²å˜å’Œæœå°‹å‘é‡ï¼Œèƒ½é«˜æ•ˆæ‰¾å‡ºèˆ‡æŸ¥è©¢å‘釿œ€ç›¸ä¼¼çš„æ•¸æ“šï¼Œæ˜¯å¯¦ç¾ RAG 檢索功能的關éµã€‚
æ–‡ä»¶ã€Œåˆ‡å¡Šã€æ˜¯ RAG 的必è¦å‰è™•ç†æ¥é©Ÿï¼Œä½†å¦‚何有效切塊是一個難題,ä¸ç•¶çš„切塊å¯èƒ½å°Žè‡´ä¸Šä¸‹æ–‡ä¸Ÿå¤±æˆ–é—œè¯æ€§æ–·è£‚。
RAG 主è¦é©ç”¨æ–¼èƒ½å¾žç‰¹å®šæ–‡æœ¬ç‰‡æ®µä¸æ‰¾åˆ°ç”案的å•é¡Œï¼Œå°æ–¼éœ€è¦æ•´é«”ç†è§£æˆ–統計全局資訊的å•題,RAG 的效果有é™ã€‚
RAG 在大型模型上下文窗å£é™åˆ¶ä¸‹æ˜¯ä¸€ç¨®å¯¦ç”¨çš„妥唿–¹æ¡ˆï¼Œæ—¨åœ¨æé«˜ç”æ¡ˆçš„æº–ç¢ºæ€§ï¼Œä½†ä»æœ‰å¾…更完善的架構出ç¾ã€‚
----------
⓸ ã€æ‘˜è¦ Abstract】
✅ AI模型在處ç†ç‰¹å®šæ–‡ä»¶æ™‚å¯èƒ½ç”¢ç”Ÿã€Œå¹»è¦ºã€ã€‚
📌 RAGæž¶æ§‹æ—¨åœ¨é€šéŽæä¾›ç›¸é—œä¸Šä¸‹æ–‡ä¾†è§£æ±ºæ¤å•題。
📠嵌入模型將文本轉æ›ç‚ºå¯æ¯”較相關性的å‘é‡ã€‚
📚 å‘é‡è³‡æ–™åº«ç”¨æ–¼å„²å˜é€™äº›æ–‡æœ¬å‘é‡ä¸¦å¿«é€Ÿæª¢ç´¢ç›¸ä¼¼å…§å®¹ã€‚
âœ‚ï¸ å°‡æ–‡ä»¶åˆ‡å¡Šæ˜¯RAGå‰è™•ç†çš„é‡è¦æ¥é©Ÿã€‚
âš ï¸ ä¸ç•¶çš„切塊å¯èƒ½å°Žè‡´é—œéµè³‡è¨Šçš„上下文丟失。
🔠RAGé€šéŽæª¢ç´¢æœ€ç›¸é—œçš„æ–‡æœ¬ç‰‡æ®µä¾†å¢žå¼·æ¨¡åž‹ç”Ÿæˆã€‚
â“ RAGå°æ–¼éœ€è¦å…¨æ–‡ç†è§£çš„å•題效果ä¸ä½³ã€‚
----------
⓹ ã€FAQ 測驗】
第一題:大型語言模型在處ç†ä½¿ç”¨è€…æä¾›çš„ã€å®ƒæœªæ›¾è¦‹éŽçš„特定文件時,最常é‡åˆ°çš„å•題之一是什麼?
A 處ç†é€Ÿåº¦éŽæ…¢
B 無法ç†è§£æ–‡ä»¶ä¸çš„任何內容
C å°æ–‡ä»¶å…§å®¹ç”¢ç”Ÿçœ‹ä¼¼åˆç†ä½†å¯¦éš›éŒ¯èª¤çš„「幻覺ã€
D æ–‡ä»¶æ ¼å¼ç„¡æ³•辨è˜
æ£ç¢ºç”案:C
è§£é‡‹ï¼šå½±ç‰‡ä¸æåˆ°ï¼Œå¤§åž‹æ¨¡åž‹åœ¨è™•ç†æœªè¦‹éŽçš„內部文件時,主è¦å•題是å¯èƒ½ç”¢ç”Ÿè½èµ·ä¾†åˆç†ä½†èˆ‡æ–‡ä»¶å…§å®¹ä¸ç¬¦çš„ã€Œå¹»è¦ºã€æˆ–亂說。
第二題:在RAG(檢索增強生æˆï¼‰æž¶æ§‹ä¸ï¼Œã€ŒåµŒå…¥æ¨¡åž‹ã€ï¼ˆEmbedding model)的主è¦ä½œç”¨æ˜¯ä»€éº¼ï¼Ÿ
A 直接生æˆä½¿ç”¨è€…å•é¡Œçš„ç”æ¡ˆ
B 將使用者å•é¡Œç¿»è¯æˆå…¶ä»–語言
C 將文本(如文件片段或å•題)轉æ›ç‚ºå›ºå®šé•·åº¦çš„å‘é‡
D æª¢æŸ¥æ–‡æœ¬æ˜¯å¦æœ‰èªžæ³•錯誤
æ£ç¢ºç”案:C
解釋:影片明確說明嵌入模型接收文本輸入,輸出是固定長度的å‘é‡ï¼Œç”¨æ–¼è¡¨ç¤ºæ–‡æœ¬çš„語義信æ¯ï¼Œä¸¦è¨ˆç®—文本間的相似度。
第三題:RAG架構主è¦ä¾è³´å“ªç¨®è³‡æ–™åº«ä¾†å„²å˜å’Œå¿«é€Ÿå°‹æ‰¾èˆ‡ä½¿ç”¨è€…å•題最相關的文件內容?
A 傳統關è¯å¼è³‡æ–™åº«ï¼ˆå¦‚SQL)
B éµå€¼å„²å˜è³‡æ–™åº«ï¼ˆKey-Value Store)
C 圖形資料庫(Graph Database)
D å‘é‡è³‡æ–™åº«ï¼ˆVector Database)
æ£ç¢ºç”案:D
è§£é‡‹ï¼šå½±ç‰‡ä¸æåˆ°ï¼Œå‚³çµ±è³‡æ–™åº«ä¸æ“…長尋找å‘é‡ä¹‹é–“çš„ç›¸ä¼¼åº¦ï¼Œå› æ¤è¨è¨ˆäº†å°ˆé–€çš„「å‘é‡è³‡æ–™åº«ã€ä¾†å„²å˜åµŒå…¥æ¨¡åž‹ç”¢ç”Ÿçš„å‘é‡ï¼Œä¸¦æ ¹æ“šæŸ¥è©¢å‘é‡å°‹æ‰¾æœ€è¿‘çš„å‘é‡ã€‚
✡ Oliå°æ¿ƒç¸® Summary bot 為您濃縮é‡é»ž ✡
â–¶ https://www.youtube.com/watch?v=qMc0v2OUK3s
Comments ()