【人工智能】RAG已死，上下文工程永存 | Chroma CEO Jeff Huber | 从炼金术到工程学 | 上下文腐烂 | 开发者体验 | 独特产品哲学 | 上下文质量更重要 | 两阶段检索

byDavid Chiang •10:58 下午

0

⓵ 【容易懂 Easy Know】：想像一下，我們在變魔術，想讓電腦變聰明。以前就像把很多東西丟進一個黑箱子裡，希望它能變出好東西，但常常失敗。現在，Chroma這家公司想把這個「變魔術」變成真正的「工程」，像蓋房子一樣，一步一步來。他們發現，給電腦看的資料太多，反而會讓它變笨，就像考試前拼命塞東西，結果什麼都記不住。所以，他們教電腦怎麼聰明地選擇重要的資料，就像考試前畫重點一樣。這樣，電腦才能真正變聰明，做出有用的東西。這個方法叫做「上下文工程」，就是要讓電腦看的資料剛剛好，不多也不少。

---
⓶ 【總結 Overall Summary】：影片介紹了 Chroma 這家公司，以及他們如何致力於將 AI 開發從「煉金術」轉變為更嚴謹的「工程學」。Chroma 的創辦人 Jeff Huber 認為，當前 AI 開發的困境在於從 Demo 展示到實際生產環境存在巨大鴻溝，而填補這一鴻溝需要工程化的方法，而非僅憑運氣或不斷嘗試。他們發現，盲目追求超長上下文窗口可能導致「上下文腐爛」，即模型效能隨上下文長度增加而下降。

Chroma 的核心理念是專注於「檢索」這個 AI 應用中的關鍵環節，他們認為精準高效地從海量資訊中找到最相關的內容，對於 AI 應用的品質至關重要。因此，他們打造了現代化的 AI 原生檢索基礎設施，從技術、工作負載、開發者和使用者等多個層面進行了革新。

Chroma 沒有盲目追求市場熱點，而是堅持打磨基礎的開源單機版產品，注重「開發者體驗」，力求將產品與「技藝」深度連結。他們緩慢且挑剔地招募團隊成員，認為公司文化決定了產品形態，最終交付的是公司的文化。

Chroma 強調「上下文工程」的重要性，提倡更精確的資訊篩選和處理方式，以避免「上下文腐爛」。他們提出了「兩階段檢索」策略，以及利用大模型本身進行重排序的方法。此外，Chroma 還提倡使用「生成式基準測試」來量化評估檢索系統的效能，並鼓勵團隊手動創建高質量的標注數據。影片總結 Chroma 的成功不僅是技術上的，更是一種文化的勝利，是對於「技藝」的極致追求和對嚴謹系統建構的思考方式。

---
⓷ 【觀點 Viewpoints】：

* AI 開發的現狀是從 Demo 到生產環境存在巨大鴻溝，需要工程化的方法來填補。
* 盲目追求超長上下文窗口可能導致「上下文腐爛」，資訊的品質比數量更重要。
* 「檢索」是 AI 應用中的關鍵環節，精準高效地找到相關內容至關重要。
* 「上下文工程」的目標是決定在大語言模型的生成步驟中放入哪些資訊。
* 「兩階段檢索」是一種精細化的策略，先粗篩再精煉，提高檢索效率和準確性。
* 「生成式基準測試」可以用於量化評估檢索系統的效能，實現可測量、可迭代的優化。

---
⓸ 【摘要 Abstract】：

* ✅ AI 開發需要從「煉金術」轉變為嚴謹的「工程學」。
* ⚠️ 「上下文腐爛」是指大語言模型的效能隨上下文長度增加而下降。
* 📌 「檢索」是 AI 應用中至關重要的環節，需專注於精準和效率。
* 💡 「上下文工程」旨在決定大語言模型生成步驟中該放入哪些資訊。
* 🔎 「兩階段檢索」包含粗篩和精煉兩個階段，提升檢索效果。
* 📊 「生成式基準測試」可量化評估檢索系統的效能。
* 🧑‍💻 注重「開發者體驗」是 Chroma 成功的關鍵因素之一。
* 🏢 公司文化決定產品形態，最終交付的是公司的文化。

---
⓹ 【FAQ 測驗】：

1. 以下哪一項是對「上下文腐爛」（Context Rot）最準確的描述？
A. 模型在處理簡短上下文時出現錯誤。
B. 模型隨著上下文窗口中的 Token 數量增加，效能反而下降。
C. 模型只能理解特定格式的上下文資訊。
D. 模型在處理程式碼相關的上下文時效能較差。
**答案：B。解釋：上下文腐爛指的是大語言模型在處理過長上下文時，效能會顯著衰減。**

2. Chroma 提出的「上下文工程」（Context Engineering）的核心目標是什麼？
A. 最大化上下文窗口的長度。
B. 訓練模型以忽略不相關的上下文資訊。
C. 決定在大語言模型的生成步驟中應該放入哪些資訊。
D. 將所有可能的資訊都放入上下文窗口中。
**答案：C。解釋：上下文工程的核心目標是精確地選擇和管理輸入到大語言模型上下文窗口中的資訊。**

3. 「生成式基準測試」（Generative Benchmarking）的主要用途是什麼？
A. 生成更長的上下文窗口。
B. 自動創建用於評估 AI 系統效能的標準數據集。
C. 提高大語言模型的生成速度。
D. 自動修復程式碼中的錯誤。
**答案：B。解釋：生成式基準測試利用大語言模型反向生成問題和答案，從而快速創建大量的黃金數據集，用於量化評估檢索系統的效能。**

✡ Oli小濃縮 Summary bot 為您濃縮重點 ✡

▶ https://youtu.be/L-9_A84twpw

*

張貼留言 (0)

【人工智能】RAG已死，上下文工程永存 | Chroma CEO Jeff Huber | 从炼金术到工程学 | 上下文腐烂 | 开发者体验 | 独特产品哲学 | 上下文质量更重要 | 两阶段检索

廣告1

廣告2

聯絡表單