Yoru Karu Studio

程式設計學習筆記 | 生活心得

Django 面試精華：threading.local 原理

luk 發佈於 2025-01-14 收錄於 System-Design

前言在多線程環境中，如何讓每個線程擁有自己獨立的資料副本？這是一個經典的並發編程問題。想像一個實際場景： # ❌ 全局變量會被所有線程共享 current_user = None def process_request(request): global current_user current_user = request.user # 線程 A 設置 do_some_work() # 在這期間，線程 B 可能修改 current_user！ send_email(current_user) # 可能發給錯誤的用戶！問題：線程 A 處理用戶 Alice 的請求線程 B 同時處理用戶 Bob 的請求兩個線程共享同一個 current_user 變量結果：Alice 的郵件可能發給 Bob！解決方案：使用 threading.local # ✅ 每個線程有自己的 current_user thread_local = threading.local() def process_request(request): thread_local.current_user = request.user # 線程隔離 do_some_work() # 其他線程不會影響 send_email(thread_local.current_user) # 安全！這篇文章將深入探討 threading.local 的實現原理，以及 Django 如何利用它保證線程安全。

檢索增強生成（RAG）完全指南：從原理到實戰

luk 發佈於 2025-01-14 收錄於 Artificial-Intelligence

為什麼 RAG 是 LLM 時代的必備技術？想像大語言模型（LLM）是一位擁有淵博知識的頂尖學者。預訓練就像這位學者在學校裡閱讀了數萬本書，形成了強大的語言能力和世界觀。然而，他參加的是閉卷考試（直接提問 LLM）：他無法回憶起所有細節，容易遺忘最近發生的事，也無法參考他從未讀過的公司內部文件。 RAG的作用，就是將閉卷考試變為開卷考試。當問題出現時，先讓他迅速查閱相關的參考資料，然後根據手邊的文件作答，確保答案的準確性和時效性。理解 RAG，是從「玩轉」LLM 提升到「應用」LLM 解決實際業務問題的關鍵。 🧠 LLM 的三大知識困境在沒有 RAG 之前，直接使用預訓練 LLM 進行問答，面臨三大挑戰： 1. 幻覺（Hallucination）當模型被問到一個它不確定的細節時，它傾向於編造聽起來合理但事實上錯誤的資訊。這源於其訓練目標是「產生最可能的下一個詞」，而非「產生事實準確的詞」。 2. 知識過時（Knowledge Staleness） LLM 的知識截止日期是其最後一次預訓練的時間點。對於訓練之後發生的新事件、最新財報、或法規變動，LLM 無法獲知。範例：你問 2024 年的模型誰贏得了 2025 年的奧斯卡獎，它會根據過去的資訊來猜測或給出過時的答案。 3. 知識隔離（Knowledge Isolation） LLM 無法存取你的專屬領域知識，例如公司的產品手冊、內部郵件、私有程式碼文件或未公開的研究報告。若要讓 LLM 基於這些文件回答，傳統方法成本過高。 🔎 RAG（檢索增強生成）是什麼？ RAG 是一種將檢索系統 (Retriever) 和生成模型 (Generator) 結合的技術，其目標是：在 LLM 生成回覆之前，先從外部知識庫中檢索相關的片段（Context），然後將這些片段作為提示詞的一部分輸入給 LLM，引導模型生成基於事實的答案。 RAG 的核心：將答案的依據外部化特性傳統 LLM（閉卷） RAG LLM（開卷）知識來源模型參數（記憶）外部知識庫（參考資料）問答流程問句 → 直接生成答案問句 → 檢索相關資料 → 根據資料生成答案知識更新需重新訓練或微調模型只需更新外部資料庫準確性依賴記憶，易產生幻覺基於事實，準確性高 📐 RAG 的標準架構流程 RAG 系統分為兩個主要階段：索引階段（預處理）和運行階段（問答）。

深入理解系統延遲：從 Latency 到 Tail Latency 的優化之道

luk 發佈於 2025-01-10 收錄於 System-Design

為什麼延遲如此重要？

想像你在使用一個應用程式，每次點擊都要等待好幾秒才有反應。即使功能再強大，這樣的體驗也會讓人抓狂。

延遲（Latency）是衡量系統效能最直接的指標，而尾延遲（Tail Latency）更是決定用戶體驗的關鍵因素。

API 認證方式深度比較：API Key vs Session vs JWT

luk 發佈於 2025-01-10 收錄於 Api-Design

認證機制的重要性

在現代 API 設計中，選擇合適的認證機制是確保系統安全的第一步。不同的認證方式有著截然不同的特性，適用於不同的場景。

讓我們深入比較 API Key、Session 和 JWT 這三種最常用的認證方式。

系統分頁設計完全指南：從基礎概念到進階實作

luk 發佈於 2025-01-10 收錄於 System-Design

為什麼分頁如此重要？

想像一下，你正在瀏覽一個擁有百萬商品的電商網站，或是查看社交媒體上的無限動態。如果系統試圖一次載入所有資料，會發生什麼？

伺服器記憶體爆炸 💥
網路傳輸癱瘓 🌐
瀏覽器當機 💻
用戶體驗災難 😱

分頁（Pagination）是解決大數據集展示的核心技術，讓我們深入探討如何正確實作。

電商產品目錄 API 的必備功能：設計指南與最佳實踐

luk 發佈於 2025-01-10 收錄於 Api-Design

題目分析

在設計電商產品目錄 API 時，哪些功能是必要的？這個問題看似簡單，但涉及效能、使用者體驗、可維護性等多方面考量。

根據實務經驗，答案是 1、2、3、4、6、7。讓我們深入理解每個功能的重要性。