所有文章 - Nigel Lee Digest

文章小工具 AI 友善關於我

21 篇結果

標籤 #LLM

2026年7月2日/

#LLM

投機解碼：讓 LLM 推理速度飆升 3 倍的秘密武器

LLM 回應為何是「一個字一個字」冒出來？因為自回歸生成天生序列、無法並行。投機解碼用「小模型先猜、大模型批次驗證」的策略，把推理速度提升 2–3 倍，且完全不損失輸出品質。

0 讚0 回應

2026年6月5日/

#LLM #Agent #AIAgent

Claude Code Dynamic Workflows：從功能介紹到與 Function Calling 的架構比較

Dynamic Workflows 不只是更快的 AI 回答，而是把計畫的控制權從 LLM 的 context 移到程式碼裡。本文從功能介紹出發，深入比較它與傳統 function calling 一來一回模式的本質差異。

0 讚0 回應

2026年5月22日/

#LLM #Embedding #RAG #Agent

生成式 AI 是聰明的鸚鵡嗎？從 Yann LeCun 的批評看世界模型理論

Yann LeCun 認為現在的 LLM 只是「超級進化版的鸚鵡」——會說話，但不懂意思。他提出的世界模型與 JEPA 架構，究竟想解決什麼根本問題？

0 讚0 回應

2026年5月10日/

#LLM #PromptEngineering

Anthropic 工程師「HTML 取代 Markdown」：事實查核與分析

近期網路熱傳 Anthropic 工程師不再使用 Markdown，改用 HTML 與 LLM 互動。這件事是真的嗎？本文查核來源、摘要論點，並提供觀點分析。

0 讚0 回應

2026年5月3日/

#LLM #Agent #PromptEngineering

Routing Pattern 深入比較：LLM 分類 + RunnableBranch vs Coordinator + Sub-Agent

同樣是 Routing Pattern，LangGraph 的 LLM 分類 + RunnableBranch 與 Google ADK 的 Coordinator + Sub-Agent 架構有何本質差異？本文透過實際案例，拆解兩者的設計邏輯與選用時機。

0 讚0 回應

2026年4月27日/

#LLM #Agent

COT 思維鏈：讓 AI 像人一樣一步步思考

什麼是 COT 思維鏈？跟 ReAct 有什麼差別？AI Agent 怎麼應用？一篇讓你搞清楚的入門介紹。

8 讚3 回應

2026年4月22日/

#LLM #Agent

AI Agent 與 LLM 交互過程中的 Tool 功能：從原理到實戰

讓 AI 不只會「說」，還能真正「做事」——透過 Tool 機制，LLM 從一個會聊天的脑袋，變成能操控世界的智能代理。

1 讚0 回應

2026年4月22日/

#LLM #Agent

生成式 AI 的串流回應

`stream: true` 是 LLM API 的一個參數，決定 AI 回覆是**一次性全部傳回**，還是**逐塊（chunk）即時傳回**。

0 讚0 回應

2026年4月18日/

#LLM #Agent #教學

深度解析：OpenAI Function Calling 的運作原理與實作指南

0 讚1 回應

2026年4月18日/

#Agent #PromptEngineering #LLM

當無記憶遇上多階段：LazyHole-Agent 跨輪狀態實驗報告

0 讚0 回應

2026年4月17日/

#Agent #LLM

Agent Loop 策略：為什麼有的 tool 要多輪、有的要單輪

> 一句話摘要：LLM 呼叫工具後要不要再 call 一次 LLM，是延遲與能力的取捨。這份筆記解釋這個專案是怎麼決定的。

0 讚0 回應

2026年4月17日/

#LLM #PromptEngineering

深入淺出 LLM 指令遵從

本文深度解析大型語言模型（LLM）指令遵循失敗的 8 大原因，從 Prompt Engineering 角度提供表格化、正向指令及結構化優化策略，助你打造更精準的 AI 溝通術。

0 讚0 回應

2026年4月16日/

#RAG #LLM

RAG 技術中的 Reranking（重排序）

向量搜尋找得快，但找得不夠準——Reranking 就是那個在最後把最重要的資料推到前排的裁判。

0 讚0 回應

2026年4月16日/

#LLM #模型訓練

模型蒸餾

讓小模型繼承大模型的「智慧」，而不只是複製它的「答案」。

0 讚0 回應

2026年4月15日/

#LLM #RAG

解密 LLM 知識庫：Karpathy 的「LLM Wiki」如何重新定義 RAG

Andrej Karpathy 提出 LLM Wiki 概念，主張 AI 應透過「知識編譯」將 RAG 資料轉化為結構化 Wiki，而非反覆碎片化查詢。本文解析參數化記憶、現代 RAG 與 LLM Wiki 的本質差異與挑戰。

0 讚0 回應

2026年4月12日/

#LLM

如何驗證LLM降智

模型真的變笨了嗎？本文提供五大測試維度與嚴謹的統計學方法，教你如何用數據驗證 AI 模型降智，排除主觀偏誤，建立自動化監控管線。

0 讚0 回應

2026年4月11日/

#LLM #RAG

知識圖譜的靈魂之問：AI 工程中的 KG 是設計給「機器」還是「人」看？

在大型語言模型（LLM）橫掃技術領域的今天，Knowledge Graph（知識圖譜，以下簡稱 KG）座定位正經歷一場深刻的變革。對於一個正處於 AI 應用浪潮中的舊專案來說，KG 不僅是技術組件，更是連接「過去代碼」與「未來智能」的橋樑。

0 讚0 回應

2026年4月11日/

#LLM

模型降智??

這篇文章將 AI模型降智比喻為「連鎖咖啡店的配方調整」，深入分析了廠商在成本、速度與安全性之間進行權衡時，如何導致模型在深度推理與指令遵循能力上的偏移，並提供了 McNemar's Test、LiveBench 等科學驗證方法。

0 讚0 回應

2026年4月9日/

#LLM #PromptEngineering

不丟失語意地縮小 Context Window 壓力

AI 模型的「短期記憶」有上限——這篇文章告訴你工程師怎麼在不讓它失憶的前提下，騙它用更少的空間記住更多的事。

0 讚0 回應

2026年4月6日/

#RAG #LLM #教學

從零開始建立 RAG 系統：完整流程拆解

想讓 AI 讀懂你的文件再回答？這篇用最白話的方式，拆解 RAG 系統從「準備資料」到「回答問題」的完整流程，附上 Python 和 TypeScript 程式碼範例。

0 讚0 回應

2026年4月6日/

#RAG #LLM #教學

RAG：讓 AI 不再瞎掰的關鍵技術

RAG 是一種讓 AI 先查資料再回答的技術，大幅減少幻覺問題。你每天用的 Cursor、Copilot、Claude Code 背後都在用它——理解 RAG，就是理解你手上 AI 工具為什麼有時超神、有時超廢。

0 讚0 回應