27 篇文章
Yann LeCun 認為現在的 LLM 只是「超級進化版的鸚鵡」——會說話,但不懂意思。他提出的世界模型與 JEPA 架構,究竟想解決什麼根本問題?
近期網路熱傳 Anthropic 工程師不再使用 Markdown,改用 HTML 與 LLM 互動。這件事是真的嗎?本文查核來源、摘要論點,並提供觀點分析。
同樣是 Routing Pattern,LangGraph 的 LLM 分類 + RunnableBranch 與 Google ADK 的 Coordinator + Sub-Agent 架構有何本質差異?本文透過實際案例,拆解兩者的設計邏輯與選用時機。
什麼是 COT 思維鏈?跟 ReAct 有什麼差別?AI Agent 怎麼應用?一篇讓你搞清楚的入門介紹。
當我們談論 AI Agent 的能力延伸時,「工具调用」是不可繞過的核心議題。2024 年底,Anthropic 發布了 **Model Context Protocol(MCP)**,一個試圖標準化 AI 與外部工具溝通的開放協定。與此同時,Claude Code、Cursor、Copilot 等主流 Agent 產品仍採用各自原生的 Tool 系統。
樂活五線譜與樂活通道的雙重確認系統,用統計數據過濾情緒,打造客觀的價值投資框架。
讓 AI 不只會「說」,還能真正「做事」——透過 Tool 機制,LLM 從一個會聊天的脑袋,變成能操控世界的智能代理。
`stream: true` 是 LLM API 的一個參數,決定 AI 回覆是**一次性全部傳回**,還是**逐塊(chunk)即時傳回**。
記憶,是人類最神奇的能力之一。從童年的第一個生日蛋糕,到昨天午餐吃了什麼——這些看似平常的片段,其實都是大腦精密協作的成果。今天,就讓我們一起探索記憶的運作奧秘。
> 一句話摘要:LLM 呼叫工具後要不要再 call 一次 LLM,是延遲與能力的取捨。這份筆記解釋這個專案是怎麼決定的。
本文深度解析大型語言模型(LLM)指令遵循失敗的 8 大原因,從 Prompt Engineering 角度提供表格化、正向指令及結構化優化策略,助你打造更精準的 AI 溝通術。
向量搜尋找得快,但找得不夠準——Reranking 就是那個在最後把最重要的資料推到前排的裁判。
讓小模型繼承大模型的「智慧」,而不只是複製它的「答案」。
Andrej Karpathy 提出 LLM Wiki 概念,主張 AI 應透過「知識編譯」將 RAG 資料轉化為結構化 Wiki,而非反覆碎片化查詢。本文解析參數化記憶、現代 RAG 與 LLM Wiki 的本質差異與挑戰。
當 AI Agent 需要與外部世界互動時,該讓它敲指令,還是講協議?
模型真的變笨了嗎?本文提供五大測試維度與嚴謹的統計學方法,教你如何用數據驗證 AI 模型降智,排除主觀偏誤,建立自動化監控管線。
在大型語言模型(LLM)橫掃技術領域的今天,Knowledge Graph(知識圖譜,以下簡稱 KG)座定位正經歷一場深刻的變革。對於一個正處於 AI 應用浪潮中的舊專案來說,KG 不僅是技術組件,更是連接「過去代碼」與「未來智能」的橋樑。
這篇文章將 AI模型降智比喻為「連鎖咖啡店的配方調整」,深入分析了廠商在成本、速度與安全性之間進行權衡時,如何導致模型在深度推理與指令遵循能力上的偏移,並提供了 McNemar's Test、LiveBench 等科學驗證方法。
AI 模型的「短期記憶」有上限——這篇文章告訴你工程師怎麼在不讓它失憶的前提下,騙它用更少的空間記住更多的事。
兩個粒子,無論相距多遠,測量其中一個,另一個的狀態瞬間確定——這不是魔法,是宇宙運作的規則。
想讓 AI 讀懂你的文件再回答?這篇用最白話的方式,拆解 RAG 系統從「準備資料」到「回答問題」的完整流程,附上 Python 和 TypeScript 程式碼範例。
RAG 是一種讓 AI 先查資料再回答的技術,大幅減少幻覺問題。你每天用的 Cursor、Copilot、Claude Code 背後都在用它——理解 RAG,就是理解你手上 AI 工具為什麼有時超神、有時超廢。
Harness Engineering 簡介
記錄建立 Next.js Blog 系統後,針對 Brute Force、CSRF、JWT 黑名單、Slug 衝突等資安問題的修復過程。
軟體開發有兩種玩法:「做完就散」的專案模式,以及「養一支長期隊伍」的產品模式。這篇文章用費曼學習法拆解 Martin Fowler 的經典文章,告訴你為什麼現代軟體團隊應該從接案思維轉向產品思維。