在大型語言模型(LLM)橫掃技術領域的今天,Knowledge Graph(知識圖譜,以下簡稱 KG)座定位正經歷一場深刻的變革。對於一個正處於 AI 應用浪潮中的舊專案來說,KG 不僅是技術組件,更是連接「過去代碼」與「未來智能」的橋樑。
一、 雙重視角的對立與統一
在設計 KG 時,我們往往面臨兩難:是要追求極致的機器可讀性,還是直觀的人類理解度?
1. 給 AI 看:作為「確定性」的外部大腦
- 核心目標: 消除幻覺、路徑推理、事實錨定。
- 設計重點:
- 結構嚴謹性: 側重三元組(Triples)的原子化,使用唯一的實體 ID (URI/UUID)。
- 拓撲豐富度: 建立多跳(Multi-hop)關係,讓 AI 能在複雜的節點中計算出正確的邏輯路徑(例如:從 API 報錯推導至資料庫表的關聯缺陷)。
- 不可見性: 這部分的圖譜可能包含大量的 meta-data,對人類來說極度冗長,但對 AI 而言是精確導航的坐標。
2. 給人看:作為「透明化」的協作介面
- 核心目標: 可解釋性、領域知識傳承、決策審核。
- 設計重點:
- 語義一致性: 節點與關係的命名必須符合人類的自然語言習慣。
- 視覺化佈局: 強調層次感與群落感,讓工程師能一眼看出系統的模塊邊界。
- 知識治理: 提供一個直觀的介面,讓領域專家(而非僅是工程師)能手動修正 AI 無法理解的業務邏輯。
二、 舊專案的救星:KG 作為「數位雙生」
對於一個「生在 AI 潮流中」的舊專案,KG 扮演著知識救援者的角色。
舊專案的典型痛點
- 代碼混亂(Spaghetti Code): 呼叫鏈複雜,改 A 壞 B。
- 文件缺失(Missing Docs): 當年的開發者已離職,邏輯埋在堆坑中。
- 知識孤島: 只有少數老員工知道某個神奇數字(Magic Number)的含義。
轉型策略:三層建模架構
我們不應在「人」與「機器」之間二選一,而是透過分層來同時滿足兩者:
| 層級 | 內容 | 主要受眾 | 目的 |
|---|---|---|---|
| 頂層:領域意圖層 | 業務規則、設計哲學、法規約束 | 人類 | 傳承隱性知識,作為 AI 的行為護欄(Guardrails)。 |
| 中層:語義映射層 | 代碼模組與業務概念的連結 | AI + 人 | 讓 AI 理解 v1_check_balance() 就是「檢查餘額」概念。 |
| 底層:基礎設施層 | AST 掃描出的調用鏈、DB Schema、API 路由 | AI | 提供精確的技術路徑,防止 AI 在回答技術問題時產生幻覺。 |
三、 實踐路徑:如何讓舊專案「動起來」?
針對該場景,建議採取 「自動生成、人工調優、AI 增強」 的迭代循環:
- 逆向工程(底層自動化): 利用工具掃描舊代碼,自動提取基礎實體與關係。這部分是「給 AI 看」的基石,解決 AI 對專案結構的基礎認知。
- GraphRAG 導入(中層對齊): 將既有的 Markdown 文件或註解轉化為向量與圖譜節點。這時 AI 已經能開始準確回答「這段代碼在幹嘛」的問題。
- 視覺化審核(頂層修正): 將圖譜視覺化呈獻給現有開發者。當人類看到圖譜中的連線錯誤時(例如:這不應該直接訪問資料庫),手動修正這條「關係」。這不僅優化了圖譜,也重新梳理了人類對舊專案的認知。
四、 結論:KG 是人類與 AI 的「共識層」
在現代 AI 工程中,KG 的最終型態不再是純粹的機器代碼,也不是純粹的導航地圖,而是 「人類與 AI 的共同協議(Common Protocol)」。
- 對 AI 而言,它是保證輸出質量的「法律條文」。
- 對人類而言,它是掌控複雜系統的「遙控器」。
對於舊專案來說,建立 KG 的過程,就是將「埋在地底的技術債」挖掘出來,轉化為「可被 AI 理解的數據資產」的過程。