---
title: "Vault Curate：工具幫你看見，不幫你思考"
description: "Vault Curate（前身 Vault Search）：本地、中文友善、AI opt-in 的 Obsidian 語意搜尋與整理工具。AI 不取代你思考，幫你重新看見自己寫過的東西。"
pubDate: 2026-05-18
author: "jacobmei"
category: "AI與科技"
tags: [AI, Obsidian, RAG, 語意搜尋, 開源]
canonical: https://jacobmei.com/blog/2026/0518-1g8vmf/
lang: zh-TW
license: CC BY-NC 4.0
---

# Vault Curate：工具幫你看見，不幫你思考

# Vault Curate：工具幫你看見，不幫你思考

上次寫完 Vault Search 那篇之後我就一直在 dogfood，順便繼續改，前後一個多月功能動了不少，但每次做設計決定，我都在繞同一個問題：**AI 在這裡該做到哪？**

## 我為什麼還是不讓 AI 幫我「完全整理」筆記

上次  [Karpathy](https://x.com/karpathy) 提的那個 LLM 編譯 wiki 的方向，網路上的討論到現在還沒停，很多人持續分享「我讓 AI 把我所有筆記蒸餾成結構化知識庫」之類的工作流。

但對我來說，我的想法一直沒變過，我總覺得每一篇原始筆記裡有個東西是蒸餾不走的，年輕時不成熟的意見、踩過的坑、靈光乍現的那一瞬間，這些東西在 AI 整理出來的版本裡會被視為冗餘或美化，甚至被刪掉，它整理完的東西比原稿乾淨、邏輯更清楚，但，乾淨的是它，不是我。

所以我想要的工具，是幫我**重新看見自己寫過的東西**，不是幫我總結，因此 Vault Curate 幾個改動的方向不是往 AI 進化，而是繼續往「人味進化」XD

## 這次主要加強

### Hybrid Fusion 搜尋

我之前做過幾個網路搜尋相關的開源專案，搜尋這塊踩過不少坑，知道單一一條路會出問題：純 embedding 容易抓到「語意接近但詞對不上」的東西，純關鍵字又抓不到「同一件事不同講法」。當時的解法很複雜，這次想辦法把它簡化，搬進 Obsidian。

現在的搜尋是三路合一：BM25 抓關鍵字精確度、語意 embedding 抓同義和語境、Jaro-Winkler fuzzy 抓打錯字。三邊各自排名，用 Reciprocal Rank Fusion 合流。

背後的想法是：**「想法的形狀」不只一種**。你有時候記得詞，有時候記得感覺，有時候連字都拼錯了，搜尋工具最好是能夠有彈性的處理，而且不要用 AI :P

### Discover Hot/Cold

這個是我自己最喜歡小功能。

它不是搜尋，你什麼都不用打。它在背景看哪些筆記你最近常碰（熱），哪些寫了之後 90 天都沒回去（冷），然後 Vault Curate 主動把冰藏的文章也推出來給你看。

AI 在這裡的角色就一件事：**提醒你你寫過什麼**。它不改你的內容，不替你整理，就是說「這篇你忘了，要不要回頭看一眼」。很多老筆記不是沒價值，只是我們忘了它存在。

### MOC 預設關掉

新版有個 AI curation 區，他和前一版的最大不同是，這次可以用 clustering 自動把筆記分主題群（文章數量要夠多才有群可分）、用 LLM 命名每群，產出 Map of Content。

但它預設是關的，要你進 Settings 自己打開，然後手動跑才會動。

技術上要它在背景偷偷跑不難，但**你的 vault 不應該在你不知情的時候被改**。AI curation 可以幫你發現新分群，但它應該是你拿起來用的工具，不是替你決定的代理人。你按按鈕，你看結果，你決定要不要留。

## 還是提一下一個反直覺的用法

大部分人習慣的搜尋邏輯是這樣的：打越短越好，打關鍵字就對了，打多了反而搜不到。

語意搜尋是反過來的 —— **你描述得越完整，它越準**。

舉個我自己的例子：與其搜「量化」，不如搜「在筆電上跑小模型有哪些量化選擇、會犧牲多少品質」。前者會撈回一堆只要出現「量化」兩個字的筆記，後者直接命中我之前寫的那篇 Gemma E4B 量化方案實測。

原因是 embedding 抓的是整段語意的向量，輸入越具體，向量在空間裡的位置就越精準，能撞到對的筆記。短關鍵字反而是把語意丟掉、退回字面比對。

所以用 Vault Curate 的時候，**把你腦中那個模糊的記憶整段打進去**，不要自己幫它「精簡成關鍵字」，你要是真的記得這麼準的關鍵字，那麼你早就找得到你要的資料了，但人的記憶就是有限啊，不要和自己過不去 XD

## 順帶一提

名字從 Vault Search 換成 Vault Curate。之前上架審核排隊幾個月的期間，另一個開發者在 Obsidian community 改版的那兩天，先用了 `vault-search` 這個 plugin id 名稱。

為了減少大家的困擾，我就乾脆改名了，換完之後反而覺得 Curate 這個字更準，這本來就不是純搜尋工具，是整理跟發現用的，算是因禍得福？

還有一個比較大的改動：**現在不用裝 Ollama 也能跑**。以前要先弄 Ollama 才能 embedding，雖然我覺得現在很多人可能都有，但還是一個門檻，現在預設改成裝置端 WebGPU 推論，模型 ~110MB 第一次自動下載，裝完插件就能用，Ollama 變進階選項，假如你想用更厲害的模型，就自己換吧。

## 中文到底行不行

幾個常見的多語 embedding 模型（MiniLM 那系列的多語 distilled 版本），中文相關的查詢命中率很差，不是排名低，就是相關筆記根本不出來，他們可能在英語系當中還是很優秀的，但我們就是要用中文啊，如果你的筆記主要是中文，差距會直接影響你每天搜得到搜不到，Vault Curate 用的是中文訓練友善的 `bge-small-zh-v1.5`，基本上表現都還不錯。

## 怎麼裝

Obsidian Settings → Community plugins → 搜 "Vault Curate" → Install → Enable。第一次開會跳一個 Welcome 視窗帶你建索引，就這樣。

開源在 GitHub：[`notoriouslab/vault-curate`](https://github.com/notoriouslab/vault-curate)

覺得有用的話幫忙給個星星 XD
