Vault Curate:工具幫你看見,不幫你思考
Vault Curate:工具幫你看見,不幫你思考
上次寫完 Vault Search 那篇之後我就一直在 dogfood,順便繼續改,前後一個多月功能動了不少,但每次做設計決定,我都在繞同一個問題:AI 在這裡該做到哪?
我為什麼還是不讓 AI 幫我「完全整理」筆記
上次 Karpathy 提的那個 LLM 編譯 wiki 的方向,網路上的討論到現在還沒停,很多人持續分享「我讓 AI 把我所有筆記蒸餾成結構化知識庫」之類的工作流。
但對我來說,我的想法一直沒變過,我總覺得每一篇原始筆記裡有個東西是蒸餾不走的,年輕時不成熟的意見、踩過的坑、靈光乍現的那一瞬間,這些東西在 AI 整理出來的版本裡會被視為冗餘或美化,甚至被刪掉,它整理完的東西比原稿乾淨、邏輯更清楚,但,乾淨的是它,不是我。
所以我想要的工具,是幫我重新看見自己寫過的東西,不是幫我總結,因此 Vault Curate 幾個改動的方向不是往 AI 進化,而是繼續往「人味進化」XD
這次主要加強
Hybrid Fusion 搜尋
我之前做過幾個網路搜尋相關的開源專案,搜尋這塊踩過不少坑,知道單一一條路會出問題:純 embedding 容易抓到「語意接近但詞對不上」的東西,純關鍵字又抓不到「同一件事不同講法」。當時的解法很複雜,這次想辦法把它簡化,搬進 Obsidian。
現在的搜尋是三路合一:BM25 抓關鍵字精確度、語意 embedding 抓同義和語境、Jaro-Winkler fuzzy 抓打錯字。三邊各自排名,用 Reciprocal Rank Fusion 合流。
背後的想法是:「想法的形狀」不只一種。你有時候記得詞,有時候記得感覺,有時候連字都拼錯了,搜尋工具最好是能夠有彈性的處理,而且不要用 AI :P
Discover Hot/Cold
這個是我自己最喜歡小功能。
它不是搜尋,你什麼都不用打。它在背景看哪些筆記你最近常碰(熱),哪些寫了之後 90 天都沒回去(冷),然後 Vault Curate 主動把冰藏的文章也推出來給你看。
AI 在這裡的角色就一件事:提醒你你寫過什麼。它不改你的內容,不替你整理,就是說「這篇你忘了,要不要回頭看一眼」。很多老筆記不是沒價值,只是我們忘了它存在。
MOC 預設關掉
新版有個 AI curation 區,他和前一版的最大不同是,這次可以用 clustering 自動把筆記分主題群(文章數量要夠多才有群可分)、用 LLM 命名每群,產出 Map of Content。
但它預設是關的,要你進 Settings 自己打開,然後手動跑才會動。
技術上要它在背景偷偷跑不難,但你的 vault 不應該在你不知情的時候被改。AI curation 可以幫你發現新分群,但它應該是你拿起來用的工具,不是替你決定的代理人。你按按鈕,你看結果,你決定要不要留。
還是提一下一個反直覺的用法
大部分人習慣的搜尋邏輯是這樣的:打越短越好,打關鍵字就對了,打多了反而搜不到。
語意搜尋是反過來的 —— 你描述得越完整,它越準。
舉個我自己的例子:與其搜「量化」,不如搜「在筆電上跑小模型有哪些量化選擇、會犧牲多少品質」。前者會撈回一堆只要出現「量化」兩個字的筆記,後者直接命中我之前寫的那篇 Gemma E4B 量化方案實測。
原因是 embedding 抓的是整段語意的向量,輸入越具體,向量在空間裡的位置就越精準,能撞到對的筆記。短關鍵字反而是把語意丟掉、退回字面比對。
所以用 Vault Curate 的時候,把你腦中那個模糊的記憶整段打進去,不要自己幫它「精簡成關鍵字」,你要是真的記得這麼準的關鍵字,那麼你早就找得到你要的資料了,但人的記憶就是有限啊,不要和自己過不去 XD
順帶一提
名字從 Vault Search 換成 Vault Curate。之前上架審核排隊幾個月的期間,另一個開發者在 Obsidian community 改版的那兩天,先用了 vault-search 這個 plugin id 名稱。
為了減少大家的困擾,我就乾脆改名了,換完之後反而覺得 Curate 這個字更準,這本來就不是純搜尋工具,是整理跟發現用的,算是因禍得福?
還有一個比較大的改動:現在不用裝 Ollama 也能跑。以前要先弄 Ollama 才能 embedding,雖然我覺得現在很多人可能都有,但還是一個門檻,現在預設改成裝置端 WebGPU 推論,模型 ~110MB 第一次自動下載,裝完插件就能用,Ollama 變進階選項,假如你想用更厲害的模型,就自己換吧。
中文到底行不行
幾個常見的多語 embedding 模型(MiniLM 那系列的多語 distilled 版本),中文相關的查詢命中率很差,不是排名低,就是相關筆記根本不出來,他們可能在英語系當中還是很優秀的,但我們就是要用中文啊,如果你的筆記主要是中文,差距會直接影響你每天搜得到搜不到,Vault Curate 用的是中文訓練友善的 bge-small-zh-v1.5,基本上表現都還不錯。
怎麼裝
Obsidian Settings → Community plugins → 搜 “Vault Curate” → Install → Enable。第一次開會跳一個 Welcome 視窗帶你建索引,就這樣。
開源在 GitHub:notoriouslab/vault-curate
覺得有用的話幫忙給個星星 XD