LLM Wiki:用LLM当知识工程师,打造个人Wiki知识库

图片1:LLM Wiki 项目介绍
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

一篇关于 Karpathy 知识库构想的文章,介绍了如何利用 LLM(大型语言模型)作为知识工程师,帮助用户持续维护一个 Markdown 知识库。文章指出,在 GitHub 上已有基于此理念的具体实现项目。其中,一个名为 LLM Wiki 的项目引起了广泛关注,已收获超过 3300 个 Star。

图片2:LLM Wiki 项目界面
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

LLM Wiki 并非简单的命令行工具或 Claude Code Skill,它直接打造了一个跨平台的桌面应用,功能丰富,远超 Karpathy 原版 Gist 的设想。以下是这个开源项目的详细解析。

001:一句话介绍LLM Wiki

LLM Wiki 是一个跨平台桌面应用,将您的文档导入后,自动生成结构化的、互相链接的个人 Wiki 知识库。

图片3:LLM Wiki 功能介绍
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

与传统的 RAG 方案不同,LLM Wiki 不再每次提问时都从原始文档重新检索。它首先让 LLM 通读文档,生成 Wiki 页面、建立交叉引用、标注矛盾点,后续提问则直接在 Wiki 上进行。知识库仅需编译一次,便能持续保持最新状态。

开源地址https://github.com/nashsu/llm_wiki

002:两步链式思考录入

这是 LLM Wiki 最核心的设计之一。项目将原版 Gist 的一步录入拆分为两步:

第一步:分析
LLM 首先通读文档,提取关键实体、概念、论点,寻找与已有 Wiki 内容的关联,发现矛盾和张力,然后给出结构化的分析结果。

第二步:生成

  1. LLM 根据“分析”结果,开始编写 Wiki 页面。生成摘要页、实体页、概念页,更新索引,建立交叉引用,标注需要人工判断的事项。
  2. 这种两步设计让 LLM 在动手前先思考清楚,从而提升质量。
  3. 每个来源的录入可能牵动 10 到 15 个 Wiki 页面的更新。LLM 会自动将新知识与已有知识网络串联起来。
  4. 项目还包含 SHA256 增量缓存功能,对未改动的文件自动跳过处理,节省 token 和时间。
  5. 持久化队列的设计也让项目更加稳定,即使崩溃重启也能继续运行,失败自动重试 3 次。活动面板可实时查看每个文件的处理进度。

003:知识图谱可视化

LLM Wiki 相比原版 Gist,不仅提供了用 wikilinks 做交叉引用的功能,还打造了一个完整的知识图谱可视化和关联引擎。

图片4:知识图谱可视化
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

它通过以下四个维度衡量两个 Wiki 页面之间的关联程度:

  1. 直接链接(权重 x3.0):页面之间有 wikilinks 直接引用。
  2. 来源重叠(权重 x4.0):两个页面引用了同一个原始文档。
  3. Adamic-Adar(权重 x1.5):两个页面有共同邻居,共同邻居越稀有关联性越强。
  4. 类型亲和度(权重 x1.0):同类型页面有额外加分。

可视化采用 sigma.js + ForceAtlas2 布局。节点颜色可按页面类型或社区聚类进行着色,节点大小按链接数量缩放。鼠标悬停时,关联节点保持高亮,其他节点变暗,并显示关联分数。项目还集成了 Louvain 社区发现算法,能自动识别出知识集群。

004:图谱洞察

这是 LLM Wiki 最具价值的部分之一。

图片5:图谱洞察
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

系统会自动分析图谱结构,提供两种洞察:

  1. 意外关联:系统会识别出跨社区、跨类型、意料之外的连接,往往成为认知突破的起点。
  2. 知识缺口:系统会找出几乎没有连接的孤立页面、内部交叉引用太少的稀疏社区、同时连接三个以上集群的桥接节点。

每个缺口旁边都有深度研究按钮,点击后,LLM 会自动上网搜索相关资料,并生成一篇研究页面,直接写入 Wiki。研究页面还会自动触发录入流程,提取新的实体和概念,整合到已有的知识网络中。

005:深度研究

当系统发现知识缺口后,LLM 会自动生成搜索关键词,调用 Tavily API 去网上搜索。

图片6:深度研究
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

  1. 相当于您的知识库会自行发现缺口,并上网查资料补全。
  2. 触发深度研究时,LLM 会先读取 overview.md 和 purpose.md 文件,了解知识库的主题,然后生成针对性的搜索词。
  3. 搜索前会弹出确认框,您可修改搜索主题和搜索词,确认后再开始搜索。

006:Chrome 网页剪藏

LLM Wiki 提供了专门的 Chrome 扩展,方便用户在浏览器中剪藏文章。

图片7:Chrome 网页剪藏
LLM Wiki:打造个人Wiki知识库,AI助你高效学习

  1. 剪藏的内容会自动发送到本地应用,触发录入流程,成为 Wiki 的一部分。
  2. 支持多项目选择,可剪藏到不同的知识库。
  3. 即使应用未开启,扩展也能预览提取的内容,并在打开应用后自动同步。

007:上手教程

开源地址https://github.com/nashsu/llm_wiki/releases/tag/v0.3.13

  1. 启动应用,创建新项目,可选场景模板,如研究、阅读、个人成长、商业、通用等。
  2. 在设置中配置大模型,支持 OpenAI、Anthropic、Google、Ollama,也可自定义接口。
  3. 导入文档,支持 PDF、Word、Markdown、Excel 等格式。
  4. 观察 LLM 自动构建 Wiki 页面。
  5. 使用 Chat 提问,浏览知识图谱。

Chrome 扩展安装

  1. 打开 chrome://extensions,开启开发者模式。
  2. 加载已解压的扩展程序,选择项目中的 extension/ 目录。
收藏