LLM Wiki:用LLM当知识工程师,打造个人Wiki知识库
图片1:LLM Wiki 项目介绍

一篇关于 Karpathy 知识库构想的文章,介绍了如何利用 LLM(大型语言模型)作为知识工程师,帮助用户持续维护一个 Markdown 知识库。文章指出,在 GitHub 上已有基于此理念的具体实现项目。其中,一个名为 LLM Wiki 的项目引起了广泛关注,已收获超过 3300 个 Star。
图片2:LLM Wiki 项目界面

LLM Wiki 并非简单的命令行工具或 Claude Code Skill,它直接打造了一个跨平台的桌面应用,功能丰富,远超 Karpathy 原版 Gist 的设想。以下是这个开源项目的详细解析。
001:一句话介绍LLM Wiki
LLM Wiki 是一个跨平台桌面应用,将您的文档导入后,自动生成结构化的、互相链接的个人 Wiki 知识库。
图片3:LLM Wiki 功能介绍

与传统的 RAG 方案不同,LLM Wiki 不再每次提问时都从原始文档重新检索。它首先让 LLM 通读文档,生成 Wiki 页面、建立交叉引用、标注矛盾点,后续提问则直接在 Wiki 上进行。知识库仅需编译一次,便能持续保持最新状态。
开源地址:https://github.com/nashsu/llm_wiki
002:两步链式思考录入
这是 LLM Wiki 最核心的设计之一。项目将原版 Gist 的一步录入拆分为两步:
第一步:分析
LLM 首先通读文档,提取关键实体、概念、论点,寻找与已有 Wiki 内容的关联,发现矛盾和张力,然后给出结构化的分析结果。
第二步:生成
- LLM 根据“分析”结果,开始编写 Wiki 页面。生成摘要页、实体页、概念页,更新索引,建立交叉引用,标注需要人工判断的事项。
- 这种两步设计让 LLM 在动手前先思考清楚,从而提升质量。
- 每个来源的录入可能牵动 10 到 15 个 Wiki 页面的更新。LLM 会自动将新知识与已有知识网络串联起来。
- 项目还包含 SHA256 增量缓存功能,对未改动的文件自动跳过处理,节省 token 和时间。
- 持久化队列的设计也让项目更加稳定,即使崩溃重启也能继续运行,失败自动重试 3 次。活动面板可实时查看每个文件的处理进度。
003:知识图谱可视化
LLM Wiki 相比原版 Gist,不仅提供了用 wikilinks 做交叉引用的功能,还打造了一个完整的知识图谱可视化和关联引擎。
图片4:知识图谱可视化

它通过以下四个维度衡量两个 Wiki 页面之间的关联程度:
- 直接链接(权重 x3.0):页面之间有 wikilinks 直接引用。
- 来源重叠(权重 x4.0):两个页面引用了同一个原始文档。
- Adamic-Adar(权重 x1.5):两个页面有共同邻居,共同邻居越稀有关联性越强。
- 类型亲和度(权重 x1.0):同类型页面有额外加分。
可视化采用 sigma.js + ForceAtlas2 布局。节点颜色可按页面类型或社区聚类进行着色,节点大小按链接数量缩放。鼠标悬停时,关联节点保持高亮,其他节点变暗,并显示关联分数。项目还集成了 Louvain 社区发现算法,能自动识别出知识集群。
004:图谱洞察
这是 LLM Wiki 最具价值的部分之一。
图片5:图谱洞察

系统会自动分析图谱结构,提供两种洞察:
- 意外关联:系统会识别出跨社区、跨类型、意料之外的连接,往往成为认知突破的起点。
- 知识缺口:系统会找出几乎没有连接的孤立页面、内部交叉引用太少的稀疏社区、同时连接三个以上集群的桥接节点。
每个缺口旁边都有深度研究按钮,点击后,LLM 会自动上网搜索相关资料,并生成一篇研究页面,直接写入 Wiki。研究页面还会自动触发录入流程,提取新的实体和概念,整合到已有的知识网络中。
005:深度研究
当系统发现知识缺口后,LLM 会自动生成搜索关键词,调用 Tavily API 去网上搜索。
图片6:深度研究

- 相当于您的知识库会自行发现缺口,并上网查资料补全。
- 触发深度研究时,LLM 会先读取 overview.md 和 purpose.md 文件,了解知识库的主题,然后生成针对性的搜索词。
- 搜索前会弹出确认框,您可修改搜索主题和搜索词,确认后再开始搜索。
006:Chrome 网页剪藏
LLM Wiki 提供了专门的 Chrome 扩展,方便用户在浏览器中剪藏文章。
图片7:Chrome 网页剪藏

- 剪藏的内容会自动发送到本地应用,触发录入流程,成为 Wiki 的一部分。
- 支持多项目选择,可剪藏到不同的知识库。
- 即使应用未开启,扩展也能预览提取的内容,并在打开应用后自动同步。
007:上手教程
开源地址:https://github.com/nashsu/llm_wiki/releases/tag/v0.3.13
- 启动应用,创建新项目,可选场景模板,如研究、阅读、个人成长、商业、通用等。
- 在设置中配置大模型,支持 OpenAI、Anthropic、Google、Ollama,也可自定义接口。
- 导入文档,支持 PDF、Word、Markdown、Excel 等格式。
- 观察 LLM 自动构建 Wiki 页面。
- 使用 Chat 提问,浏览知识图谱。
Chrome 扩展安装:
- 打开 chrome://extensions,开启开发者模式。
- 加载已解压的扩展程序,选择项目中的 extension/ 目录。

请登录后发表评论
注册
社交账号登录
停留在世界边缘,与之惜别