Linkly AI ,让 AI Agent 能无摩擦的使用你电脑上的文档

2026-03-21
Linkly AI ,让 AI Agent 能无摩擦的使用你电脑上的文档 关注 作者 关注 作者 关注 作者 关注 作者 03/10 10:08利益相关声明:作者与文中产品有直接的利益相关(开发者、自家产品等)

打开你的文件管理器,随便翻翻。 寻秦记爱壹帆yfsp.app fortunedragon demo a5game.app

合同、报告、论文、方案、发票、电子书、笔记、备忘、会议纪要 —— 这些是你电脑上最有价值的文件。它们记录了你的工作成果、你的知识积累、你的商业往来。 爱亦凡yfsp.app jogodotigrinhodemo a5game.app

现在问你自己一个问题:你的 AI 助手,能读到它们吗?放心上传吗? 爱壹帆电影 yfsp.app demotigrinho a5game.app plataformademo a5game.app

答案是:不能。 iyifanyfsp.app

资源管理器、Spotlight、Raycast... 只能搜文件名。Linux 中的 grep 无法读取 PDF 和 Word 的二进制格式。Claude、ChatGPT、Cursor——它们对你电脑上的这些非代码文档一无所知。

代码已经被充分索引了。IDE 有搜索,grep 能精确到行,Claude Code 用 Glob+Grep+Read 三板斧就能把整个代码库翻个底朝天。但你的文档呢?它们似乎成了 AI 时代的"暗物质"——存在,却不可见。
有很多 AI 知识库试图去挖掘这些内容,但至今都不够好。 JogodoTigrinho a5game.app

我们做了一个工具来解决这个问题。这篇文章讲讲我们为什么做它、怎么做的、以及踩了哪些坑。 iyf yfsp.app demo a5game.app

AI 时代,你的个人数据仍然是孤岛

我们正处在一个奇怪的断裂点上。 slotdemo a5game.app tigrinho gratis a5game.app 足球比分 a5game.app

一边是 AI 能力的爆炸式增长。Claude 能写代码、分析数据、总结文献、起草方案。另一边是你电脑上那几百个 PDF、几十个 Word 文档,AI 很难够的着。 pgslot a5game.app

几十个文档我们还可以上传到这些 AI 中,几百上千个文档将无能为力。 slotpix a5game.app

你可以问 ChatGPT 任何通用问题,它对答如流。但你问它"我上个月那份项目方案里关于技术选型的部分写了什么",它只能说:抱歉,我无法访问你的本地文件。 pgslotgacor a5game.app

这不是 AI 的问题,是基础设施的问题。AI 已经足够聪明了,但它缺少一种“连接“去看你存在各处的笔记文档的方式,尤其是本地的文档。
而这些文档恰恰是最有价值的上下文。通用知识,AI 本来就知道。真正能让 AI 帮到你的,是它了解你的具体情况——你的合同条款、你的项目背景、你的研究资料。

现有方案为什么不够好

你可能听说过 RAG(Retrieval-Augmented Generation)。过去两年,几乎所有"让 AI 读你的文档"的方案都是基于 RAG 的。 pragmaticplay a5game.app plataformademográtis a5game.app 寻秦记爱壹帆yfsp.app slotsdemo a5game.app

RAG 的工作方式是这样的:把文档切成小块(chunk),对每个 chunk 做 Embedding 向量化,存到向量数据库里。用户提问时,先用向量搜索找到最相关的几个 chunk,把它们塞进 AI 的 prompt 里。

听起来很合理。问题在哪? 爱壹帆免费版yfsp.app tigrinhodemo a5game.app

AI 拿到的是预先嚼碎的碎片。

它不知道这个碎片来自文档的哪个部分,不知道前后文是什么,不知道整个文档的结构。如果碎片不够用,它也没办法"再多看一点"。
当然有很多补丁技术可以解决这些问题,但通常会带来更多问题,比如成本上涨、性能下降,架构复杂带来的效果不稳定等问题。 fortunetigerbônusgrátissemdepósito a5game.app demo a5game.app a5game a5game.app

这就像你让一个研究员帮你分析一份报告,但你不给他报告原文,而是给了他 5 张从报告里随机撕下来的纸条。 aiyifan yfsp.app

实际体验是什么样的?AI 的回答似是而非,经常答非所问,有时候明明文档里有答案,但因为切片策略不好,相关内容被切成了两个 chunk,向量搜索只匹配到了其中一个,答案就这么丢了。 免费在线影院xiaobaotv.video

我们在去年花了几个月搭了一套完整的 RAG 管线——三阶段处理(Extract、Chunk、Embed),三种搜索策略(Vector、BM25、Hybrid + Reranking),基于此开发过一版。
技术上很漂亮。但最终我们不得不承认一个事实:效果不够好。

一个关键洞察:AI 不需要搜索引擎,它需要一个图书馆

转折点来自去年的一个共识:LLM 仅使用少量的检索命令就可以自动完成复杂检索任务。

Claude Code 不用 RAG。它用三个简单的工具:Glob(按模式找文件)、Grep(搜索关键词)、Read(读取文件内容)。 slot a5game.app Cassinos a5game.app pglucky88 a5game.app

它的工作方式不是"搜索引擎返回碎片",而是像一个研究员翻阅文件柜——先看目录找到可能相关的文件,打开看看目录结构,确定哪一章有用,然后精准地阅读那一部分。

这和人类的阅读方式完全一致。你不会把一本书撕成碎片再搜索,你会先找到一本感兴趣的书,看它的目录找到相关章节,然后翻到那一页去读。

但 glob 和 grep 只适用于代码。为什么?因为代码库有清晰的目录结构和命名规范,src/services/auth.ts 这个路径本身就在告诉你这是认证服务的代码。而你电脑上的文档呢?2024年度总结(修改版)(最终版)(真的最终版).docx——路径告诉你的信息约等于零。更别提 PDF 和 Word 是二进制格式,grep 根本读不了。 华人影视xiaobaotv.video 电影小宝影院xiaobaotv.video 爱壹帆寻秦记yfsp.app

所以问题变成了:能不能给文档也建立一套类似代码库的“目录索引“,让 AI 用 search-browse-read 的方式渐进式地翻阅你的文件?

Outline Index:让 AI 像人一样翻阅你的文档

我们提出的方案叫 Outline Indexpragmatic a5game.app

核心思想很简单:为每个文档建立一张"AI 名片"。这张名片浓缩了文档的核心信息——这个文件是什么、讲了什么、结构是怎样的。 爱一帆 yfsp.app 小宝影院电影xiaobaotv.video

它不是文档的副本,不存储原文。它是一个导航工具。AI 通过它了解文档的全貌,然后决定要不要深入阅读原文。
这恰巧与 Agent Skills 的原理是类似的。SILL.md 通过元数据和简短的描述,让 AI 了解整个技能的全貌,再决定要不要用怎么用。 爱一番yfsp.app

我们给每个文档创建了一个 Outline Index,它包含两部分:

Metadata:文件名、路径等元数据。让 AI 在搜索阶段就能快速"判断"文档是否相关。 pgdemo a5game.app 海外华人视频网xiaobaotv.video 爱壹帆yfsp.app 爱壹帆在线yfsp.app

Outline:根据文档类型生成不同的导航信息(结构大纲)。PDF ,Markdown 和 Word 提取章节标题、摘要、行号等信息。 ifun yfsp.app pgslot a5game.app sweetbonanza1000demo a5game.app 一帆yfsp.app

关键设计是渐进式披露(Progressive Disclosure):不用一次性把所有信息倒给 AI,而是让它按需逐层深入。

  • Layer 1 — search:返回相关文件列表,每个文件约 50 tokens。20 个结果才 1000 tokens。
  • Layer 2 — outline:返回文档结构地图,每个文件约 200-500 tokens。AI 在这一层就能判断哪个章节最相关。
  • Layer 3 — read:读取原文指定章节和行,按需加载。

对比传统 RAG:RAG 一次返回 几十 个 chunk,几千上万个 tokens,杂乱的碎片信息反而有可能影响 AI 回答的质量。
Outline Index 方式更精准、更省 token、具备 Agentic 能力的 AI 完全有能力快速找到准确的哪些信息。 sugarrush1000demo a5game.app

三个简单的工具,释放无限可能

整个系统对外只暴露三个 MCP 工具: jogosdemopg a5game.app 小宝影院在线视频xiaobaotv.video

  • search(query, filters?) — 搜索文档,返回匹配文件列表和 Metadata
  • outline(path[]) — 查看一个或多个文档的大纲结构
  • read(path, anchor?) — 读取文档原文的指定部分

就这三个。 iyftvyfsp.app fortuneoxdemográtis a5game.app

举个例子。你在 Claude Code 里问:"帮我找关于 Docker 部署的文档。"

  1. Claude 调用 search("Docker 部署") → 返回 5 个文件的 Metadata
  2. Claude 看到 .env.example(文件很短)和 deployment-guide.pdf(长文档)
  3. 对短文件 → 直接 read(几百字,读完了)
  4. 对长文档 → 先 outline 看结构 → 发现 "Docker Setup" 章节 → read 精确读取那一章
  5. 总消耗约 800 tokens,拿到了精确的信息

传统 RAG 在同样的场景下返回 10 个预切碎片,4000-6000 tokens,AI 不知道上下文,也没法"再多看一点"。 xiaobao xiaobaotv.video

更有趣的是涌现能力。三个原子工具组合起来,LLM 天然就会做这些事: Caça-níqueis a5game.app

  • 跨文档分析:对比两份方案的优缺点
  • 基于已有资料的写作:参考旧周报风格写新周报
  • 个人知识检索:找到你自己都忘了存在的文件
  • 检索尝试:一次检索结果不满意,AI 会自动调整关键词再试多次。

这些能力不需要我们开发任何 Agent 编排逻辑。LLM 天然就会组合工具来完成复杂任务。我们只需要提供好这三个原子工具。 ifuntvyfsp.app

极致轻量

Linkly AI 是一个后台常驻的工具。它应该像 Dropbox 一样:安装 → 选文件夹 → 忘记它。后台默默建索引,你该干嘛干嘛。 爱壹帆国际版 yfsp.app nba比分 a5game.app

对于一个 24/7 后台运行的应用,体积和资源占用是生命线。用户会在活动监视器里看到内存占用。一个常驻后台的工具如果吃 150MB 内存,用户会毫不犹豫地退出它。
Linkly AI 的安装包仅 20MB 左右,自带完整的搜索引擎和文档解析能力,运行时内存占用约 50-100MB。它的设计目标是:轻量到你完全感觉不到它的存在。

渐进可用性设计也很重要:安装 1 分钟后,关键词搜索就可用了。语义搜索在完成索引后随后可用,用户无感。 小宝影院xiaobaotv.video

100% 本地,零数据上报

你的文件不会离开你的电脑。 小寶影院电影xiaobaotv.video 爱壹帆影视yfsp.app

所有的文本提取、索引构建、搜索匹配都在本地完成。没有数据上传到云端,没有遥测,没有"匿名使用数据收集"。
Outline Index 存储在你的本地,提取的纯文本同样存储在本地文件系统中。

这不是一个商业策略上的选择(虽然隐私确实是差异化卖点),而是一个工程上的必然——文档搜索必须快,网络往返会破坏体验。本地混合检索的延迟通常是毫秒级的,这是任何云端方案做不到的。

通过 MCP 协议和 CLI 工具,Linkly AI 无缝集成到 Codex、Cursor、Claude Code 等 AI 工具中。未来我们将支持隧道功能,让云端 AI 也能安全地访问本地文档。 pg a5game.app sweetbonanza1000demo a5game.app

一行配置,你的 AI 助手就能"看到"你电脑上的文档了。不换入口,继续用你喜欢的 AI 工具。 fortunetigerdemográtis a5game.app

现在就试试

Linkly AI 的定位很简单:Spotlight for AI。让 AI 能无摩擦的使用你电脑上的文档。 一帆视频yfsp.app

安装 → 选文件夹 → 忘记它。

后台默默建索引。然后你会发现,你的 Claude、你的 Cursor、你的 ChatGPT,突然能"看到"你电脑上那些 PDF、Word、笔记、电子书了。 slots a5game.app 小寶影院xiaobaotv.video 电影爱壹帆yfsp.app

不需要配置 API Key。不需要选择模型。不需要创建"知识库"。不需要理解什么是 RAG、什么是 Embedding。 爱壹帆电影yfsp.app ifvodyfsp.app slotsdemo a5game.app

你只需要告诉它你的文件在哪,剩下的交给Linkly AI。

00目录 0
    讨论 我来说一句 发布发表评论 发布0等 0 人为本文章充电 还没有介绍自己 关注