AI 搜索你的所有笔记!思源笔记 +Cursor+MCP Server——打造你的个人专属 AI 资料库!(AI 大模型搜索笔记、内容总结、大纲凝练、RAG 搜索)

news/2025/2/27 15:15:56/文章来源:https://www.cnblogs.com/zinyy/p/18741018

AI 搜索你的所有笔记!思源笔记 +Cursor+MCP Server

——打造你的个人专属 AI 资料库!(AI 大模型搜索笔记、内容总结、大纲凝练、RAG 搜索)

前排提示:本文撰写于 2025 年 2 月,仅仅离 Anthropic 发布的 MCP 协议过去不到 3 个月,因此本文很多接入 MCP 的方式还略显复杂。笔者相信,未来 MCP 协议一定会发展的越来越壮大和方便,届时使用和配置 MCP 也会越来越简单。

总览

AI & 大模型最近的发展那可是一飞冲天,不知道大家看到 Notion 和 Obsidian 能用 AI (主要是 RAG) 实现个人知识库的搜索+总结馋了没有。作为一个 AI 相关专业的学生,我可是馋的不得了,苦苦搜寻几个月啊。奈何社区还没有人发布思源专属的 RAG 插件,也只好作罢。

最近,随着 MCP (Model Context Protocol) 协议的发布,Cursor (一个非常好用的 AI 编辑器,可以看作 AI 版的 VSCode) 迅速支持了 MCP Server,因此支持了对 sqlite 数据集的 AI 查询和调用!

诶嘿,这不巧了?思源可不就是把笔记全都存储在一个 sqlite 数据库里的吗?舒服了!立刻开始学习如何配置。用了大概半小时的简单配置,轻松就实现了如下的效果:

AI 可以轻松的访问所有笔记内容,并且进行内容的查找和凝练!

并且,个人感觉这个效果是要比 RAG 要好的,因为是把 AI 当做 agent,自行搜索笔记内容。要比 RAG 里孱弱的 embedding 灵活、强大的多。

如果有人有兴趣,我详细写一下 SiYuan+Cursor MCP 如何配置&使用!


2025.02.27 更新:

OK,那我开始详细介绍一下思源笔记 + MCP 的配置和使用。

MCP 是什么?

MCP 是 Model Context Protocol 的缩写,即"模型上下文协议",是 Anthropic (大名鼎鼎的 Claude 的开发公司) 在 2024 年 11 月推出的一个强大协议。那么它有什么作用呢?

简单来说,MCP 就是大模型时代的 USB 接口!

想象一下,在没有 USB 接口之前,每个设备都需要不同的接口和连接方式 - 打印机用一种接口,键盘用另一种接口,鼠标又是另一种。USB 的出现统一了这些接口,让所有设备都能用同一种方式连接。

MCP 在 AI 时代扮演着类似的角色。在 MCP 出现之前,如果你想让 AI 访问不同的数据源(比如数据库、文件系统、API),每次都需要专门开发不同的集成方案。而有了 MCP,让 AI 访问不同类型的资源,就像插入 U 盘一样简单!:

  1. 🔌 统一接口:就像 USB 可以连接各种设备一样,MCP 让 AI 可以用统一的方式连接各种数据源和工具
  2. 🧠 智能交互:不只是简单的数据传输,AI 可以主动调用工具、查询数据,就像一个聪明的助手
  3. 🛠️ 工具扩展:开发者可以轻松为 AI 添加新的"工具",就像给电脑插上新的 USB 设备一样简单
  4. 🔒 安全可控:所有操作都在可控范围内进行,不会让 AI 做出危险的操作

更多有关 MCP 的内容可以了解Anthropic 的介绍和MCP 的官网。

思源笔记 + MCP 的配置

⚠️❗️ 注意! MCP 的接入方式有很多种(毕竟是一个开放的“协议”,而非某特定软件),笔者仅在这里介绍 Cursor 的接入方式(因为 Cursor 有一些特殊的方式可以“免费”)。

有很多商业软件已经支持 MCP 了(比如 Claude 的 Desktop 客户端,Cursor,Jetbrain 的 IDE,Cline);字节的 Trae 也官方说正在接入 MCP: Trae Issue 157;GitHub 也有很多 MCP 的开源实现。更多的对 MCP 的支持情况,可以查看MCP 的 GitHub repo以及MCP 的官网。

截至 2025 年 2 月,各个软件对 MCP 协议的支持情况如下:

可以看到,Cursor 其实对 MCP 的支持还是比较初步的(仅支持 Tools),不过已经够用啦!

大家可以参考 MCP 配置原理,用别的软件或开源实现轻松地将 MCP 接入思源笔记。

安装 Cursor,并且升级成为 Cursor Pro (或试用版,Pro Trial)

MCP (Model Context Protocol)本质上还是服务于 AI 大模型的一个协议,所以自然的,我们写得有能访问 AI 的软件!笔者这里选择 Cursor 这款软件,它可以理解为一个 AI 版的 VSCode。如果你有编写代码的需求,我强烈建议你了解一下。

关于 Cursor 的安装已经简介,网络上已经有了非常多的资料,大家可以在知乎/B 站/小红书自行了解。

注意,MCP 需要 Cursor Pro 才能使用。请自行付费购买(Cursor 也有很多白嫖的方法,大家可以自行搜索)。
OK!到这步,我们便拥有了访问各种大模型的能力。

安装 npm, uv

接下来就是接入 MCP 协议。MCP 依赖于 npm 和 uv,因此需要安装这些基础软件。

笔者使用的是 Mac,因此只提供 Mac 的安装方法。并且,笔者采用的是 homebrew 的安装方法,如果大家更习惯别的安装方式,可以参考Node.js 的官网选择不同的安装 npm 的方法。

# 首先需要安装homebrew: Download and install Homebrew
curl -o- https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh | bash# Download and install Node.js:
brew install node@22# Verify the Node.js version:
node -v # Should print "v22.14.0".
echo 'export PATH="/opt/homebrew/opt/node@22/bin:$PATH"' >> ~/.zshrc# Verify npm version:
npm -v # Should print "10.9.2".

还需要安装 uv,也是一行命令的事:

brew install uv

OK,最后一步就是下载 Anthropic 的 MCP Server 的 GitHub repo (其实我们只需要 MCP/sqlite 部分就可以,不过直接下载整个 repo 比较方便):

git clone https://github.com/modelcontextprotocol/servers

当然,如果你不会用 git,那直接下载 repo 的压缩包,然后解压,也是可以的......

恭喜你已经完成了所有需要下载的东西!

配置 MCP Server - SqLite 服务

最后,我们来配置 Cursor。打开右上角的设置 -> Feature Settings -> MCP Server,点击 Add new MCP server:

Name 可以随别写,Type 我们选Command,

底下的 Command,我们填入:

uv --directory /Users/XXXX/mcp-servers/src/sqlite run mcp-server-sqlite --db-path /Users/XXXX/SiYuanNote/temp/siyuan.db

⚠️❗️ 注意把 XXXX 换成你自己的路径,以及mcp-servers的文件夹对应位置也要修改成你的位置。

OK,所有步骤都完成了!

大功告成,开始使用!

  • ⚠️❗️ 首先,你需要用 Cursor 打开 siyuan.db 所在的文件夹!!! (这点比较重要,有时候不打开,似乎不会自动启用 MCP 协议)

  • 然后,使用快捷键command + i打开 Composer 窗口,左下角的模型记得选 Claude 家族的(笔者用的是 cluade-3.5-sonnet),就可以直接开始提问啦。

  • ⚠️❗️ 注意你得说点关键词让 Cursor 知道你要调用 MCP,比如根据我的思源笔记sqlite,帮我搜索XXXX

OK!Cursor 就会自动调用 MCP Server,并且主动查询你的思源笔记 sqlite 数据库了。

Why MCP?

很多人留言说,思源笔记数据库有自己的结构,以及思源笔记有自己的查找指令,是不是用上会更好?

笔者想说,MCP 的强大之处就在于,可以让 AI (其实已经是 AI agent 了) 自由地探索整个思源笔记 sqlite 数据库。其实不难发现,搜索的时候,AI 会自己先探索一遍数据库结构,然后尝试搜索不同的关键词,最后整合相关的 block,输出最终信息;这其实这比我们自己手动设计一些指令效果会好的多。

此外,之前笔记 AI 搜索的方式多为 RAG (Retrieval-Augmented Generation),即先通过 embedding 将笔记内容转换为向量,然后通过向量检索的方式找到相关的笔记内容,再通过 AI 生成最终的答案。笔者认为,MCP 的方式要比 RAG 的方式灵活、强大得多,因为 embedding 通常并不完全准确;而 MCP 的方式是把 sqlite 完全开放给 AI agent 探索,搜索会更加准确。

扩展?

能否开发基于 MCP 的插件呢?答案是当然可以,笔者相信随着 MCP 协议的普及,这件事也会变得越来越容易。但就当下来说,MCP 的门槛还是比较高的,并且消耗 LLM 的 token,因此笔者还是推荐 Cursor 这种能免费无限使用 Claude API 的软件来进行搜索 (免费才是王道哈哈)。

致谢

本篇 MCP 的配置和使用受该回答启发:https://www.zhihu.com/question/5290049088/answer/109400122988

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/890651.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM大模型:deepseek浅度解析(四):Native Sparse Attention NSA原理

deepseek又整活了啊,2025.2.16的时候又发布了 "Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention",核心是解决attention计算耗时耗算力的问题!NSA具体又是怎么做的了?回忆一下:attention效果好的核心原因,就是Q*K得到了tok…

聊一聊:Air8000能解决哪些社会问题?

Air8000能解决什么社会问题呢?当前我们认为可以解决如下的问题: 问题一 硬件:成本高,备货压力大,稳定性差 嵌入式的一些常用的功能,比如GPIO、4G、Wi-Fi、蓝牙、定位、充电、升压、处理器等等,是项目上常用的功能。 如果每个都是模块,组合起来成本不菲。 Air8000的定价…

Open开发:CSDK与LuatOS的深度剖析

究竟要不要支持CSDK开发? 我们先来了解一下4G模组的软件架构。目前,4G模组内部的软件架构无一例外都是用C语言开发的,仅在底层使用了少量汇编语言。 从技术角度看,让用户使用C语言开发应用似乎顺理成章。毕竟C语言功能强大,运行效率极高。 然而,C语言在物联网行业的应用存…

硒鼓内部结构示意图和功能说明

公司有一台惠普打印机,型号:HP Color LaserJet MFP M281fdw,更换硒鼓的成本是打印机最大的支出,最近在研究自己给墨盒加粉,直接买碳粉+芯片成本还是比较乐观的。 这里说明下,为什么要买芯片,买回来的一个全新的硒鼓是带有芯片的,然后装上打印机,可以看到该墨盒的使用情…

浅析Golang的内存管理(下篇):go垃圾回收机制

文章目录三色标记算法 混合写屏障 并发、增量回收机制 GC触发时机go语言作为内存托管类型的开发语言,go runtime提供了自动的内存管理机制,无需程序员手动管理对象的内存释放,go runtime会在合适的时机自动释放不需要的内存对象。 一、三色标记算法传统的内存对象标记算法早…

linux怎么判断服务器的cpu架构

在部署应用程序和服务时,确认服务器的CPU架构是非常重要的,因为这会直接影响软件的兼容性和性能。在Linux系统中,有许多方法可以获取服务器的CPU架构信息。本篇文章将介绍几种常用的方法,并提供代码示例,帮助用户有效地获取这个信息。 1. CPU架构的概念 CPU架构是指中央处…

vscode中不同项目使用不用的nodejs版本

只需要在vscode中当前项目里面增加一个设置

低代码在项目管理中的5大实战案例:不懂代码也能快速搭建系统!

作为项目管理领域的“老司机”,我见过太多团队因传统开发效率低、需求响应慢而错失机会。低代码平台的崛起,让业务人员也能快速搭建系统,大幅缩短交付周期。以下是5个典型场景的实践案例,用最通俗的语言讲透核心逻辑👇案例1:3天上线CRM系统(客户关系管理) 背景:某销售…

[字符串算法]Manacher

我将永远追随六花的脚步1.前置知识 回文子串  回文的子串 最长回文子串  字符串中最长的回文子串 回文半径  设以\(i\)为中心的最大回文子串的长度为\(n\),则这个字符串第\(i\)位的回文半径为\((n+1)/2\) 2.算法流程 2.1 预处理 在处理回文子串(马拉车算法适用)的问题时…

[数据结构]树

我最喜欢六花了树(基础) 1 定义 1.1 树是什么 树是一种数据结构,因为形似倒着的树而得名. 树是一种特殊图 1.2 树的定义 递归定义 1.2.1 有根树的定义 形象化的,如图1,有根树存在根节点这一定义,从根节点可以分出任意个分支,这任意个分支又可以继续细分,分出的节点称…

StrokesPlus【电脑鼠标键盘手势软件】v0.5.8.0 中文绿色便携版

点击上方蓝字关注我 前言 StrokesPlus.net是一个超方便的手势识别软件,它能帮你用手势来代替鼠标和键盘操作。用起来既简单又灵活,功能还特别强大。 操作起来非常简单,它有好多实用的功能,比如智能识别你写的字、设定手势操作的区域、模拟鼠标的各种动作、运行脚本、响应窗…

大模型推理主战场:什么才是通信协议标配?

关键词:# DeepSeek ;# SSE ;# WebSocketSSE 和 WebSocket 是什么? 大模型应用出现前的主流网络通信协议是什么? 为什么大模型应用没有沿用 Web 类应用的主流通信协议? 为什么 SSE 和 WebSocket 更适合支持大模型应用? 实时通信协议的技术挑战和应对方案 Whats Next?Dee…