自建隐私优先的 AI 搜索引擎 Vane 体验

137次阅读

共计 2328 个字符，预计需要花费 6 分钟才能阅读完成。

[[Perplexity AI]] 是我用了很长时间的 AI 搜索工具，它把联网搜索和 LLM 的问答能力结合得相当好，搜索结果带引用、有摘要、可以追问，体验比传统搜索引擎直观很多。但它有一个挥之不去的隐患：你输入的每一个问题都发送给了一家商业公司，搜索历史、兴趣偏好、甚至一些敏感的查询意图都在别人的服务器上留存。这种感觉不太好，尤其是在涉及工作或个人研究时。直到发现 Vane，才算找到了一个让我可以在自己机器上跑起来的替代方案。

什么是 Vane

Vane 是一个隐私优先的开源 AI 问答引擎，GitHub 上目前积累了超过 35000 颗星，代码库几乎全是 TypeScript，基于 [[Next.js]] 全栈构建。它的定位很清楚：在你自己的硬件上运行，把 Web 搜索能力和本地或云端的大语言模型结合起来，给出有来源引用的回答。简单说，就是一个你可以自己掌控的 Perplexity。

和 Perplexity 的核心区别在于数据流向。Vane 的搜索请求通过 [[SearxNG]] 这个开源隐私搜索引擎发出，不会直接暴露给 Google 或必应；LLM 部分可以完全跑在本地，用 [[Ollama]] 驱动任何你想要的开源模型，也可以接入 OpenAI、Anthropic Claude、Google Gemini、Groq 等云端服务。一切都是可配置的，数据留在哪里、走哪条链路，你说了算。

核心功能拆解

Vane 的功能设计相当完整，并不是一个粗糙的概念验证项目，而是日常可用的程度。

搜索模式提供了三档选择：速度优先、均衡、质量优先，背后对应不同的搜索深度和模型推理强度。日常快速查个事实用速度模式，研究性的深度问题切到质量模式，AI 会拉取更多来源、做更完整的综合。

信息来源也可以按类型过滤，包括普通网页、论坛讨论（比如 Reddit）和学术论文三种模式。如果你在研究一个技术问题，想看社区真实经验而不是 SEO 优化过的文章，切到讨论模式会很有帮助；写报告需要学术引用，就开学术模式。

除了问答，Vane 还内置了一些小工具（Widgets）：天气查询、计算器、股价查询、快速信息卡片，这些功能让它可以作为一个浏览器的默认搜索引擎来使用，日常查询都可以走它。媒体搜索支持图片和视频结果，文件上传支持 PDF、文本文件和图片，可以对本地文档发起问答，这在处理研究资料时挺实用。

域名过滤（Domain Filtering）是个有意思的功能，你可以限制 Vane 只从特定网站获取信息。比如只搜索某个技术文档站、只看官方来源，这种颗粒度的控制在 Perplexity 免费版里是没有的。

安装部署

Docker 是最省事的安装方式，SearxNG 已经打包在镜像里，一条命令就能跑起来：

docker run -d -p 3000:3000 -v vane-data:/home/vane/data --name vane itzcrazykns1337/vane:latest

启动后访问 http://localhost:3000，不需要额外配置 SearxNG。如果你已经有自己运行的 SearxNG 实例，可以用 slim 镜像，体积更小：

docker run -d -p 3000:3000 -e SEARXNG_API_URL=http://your-searxng-url:8080 \
  -v vane-data:/home/vane/data --name vane itzcrazykns1337/vane:slim-latest

如果不想用 Docker，也可以直接 clone 仓库手动构建，但需要自己准备 SearxNG 并启用 JSON 格式输出。对大多数人来说 Docker 方式更简单。

接入 [[Ollama]] 做本地 LLM 有一个常见坑要注意：在 Docker 内部，localhost 指的是容器自身，不是宿主机。Windows 和 Mac 上应该用 http://host.docker.internal:11434 访问 Ollama；Linux 上需要用宿主机的私有 IP 地址，不能用 127.0.0.1。另外，本地的 OpenAI 兼容 API 服务（比如 [[LM Studio]] 或 [[vLLM]]）必须绑定到 0.0.0.0 而不是 127.0.0.1，否则容器内无法访问。

一旦跑起来，还可以把它设为浏览器的搜索引擎。在浏览器搜索引擎设置里添加自定义搜索引擎，URL 填 http://localhost:3000/?q=%s，之后地址栏输入关键词就能直接调用 Vane。

几点使用感受

我在本地跑了一段时间，整体体验比我预期的好。Next.js 全栈架构让界面响应很快，搜索结果的引用展示也做得比较清晰，点击引用可以直接跳转到原始页面，这点和 Perplexity 的体验相当。

使用本地 Ollama 模型时，回答质量自然和所用模型的能力挂钩。如果机器配置不够强，推理速度会拖慢整体体验，这时候接入 Groq 的免费 API 是个不错的折中——搜索隐私通过本地 SearxNG 保护，模型推理走速度极快的 Groq 云端，两头都不太亏。

Discover Feed 功能可以浏览热门文章，本地搜索历史也会保存，让它更接近一个完整的搜索引擎体验而不只是一个问答窗口。未来版本计划加入自定义 Agent 创建和完整的用户认证系统，功能边界还在扩展。

最后

Vane 是目前自托管 AI 搜索引擎里完成度最高的选项之一。如果你手边有一台可以常驻运行的机器（NAS、家用服务器、闲置小主机都行），想要一个不把查询记录发给第三方的 AI 搜索工具，Vane 值得认真试试。配上本地 Ollama 和 SearxNG，从搜索到推理可以做到完全离线，对隐私敏感的使用场景非常合适。当然，如果对回答质量有更高要求，接入 Claude 或 GPT 的 API 也只需要填个 Key，灵活度是 Perplexity 给不了的。

正文完