自建隐私优先的 AI 搜索引擎 Vane 体验

4次阅读
没有评论

共计 2328 个字符,预计需要花费 6 分钟才能阅读完成。

自建隐私优先的 AI 搜索引擎 Vane 体验

[[Perplexity AI]] 是我用了很长时间的 AI 搜索工具,它把联网搜索和 LLM 的问答能力结合得相当好,搜索结果带引用、有摘要、可以追问,体验比传统搜索引擎直观很多。但它有一个挥之不去的隐患:你输入的每一个问题都发送给了一家商业公司,搜索历史、兴趣偏好、甚至一些敏感的查询意图都在别人的服务器上留存。这种感觉不太好,尤其是在涉及工作或个人研究时。直到发现 Vane,才算找到了一个让我可以在自己机器上跑起来的替代方案。

什么是 Vane

Vane 是一个隐私优先的开源 AI 问答引擎,GitHub 上目前积累了超过 35000 颗星,代码库几乎全是 TypeScript,基于 [[Next.js]] 全栈构建。它的定位很清楚:在你自己的硬件上运行,把 Web 搜索能力和本地或云端的大语言模型结合起来,给出有来源引用的回答。简单说,就是一个你可以自己掌控的 Perplexity。

和 Perplexity 的核心区别在于数据流向。Vane 的搜索请求通过 [[SearxNG]] 这个开源隐私搜索引擎发出,不会直接暴露给 Google 或必应;LLM 部分可以完全跑在本地,用 [[Ollama]] 驱动任何你想要的开源模型,也可以接入 OpenAI、Anthropic Claude、Google Gemini、Groq 等云端服务。一切都是可配置的,数据留在哪里、走哪条链路,你说了算。

核心功能拆解

Vane 的功能设计相当完整,并不是一个粗糙的概念验证项目,而是日常可用的程度。

搜索模式提供了三档选择:速度优先、均衡、质量优先,背后对应不同的搜索深度和模型推理强度。日常快速查个事实用速度模式,研究性的深度问题切到质量模式,AI 会拉取更多来源、做更完整的综合。

信息来源也可以按类型过滤,包括普通网页、论坛讨论(比如 Reddit)和学术论文三种模式。如果你在研究一个技术问题,想看社区真实经验而不是 SEO 优化过的文章,切到讨论模式会很有帮助;写报告需要学术引用,就开学术模式。

除了问答,Vane 还内置了一些小工具(Widgets):天气查询、计算器、股价查询、快速信息卡片,这些功能让它可以作为一个浏览器的默认搜索引擎来使用,日常查询都可以走它。媒体搜索支持图片和视频结果,文件上传支持 PDF、文本文件和图片,可以对本地文档发起问答,这在处理研究资料时挺实用。

域名过滤(Domain Filtering)是个有意思的功能,你可以限制 Vane 只从特定网站获取信息。比如只搜索某个技术文档站、只看官方来源,这种颗粒度的控制在 Perplexity 免费版里是没有的。

安装部署

Docker 是最省事的安装方式,SearxNG 已经打包在镜像里,一条命令就能跑起来:

docker run -d -p 3000:3000 -v vane-data:/home/vane/data --name vane itzcrazykns1337/vane:latest

启动后访问 http://localhost:3000,不需要额外配置 SearxNG。如果你已经有自己运行的 SearxNG 实例,可以用 slim 镜像,体积更小:

docker run -d -p 3000:3000 -e SEARXNG_API_URL=http://your-searxng-url:8080 \
  -v vane-data:/home/vane/data --name vane itzcrazykns1337/vane:slim-latest

如果不想用 Docker,也可以直接 clone 仓库手动构建,但需要自己准备 SearxNG 并启用 JSON 格式输出。对大多数人来说 Docker 方式更简单。

接入 [[Ollama]] 做本地 LLM 有一个常见坑要注意:在 Docker 内部,localhost 指的是容器自身,不是宿主机。Windows 和 Mac 上应该用 http://host.docker.internal:11434 访问 Ollama;Linux 上需要用宿主机的私有 IP 地址,不能用 127.0.0.1。另外,本地的 OpenAI 兼容 API 服务(比如 [[LM Studio]] 或 [[vLLM]])必须绑定到 0.0.0.0 而不是 127.0.0.1,否则容器内无法访问。

一旦跑起来,还可以把它设为浏览器的搜索引擎。在浏览器搜索引擎设置里添加自定义搜索引擎,URL 填 http://localhost:3000/?q=%s,之后地址栏输入关键词就能直接调用 Vane。

几点使用感受

我在本地跑了一段时间,整体体验比我预期的好。Next.js 全栈架构让界面响应很快,搜索结果的引用展示也做得比较清晰,点击引用可以直接跳转到原始页面,这点和 Perplexity 的体验相当。

使用本地 Ollama 模型时,回答质量自然和所用模型的能力挂钩。如果机器配置不够强,推理速度会拖慢整体体验,这时候接入 Groq 的免费 API 是个不错的折中——搜索隐私通过本地 SearxNG 保护,模型推理走速度极快的 Groq 云端,两头都不太亏。

Discover Feed 功能可以浏览热门文章,本地搜索历史也会保存,让它更接近一个完整的搜索引擎体验而不只是一个问答窗口。未来版本计划加入自定义 Agent 创建和完整的用户认证系统,功能边界还在扩展。

最后

Vane 是目前自托管 AI 搜索引擎里完成度最高的选项之一。如果你手边有一台可以常驻运行的机器(NAS、家用服务器、闲置小主机都行),想要一个不把查询记录发给第三方的 AI 搜索工具,Vane 值得认真试试。配上本地 Ollama 和 SearxNG,从搜索到推理可以做到完全离线,对隐私敏感的使用场景非常合适。当然,如果对回答质量有更高要求,接入 Claude 或 GPT 的 API 也只需要填个 Key,灵活度是 Perplexity 给不了的。

正文完
 0
评论(没有评论)