共计 5045 个字符,预计需要花费 13 分钟才能阅读完成。
这段时间一直在用 [[Claude Code]] 和 [[Gemini CLI]] 这类命令行 AI 工具写代码,效率确实提升了不少。但用久了也发现一些不太方便的地方:想看 AI 生成的 Markdown 渲染效果得切到编辑器,查看历史对话要往上翻好几屏,同时跑多个任务时终端窗口就乱成一团。虽然作为常年泡在终端里的开发者,这些都能忍,但总觉得应该有更优雅的解决方案。
直到发现了 AionUI 这个开源项目,才意识到原来有人已经在认真解决这个问题了。它不是要取代命令行工具,而是给这些工具加上一层图形化的"外壳",让你既能享受 CLI 的灵活性,又能获得 GUI 的直观体验。更让我惊讶的是,这个项目在 GitHub 上已经积累了 29K stars,而且还在快速迭代,v2.1 版本甚至把核心后端用 Rust 重写了——这个量级的社区认可,已经不能用"小项目"来形容。
为什么命令行 AI 工具需要图形界面
在聊 AionUI 之前,我想先说说为什么 CLI AI 工具需要一个图形界面。很多人可能会觉得,既然选择了 CLI 工具,就应该接受它的全部特性,包括那些不太方便的地方。但实际使用中我发现,CLI 和 GUI 并不是对立的,而是可以互补的。命令行工具的优势在于灵活性和可编程性,你可以精确控制每一个参数,可以和其他工具无缝集成;但它的劣势也很明显——缺乏可视化的反馈,难以管理复杂的多 Agent 状态,无法直观地预览文件内容,更不可能在离开电脑的时候随时掌握进度。
AionUI 的思路是:保留 CLI 工具的所有能力,但在上面加一层图形界面来弥补这些短板。你依然可以用命令行的方式和 AI 交互,但多了一个可视化的窗口来查看结果、管理对话、调度任务、远程监控。这种"混合模式"在实际使用中特别顺手,尤其是当你同时运行三四个 Agent 处理不同任务的时候,AionUI 的价值就开始真正显现。
自动检测与统一管理 20+ Agent
AionUI 最核心的能力是多 Agent 的统一管理。它能自动检测你本地安装的各种 CLI AI 工具,包括 [[Claude Code]]、[[Codex]]、[[Gemini CLI]]、OpenCode、OpenClaw、Goose、GitHub Copilot、Kimi CLI 等超过 20 种运行时,然后把它们都集成到同一个界面里。你可以随时切换使用哪个 Agent,甚至可以让不同的 Agent 协作完成同一个复杂任务,每个 Agent 运行在自己的窗口中,侧边栏实时显示各个 Agent 的状态(running、idle、done)。
我实际测试的场景是这样的:我用 Claude Code 写代码,同时让 Gemini CLI 做技术调研,Codex 负责写单元测试。在 AionUI 里,这个切换过程非常流畅,所有的上下文都保留在各自的对话窗口里。更重要的是,我不需要记住每个工具的命令格式和参数,AionUI 会处理这些细节。有个细节让我印象深刻:AionUI 会自动识别本地已经安装的 CLI 工具,并读取它们的配置文件。比如我之前已经配置好了 Claude Code 的 API Key,AionUI 启动后直接就能用,不需要重新配置——这种无缝集成体验,体现了开发者对用户习惯的尊重。
20 多个内置专属助手
这是最近版本带来的、原来我没太注意到的一大亮点。AionUI 不只是一个 CLI 工具的 GUI 包装,它还内置了 20 多个面向不同业务场景的专属助手,每个助手都有自己专精的领域。Patrick 专注于幻灯片制作,Emily 擅长 Excel 数据处理,Warren 能做 DCF 模型和财务预测,Albert 专门写学术论文,Stella 做 UI/UX 设计,Marco 制作动态演示文稿,甚至还有 Max 能用一段提示词生成一个完整的 3D 小游戏。
这些助手和直接用 Claude 或 Gemini 对话最大的区别在于它们是经过专门调优的,内置了对应领域的 System Prompt 和工作流。比如让 Emily 处理数据时,她会自动建立数据透视表、生成图表、清洗异常值,而不是等你一步步告诉她该做什么。对于非技术背景的用户来说,这些助手能让他们完全绕过"怎么写好提示词"这个门槛,直接开始工作。当然,我更多时候还是直接用 Claude Code 或者 Gemini CLI 这些 CLI 工具,但处理 PPT 汇报材料的时候,Patrick 真的帮了我不少忙。
Skills 市场:社区驱动的功能扩展
除了内置助手,AionUI 还开放了 Skills 市场,允许社区分享和安装自定义技能包。从 v2.1.9 开始,Skills Hub 支持从文件夹、父目录、SKILL.md 文件或 zip 压缩包导入技能,安装后立即可用。这个机制和浏览器扩展商店的逻辑很像——基础产品提供平台,社区决定功能的边界往哪里延伸。
我在 Skills 市场里找到了一些很实用的技能包,比如专门调教用于代码审查的提示流程、针对特定编程语言的最佳实践模板、还有一些专为特定业务场景定制的工作流。如果这些都不够用,你还可以自己写 SKILL.md 创建技能,分享给社区。这种开放的生态是商业软件无法比拟的优势——用户的需求直接驱动功能扩展,而不是等产品团队排期。
统一 MCP 配置:配一次处处可用
[[MCP]](Model Context Protocol)这个概念最近越来越热,各种 AI 工具都在接入 MCP 服务器来扩展能力。但以前的痛点是:每个 CLI 工具都要分别配置一遍 MCP,Claude Code 的 MCP 配置和 Gemini CLI 的不共享,改起来费时费力。AionUI 的统一 MCP 功能彻底解决了这个问题:你只需要在 AionUI 里添加一次 MCP 服务器,它会自动同步到所有接入的 Agent,不需要每个 Agent 单独配置。
这个功能对于我来说是体验提升最明显的地方之一。我在 AionUI 里配好了本地的 SQLite MCP 服务器和 Filesystem MCP,之后不管是用 Claude Code 还是 Gemini CLI,都能直接调用这些工具,不用再翻各自的配置文档。这种"配置一处,全局生效"的体验,在团队协作里会更加有价值——团队管理员配好一套标准 MCP 环境,所有成员安装 AionUI 后就自动继承这套配置。
本地生成 Office 文件,数据不离机
AionUI 内置的 Office 文件生成能力是另一个让我觉得"这才是对的方向"的功能。它支持在本地直接生成 PPT、Excel、Word 和 PDF,完全不需要上传到任何云端服务,文件全程在你自己的机器上处理。这在处理敏感数据的场景下特别重要——财务模型、内部汇报、公司代码都不会经过任何第三方服务器。
结合专属助手使用效果很好。比如让 Warren 做一份 DCF 估值模型,它会直接在本地生成一个格式规范的 Excel 文件,表格结构、公式链接、图表都已经就位,我只需要填入实际数据。或者让 Patrick 把一份大纲转成幻灯片,出来的就是可以直接打开的 PPTX 文件,不是某个网页链接。这种"AI 输出可直接使用的文件"的体验,比让 AI 写内容然后自己排版要顺畅得多。
24/7 自动化调度:定时任务让 Agent 不间断工作
这个功能我在初次使用时没太注意,但后来发现它可能是最有实用价值的功能之一。AionUI 支持用 cron 表达式为 Agent 设置定时任务,比如每天早上 9 点自动做一次代码审查、每周一生成上周工作总结、每天晚上 11 点备份项目文件——设置好之后,即便你不在电脑前,Agent 也会按时执行。任务面板里清楚地显示每个任务的状态(Active/Running/Paused)和下次执行时间,看起来就像一个轻量级的本地 CI/CD 面板。
我目前用得比较多的是每天晚上让 Claude Code 跑一遍单元测试并生成摘要,第二天早上我打开电脑,一眼就能看到昨晚测试结果。虽然这件事用 cron + 脚本也能实现,但集成在 AionUI 里的配置体验要简单得多,而且结果直接在对话界面里呈现,不需要再去翻日志文件。对于需要长时间运行任务的场景,比如爬数据、批量处理文件、定期生成报告,这个功能的价值就更加突出了。
远程控制:离开电脑也能管
AionUI 的远程控制支持通过 Telegram、微信、飞书、钉钉或内置 WebUI 向 Agent 发送指令,Agent 在你的电脑上继续运行,你在手机上就能查看进度、发送新任务。这个功能和上面提到的 24/7 自动化结合起来特别有用:你出门开会,临时想到需要让 AI 再查一个问题,拿出手机发条消息给 Telegram bot,Agent 马上开始处理,不需要回到电脑前。
我的实际使用场景:书房台式机配置比较高,负责跑本地大模型和 CLI Agent;出门时用手机通过 Telegram 发指令,回来后台式机上已经完成了任务,结果在对话记录里等着我。这种"离开了但 AI 没停"的工作方式,有点像以前用 tmux 保持终端会话,但体验要友好得多。
v2.1 架构升级:Rust 后端带来的变化
v2.1 是 AionUI 历史上最大的架构变更。核心后端(AionCore)从 Electron 里抽离出来,用 Rust(Axum + Tokio + sqlx + rustls)完全重写为独立服务,以单个原生二进制文件的形式分发,6 种平台构建(macOS/Linux/Windows,各含 x64 和 arm64),二进制文件大小在 27MB 到 55MB 之间,小到可以跑在树莓派或者 NAS 上。
这个架构拆分带来了一个很有趣的可能性:同一套 AionCore 后端,既可以嵌入桌面客户端透明运行,也可以作为独立服务跑在服务器上,让浏览器 WebUI 作为客户端连接。换句话说,以前 AionUI 是纯粹的单机应用,现在它既可以是桌面程序,也可以是团队共享的 AI 工作台服务。这对于有多台机器、希望统一管理 AI Agent 的用户来说,打开了很多新的玩法空间。
安装与配置体验
安装过程非常简单。去 GitHub Releases 页面下载对应系统的安装包,Windows 是 exe,macOS 是 dmg,Linux 是 AppImage 或 deb 包。首次启动时,AionUI 会自动扫描系统,检测已安装的 CLI AI 工具,并读取它们的配置,几乎不需要额外设置就能开始用。
如果还没有安装任何 CLI 工具,在设置界面直接输入各个模型的 API Key 也可以——AionUI 会在后台直接调用 API,你不需要关心底层实现。我在 macOS 和 Windows 两个系统上都试了一下,体验基本一致。对于不太熟悉命令行的用户,20 多个内置助手可以让他们完全不碰任何 CLI 工具,直接开始用 AI 处理日常工作,这种零门槛体验是 AionUI 区别于其他 CLI 工具 GUI 方案的重要特点。
与其他方案的对比
从定位上来看,AionUI 比单纯的代码编辑器 AI 插件(Cursor、Copilot)宽得多,也比只支持单一模型的 Claude Desktop 灵活得多。Cursor 和 Copilot 主要帮开发者写代码,Claude Desktop 只能用一个模型,而 AionUI 是一个更宽泛的"AI 工作台"——Claude、GPT、Gemini 可以并行运行,相互协作;助手覆盖 PPT、Excel、写作、设计、游戏开发等场景,不只面向程序员;技能市场让功能边界可以持续扩展。和 [[CCCC]] 这类专注于 Agent 间协调调度的工具相比,AionUI 更像是面向终端用户的"一站式工作台",而 CCCC 更偏向开发者构建复杂多 Agent 工作流的基础设施层。
29K stars 的社区规模也说明 AionUI 已经过了早期验证阶段,生态在快速成熟。我在 GitHub Issues 里看到开发者的响应速度很快,大多数 bug 在一两个版本内就修复了,这对于选择一个工具的长期可靠性很重要。
最后
用了一段时间 AionUI 下来,最大的感受是它找到了一个很准的定位:不试图取代 CLI 工具,不想成为新的 AI 模型,而是在现有这些强大工具之上,搭建一个统一的"工作台"。多 Agent 协作、内置专属助手、Skills 市场、统一 MCP 配置、24/7 自动化调度、IM 远程控制——这些功能加在一起,让多 Agent 协作从"需要写脚本才能用"变成了"打开 App 就能用"。
当然,作为一个还在快速迭代的开源项目,AionUI 也有需要改进的地方。对话历史比较多的时候,搜索和加载会有一点卡顿(v2.1 的 Rust 后端应该能缓解这个问题),部分功能的文档还不够完善,团队协作模式还在逐步打磨中。但这也正是开源项目的魅力所在——你可以参与进去,提需求、提 PR,和开发者一起把它做得更好。如果你也在大量使用 AI 编程工具,或者想把 AI 真正融入日常工作流,AionUI 值得花半小时认真试一试。
