Skip to content

首次启动

这一页带你完成小万的首次启动和基础配置。先不用急着打开所有功能,第一遍重点确认这些事情:

  • 应用能正常启动
  • 基础权限已经补齐
  • 远端模型可以调用
  • 场景模型已经绑定
  • 工作区目录初始化完成
  • 聊天页能完成一次最小执行链路

如果某一步没有通过,先停在当前步骤排查,不建议直接跳到技能、MCP 或本地模型。

第 1 步:安装并打开应用

先下载适合当前设备的安装包:

GitHub Release: https://github.com/omnimind-ai/OpenOmniBot/releases

CNB,国内网络优先: https://cnb.cool/o.a/OpenOmniBot/-/releases

当前发布包通常会有两类:

  • 标准版:体积更轻,适合先跑通远端模型、聊天、权限和工作区。
  • 带本地推理能力的版本:包含端侧模型推理相关能力,适合后续验证本地模型。

后续应用内自动更新会保持你当前安装的包类型。如果想在两种包之间切换,手动安装另一种包覆盖一次即可。

apk

如果你是在开发环境安装,可以使用下面的命令:

bash
./gradlew :app:installDevelopStandardDebug -Ptarget=lib/main_standard.dart
./gradlew :app:installDevelopOmniinferDebug -Ptarget=lib/main_omniinfer.dart

建议第一次使用先装标准版,把远端模型和执行链路跑通后,再切到本地推理版本。这样出问题时更容易判断是模型、权限、工作区,还是本地推理环境导致的。

第 2 步:等待首次初始化完成

首次打开小万后,会看到欢迎页面,同时应用会在后台准备 Alpine 运行环境、工作区目录和默认配置。

welcome

这一步建议:

  1. 保持应用在前台,不要立刻切后台或清理进程。
  2. 如果系统弹出通知、后台运行、悬浮窗等授权提示,先允许进入对应设置页。
  3. 等到可以正常进入聊天页、设置页或授权页后,再继续配置模型。

初始化完成后的表现通常是:

  • 应用不再反复停留在欢迎或初始化页面
  • 设置页可以打开
  • 授权页可以看到各项权限状态
  • 工作区相关页面后续可以正常显示目录

如果一直卡在初始化,优先检查设备存储空间、网络状态和系统是否限制了后台服务。

第 3 步:补齐核心权限

小万不是单纯聊天应用,它要读取屏幕、执行点击、输入文字、打开文件、展示悬浮操作层,所以权限是执行能力的基础。首次启动时建议先打开授权页,把下面四项优先开齐:

权限用途没开时的常见表现
后台运行权限降低系统回收概率,让任务和陪伴流程更稳定任务执行到一半中断,切后台后容易失联
悬浮窗权限在其他应用上方显示操作层、状态层或浏览器叠层能理解任务,但看不到执行层或无法接管界面
应用列表读取识别设备上有哪些目标应用可以操作让它打开某个 App 时找不到或判断错误
无障碍辅助权限执行点击、输入、滚动、读取界面树只能回答文字,不能真正操作手机

然后再根据你要用的能力补充这些权限:

  • 通知:用于任务状态、提醒、前台服务提示。
  • Shizuku:用于部分进阶系统能力,不是首次跑通的硬依赖。
  • 存储 / 文件相关权限:用于工作区、附件、文件选择和生成物访问。
  • 日历与精确闹钟:用于提醒、定时任务和未来执行。
  • 录音或媒体权限:用于语音输入、截图、媒体读取等扩展场景。

WARNING

如果无障碍和悬浮窗没开,很多问题会表现成“小万听懂了,但就是不动”。这时先回到授权页看权限状态,不要急着改模型配置。

第 4 步:配置模型提供商

权限补齐后,进入设置里的模型提供商,先创建一个 Provider Profile。

  • 如果你接的是兼容 OpenAI 协议的服务,选择 OpenAI-compatible
  • 如果你用的是 Claude / Anthropic 体系,选择 Anthropic

一个 Profile 通常需要填写:

  • 名称:方便你区分不同服务商或不同用途。
  • Base URL:服务商提供的 API 地址。兼容 OpenAI 的服务通常需要写到 /v1 这一层,具体以服务商文档为准。
  • API Key:注意不要带多余空格。
  • 可用模型 ID:模型名要和服务商实际暴露的 ID 完全一致。

设置 AI 能力

配置提供商

如果页面支持同步远端模型,可以先同步一次;如果同步失败,就手动填写模型 ID。首次启动阶段不建议同时接太多服务商,先用一个稳定的远端模型把主流程跑通。

常见配置问题:

  • Base URL 少了 /v1 或多了一段路径。
  • API Key 复制时带了空格或换行。
  • 模型 ID 写成了展示名,而不是接口实际使用的 ID。
  • 使用了只支持文本的模型去承担视觉操作场景。

第 5 步:绑定场景模型

创建 Provider 只是告诉小万“有哪些模型可用”,还需要把模型绑定到具体场景。进入 场景模型配置 后,可以看到当前版本按场景列出了 AgentVoiceOperationCompactorChat CompactorLoadingMemory EmbedMemory Rollup

每一行右侧都是模型选择按钮,点击后可以按 Provider 搜索、折叠并选择具体模型。还没有单独绑定的场景会继续使用默认模型,所以第一次配置不用把所有项都调到最细,先保证主链路能跑通。

场景建议选择作用
Agent稳定的强推理模型理解用户任务、规划步骤、调度工具
Voice适合语音输出链路的模型或默认模型处理语音回复相关能力;音色和自动播放可展开调整
Operation支持视觉 / UI 操作的多模态模型判断屏幕内容并决定点击、输入、滚动等动作
Compactor快速、成本较低的总结模型压缩通用上下文,避免长任务越跑越慢
Chat Compactor快速、稳定的聊天总结模型压缩聊天上下文,让长对话保持可继续性
Loading默认模型或轻量模型支撑加载、等待或过渡状态中的模型调用
Memory Embed真正的 embedding 模型生成向量,用于记忆和工作区检索
Memory Rollup成本较低的总结模型整理长期记忆和阶段性摘要

如果你只有一个稳定的大模型,可以先把 AgentVoiceOperationCompactorChat CompactorLoadingMemory Rollup 都绑定到它,用来验证基础流程。Memory Embed 尽量单独配置 embedding 模型,因为普通聊天模型通常不能替代它。

配置场景模型

第一次配置时,最重要的是让 AgentOperation 可用。前者决定小万能不能理解和规划,后者决定它能不能看懂屏幕并执行手机操作。语音能力不是首次跑通的硬依赖,如果暂时不用语音,可以先保持 Voice 默认配置,等基础链路稳定后再调整音色和自动播放。

第 6 步:检查工作区环境

小万会在本地维护工作区,用来保存附件、生成物、浏览器数据、记忆和模型资产。首次启动后,进入工作区页面,顶部路径应显示为 /workspace,下方能看到 .omnibot 目录。

展开 .omnibot 后,正常情况下会看到这些目录:

text
/workspace
└── .omnibot/
    ├── agent/
    ├── attachments/
    ├── browser/
    ├── memory/
    ├── models/
    ├── offloads/
    ├── pets/
    └── shared/

建议确认:

  • 工作区页面能打开。
  • 路径显示为 /workspace
  • .omnibot/ 可以展开。
  • agentattachmentsbrowsermemorymodelsoffloadspetsshared 这些目录已经生成。
  • 没有持续的初始化失败提示。

如果工作区打不开,或 .omnibot 目录迟迟没有生成,先检查存储权限和首次初始化状态。工作区没有准备好时,附件、记忆、浏览器数据、本地模型和部分文件处理能力都会受影响。

第 7 步:验证一次最小执行链路

现在不要急着测试复杂自动化,先在聊天页做一个最小任务。推荐从不依赖外部 App 的任务开始:

  1. 输入一个简单请求。
  2. 观察是否出现工具活动、执行卡片或状态变化。
  3. 看回复是否能结合当前页面、工作区或权限状态。
  4. 如果请求涉及手机操作,观察无障碍和悬浮窗是否真的被调用。

推荐验证任务

  • “帮我总结当前页面可以做什么。”
  • “打开工作区看看有哪些文件。”
  • “列出已经安装的技能。”
  • “检查一下当前小万有哪些权限还没打开。”

一次成功的最小链路通常会表现为:小万能理解任务,能调用对应工具或页面能力,最后给出和当前设备状态一致的结果。

如果它能正常聊天但不会执行,优先排查 Operation 场景模型、无障碍权限和悬浮窗权限。如果它连回复都失败,优先排查 Provider、API Key、Base URL 和 Agent 场景绑定。

第 8 步:再逐步启用增强能力

基础链路跑通后,再逐个开启更强的能力:

  • 本地模型
  • 技能商店
  • 定时任务
  • 本地 MCP 服务
  • 远端 MCP 工具
  • WebChat 或 Browser Mirror

建议一次只开启一类能力,并做一次小验证。比如先安装一个轻量技能,再验证工作区;先开启本地 MCP,再访问健康检查;先下载一个本地模型,再测试模型服务状态。

这样小万出了问题时,你会知道最近改变了哪一层。

下一步建议看 模型与场景配置,继续细化远端模型、本地模型和各场景的分工。

Built with VitePress. 文档内容以当前仓库代码为准。