首次启动

这一页带你完成小万的首次启动和基础配置。先不用急着打开所有功能，第一遍重点确认这些事情：

应用能正常启动
基础权限已经补齐
远端模型可以调用
场景模型已经绑定
工作区目录初始化完成
聊天页能完成一次最小执行链路

如果某一步没有通过，先停在当前步骤排查，不建议直接跳到技能、MCP 或本地模型。

第 1 步：安装并打开应用

先下载适合当前设备的安装包：

GitHub Release: https://github.com/omnimind-ai/OpenOmniBot/releases

CNB，国内网络优先： https://cnb.cool/o.a/OpenOmniBot/-/releases

当前发布包通常会有两类：

标准版：体积更轻，适合先跑通远端模型、聊天、权限和工作区。
带本地推理能力的版本：包含端侧模型推理相关能力，适合后续验证本地模型。

后续应用内自动更新会保持你当前安装的包类型。如果想在两种包之间切换，手动安装另一种包覆盖一次即可。

apk

如果你是在开发环境安装，可以使用下面的命令：

bash

./gradlew :app:installDevelopStandardDebug -Ptarget=lib/main_standard.dart
./gradlew :app:installDevelopOmniinferDebug -Ptarget=lib/main_omniinfer.dart

建议第一次使用先装标准版，把远端模型和执行链路跑通后，再切到本地推理版本。这样出问题时更容易判断是模型、权限、工作区，还是本地推理环境导致的。

第 2 步：等待首次初始化完成

首次打开小万后，会看到欢迎页面，同时应用会在后台准备 Alpine 运行环境、工作区目录和默认配置。

这一步建议：

保持应用在前台，不要立刻切后台或清理进程。
如果系统弹出通知、后台运行、悬浮窗等授权提示，先允许进入对应设置页。
等到可以正常进入聊天页、设置页或授权页后，再继续配置模型。

初始化完成后的表现通常是：

应用不再反复停留在欢迎或初始化页面
设置页可以打开
授权页可以看到各项权限状态
工作区相关页面后续可以正常显示目录

如果一直卡在初始化，优先检查设备存储空间、网络状态和系统是否限制了后台服务。

第 3 步：补齐核心权限

小万不是单纯聊天应用，它要读取屏幕、执行点击、输入文字、打开文件、展示悬浮操作层，所以权限是执行能力的基础。首次启动时建议先打开授权页，把下面四项优先开齐：

权限	用途	没开时的常见表现
后台运行权限	降低系统回收概率，让任务和陪伴流程更稳定	任务执行到一半中断，切后台后容易失联
悬浮窗权限	在其他应用上方显示操作层、状态层或浏览器叠层	能理解任务，但看不到执行层或无法接管界面
应用列表读取	识别设备上有哪些目标应用可以操作	让它打开某个 App 时找不到或判断错误
无障碍辅助权限	执行点击、输入、滚动、读取界面树	只能回答文字，不能真正操作手机

然后再根据你要用的能力补充这些权限：

通知：用于任务状态、提醒、前台服务提示。
Shizuku：用于部分进阶系统能力，不是首次跑通的硬依赖。
存储 / 文件相关权限：用于工作区、附件、文件选择和生成物访问。
日历与精确闹钟：用于提醒、定时任务和未来执行。
录音或媒体权限：用于语音输入、截图、媒体读取等扩展场景。

WARNING

如果无障碍和悬浮窗没开，很多问题会表现成“小万听懂了，但就是不动”。这时先回到授权页看权限状态，不要急着改模型配置。

第 4 步：配置模型提供商

权限补齐后，进入设置里的模型提供商，先创建一个 Provider Profile。

如果你接的是兼容 OpenAI 协议的服务，选择 OpenAI-compatible。
如果你用的是 Claude / Anthropic 体系，选择 Anthropic。

一个 Profile 通常需要填写：

名称：方便你区分不同服务商或不同用途。
Base URL：服务商提供的 API 地址。兼容 OpenAI 的服务通常需要写到 /v1 这一层，具体以服务商文档为准。
API Key：注意不要带多余空格。
可用模型 ID：模型名要和服务商实际暴露的 ID 完全一致。

设置 AI 能力

配置提供商

如果页面支持同步远端模型，可以先同步一次；如果同步失败，就手动填写模型 ID。首次启动阶段不建议同时接太多服务商，先用一个稳定的远端模型把主流程跑通。

常见配置问题：

Base URL 少了 /v1 或多了一段路径。
API Key 复制时带了空格或换行。
模型 ID 写成了展示名，而不是接口实际使用的 ID。
使用了只支持文本的模型去承担视觉操作场景。

第 5 步：绑定场景模型

创建 Provider 只是告诉小万“有哪些模型可用”，还需要把模型绑定到具体场景。进入 场景模型配置 后，可以看到当前版本按场景列出了 Agent、Voice、Operation、Compactor、Chat Compactor、Loading、Memory Embed 和 Memory Rollup。

每一行右侧都是模型选择按钮，点击后可以按 Provider 搜索、折叠并选择具体模型。还没有单独绑定的场景会继续使用默认模型，所以第一次配置不用把所有项都调到最细，先保证主链路能跑通。

场景	建议选择	作用
`Agent`	稳定的强推理模型	理解用户任务、规划步骤、调度工具
`Voice`	适合语音输出链路的模型或默认模型	处理语音回复相关能力；音色和自动播放可展开调整
`Operation`	支持视觉 / UI 操作的多模态模型	判断屏幕内容并决定点击、输入、滚动等动作
`Compactor`	快速、成本较低的总结模型	压缩通用上下文，避免长任务越跑越慢
`Chat Compactor`	快速、稳定的聊天总结模型	压缩聊天上下文，让长对话保持可继续性
`Loading`	默认模型或轻量模型	支撑加载、等待或过渡状态中的模型调用
`Memory Embed`	真正的 embedding 模型	生成向量，用于记忆和工作区检索
`Memory Rollup`	成本较低的总结模型	整理长期记忆和阶段性摘要

如果你只有一个稳定的大模型，可以先把 Agent、Voice、Operation、Compactor、Chat Compactor、Loading 和 Memory Rollup 都绑定到它，用来验证基础流程。Memory Embed 尽量单独配置 embedding 模型，因为普通聊天模型通常不能替代它。

配置场景模型

第一次配置时，最重要的是让 Agent 和 Operation 可用。前者决定小万能不能理解和规划，后者决定它能不能看懂屏幕并执行手机操作。语音能力不是首次跑通的硬依赖，如果暂时不用语音，可以先保持 Voice 默认配置，等基础链路稳定后再调整音色和自动播放。

第 6 步：检查工作区环境

小万会在本地维护工作区，用来保存附件、生成物、浏览器数据、记忆和模型资产。首次启动后，进入工作区页面，顶部路径应显示为 /workspace，下方能看到 .omnibot 目录。

展开 .omnibot 后，正常情况下会看到这些目录：

text

/workspace
└── .omnibot/
    ├── agent/
    ├── attachments/
    ├── browser/
    ├── memory/
    ├── models/
    ├── offloads/
    ├── pets/
    └── shared/

建议确认：

工作区页面能打开。
路径显示为 /workspace。
.omnibot/ 可以展开。
agent、attachments、browser、memory、models、offloads、pets、shared 这些目录已经生成。
没有持续的初始化失败提示。

如果工作区打不开，或 .omnibot 目录迟迟没有生成，先检查存储权限和首次初始化状态。工作区没有准备好时，附件、记忆、浏览器数据、本地模型和部分文件处理能力都会受影响。

第 7 步：验证一次最小执行链路

现在不要急着测试复杂自动化，先在聊天页做一个最小任务。推荐从不依赖外部 App 的任务开始：

输入一个简单请求。
观察是否出现工具活动、执行卡片或状态变化。
看回复是否能结合当前页面、工作区或权限状态。
如果请求涉及手机操作，观察无障碍和悬浮窗是否真的被调用。

第 8 步：再逐步启用增强能力

基础链路跑通后，再逐个开启更强的能力：

本地模型
技能商店
定时任务
本地 MCP 服务
远端 MCP 工具
WebChat 或 Browser Mirror

建议一次只开启一类能力，并做一次小验证。比如先安装一个轻量技能，再验证工作区；先开启本地 MCP，再访问健康检查；先下载一个本地模型，再测试模型服务状态。

这样小万出了问题时，你会知道最近改变了哪一层。

下一步建议看模型与场景配置，继续细化远端模型、本地模型和各场景的分工。

首次启动 ​

第 1 步：安装并打开应用 ​

第 2 步：等待首次初始化完成 ​

第 3 步：补齐核心权限 ​

第 4 步：配置模型提供商 ​

第 5 步：绑定场景模型 ​

第 6 步：检查工作区环境 ​

第 7 步：验证一次最小执行链路 ​

推荐验证任务 ​

第 8 步：再逐步启用增强能力 ​