SenseCAP Watcher：主动问候你的 AI 助手

Imagine this

想象一下：当你步入书房，桌上的 SenseCAP Watcher 立即感知到你的到来。屏幕亮起，它微笑着向你致意，并显示出今天的待办事项——无需你开口，甚至不需要任何操作。

SenseCAP Watcher，正重新定义人与设备的交互方式。

它具备独特的“无感触发”对话能力，可在你靠近时主动发起交互。这不仅是一次技术升级，更是一种交互逻辑的根本转变：主动权首次由人移交至机器，实现了从“人适应机器”到“机器主动适应人”的体验跨越。

Watcher 的“慧眼”依托于强大的端侧 AI 视觉芯片（Himax），使其能够在本机快速完成物体识别与目标追踪。结合可扩展的小智助手固件，它不止是一枚摄像头，更是一位可持续进化、懂你所需的专属AI助手。

核心优势

SenseCAP Watcher

一款集端侧AI视觉与灵活开发环境于一身的智能设备，旨在帮助你轻松构建与部署个性化AI应用。

离线运行的“火眼金睛”：高效端侧视觉处理
搭载高性能 AI 视觉芯片（Himax），所有图像处理均在设备本地完成。响应迅捷，同时更好地保护您的隐私——数据无需上传至云端。
零代码构建 AI 应用，像搭乐高一样简单
借助 SenseCraft AI 平台，只需鼠标点点操作即可部署AI模型，快速搭建适用于特定场景的应用程序。AI 模型部署变得如修图般轻松，完全无需编程基础。
灵活集成平台与工具
基于小智 MCP 架构，可自由定义新的 AI 工具，并快速接入本地或云端服务，无缝融入现有智能系统。
硬件可扩展：额外接口支持
提供 GPIO 扩展接口，可轻松连接各类传感器与执行器，实现深度定制，支持更多创意落地。

工作原理

SenseCAP Watcher 可视为一个“模块化”的智能机器人，其核心由三大组件协同运作：

硬件核心（ESP32S3）：驱动底层硬件，处理摄像头数据，并稳定连接云端服务。
视觉神经（Himax AI 芯片）：强大的端侧AI视觉处理单元，赋予设备实时环境感知能力。
云端大脑（后台服务）：负责AI角色设定、MCP工具调度与设备统一管理。

整个过程可简化为：

Watcher 的“眼睛”（摄像头）捕捉图像 → “视觉神经”（Himax 芯片）进行识别、唤醒小智 → “大脑”（后台 AI、MCP 服务）理解情境并做出响应。

这种模块化设计带来高度的灵活性与扩展性。

使用指南

三步快速上手

只需三步，即可激活你的 Watcher：

启动设备：通过 Type-C 数据线供电；若使用电池，长按侧边按键开机。
连接网络：设备启动后将生成一个 Wi-Fi 热点，使用手机或电脑连接此热点。｜「Watcher 网络配置」
配置与激活：在浏览器中访问 192.168.4.1，为 Watcher 配置 Wi-Fi，并按照指引在 SenseCraft AI 平台上完成激活。｜「Watcher Web 控制台」

激活提示

若无法成功激活，请确认验证码填写正确且设备鉴权信息未丢失。以下操作通常会导致鉴权信息丢失：

固件被其他程序覆盖。
进行大版本固件更新前未备份鉴权信息。
刷写了全新的固件。

如需重新激活，请将设备的 STA Mac 地址（可从串口日志中获取）发送至 [email protected] 获取协助。请参阅：烧录认证信息。

您可以通过以下视频观看详细教程：

模型及固件更新：定制专属技能

开发者或高级用户可通过烧录不同的模型或固件，为 Watcher 赋予更强大的专属能力。

1. 烧录 AI 模型

借助内置的 Himax 端侧 AI 视觉芯片，您可以通过 SenseCraft AI 平台轻松部署新的识别模型：

将电脑连接至 Watcher 底部的 Type-C 接口。
在 SenseCraft AI 平台中选择 Workspace 下的 SenseCAP Watcher，并选择序列号较小的端口进行模型烧录。
烧录完成后若摄像头未正常工作，请尝试重启设备。

2. 烧录 XiaoZhi 固件

SenseCraft AI
单文件烧录（推荐）
从源码编译（开发者适用）

最新固件 v1.8.8：下载地址

解压下载的固件包，使用 esptool.py 工具执行烧录：

esptool.py -p /dev/ttyACM0 -b 2000000 write_flash 0 merged-binary.bin

需提前配置好 IDF 工具链环境，并克隆代码仓库：GitHub 仓库

在项目根目录下执行以下命令：

cd xiaozhi-esp32
idf.py --set-target esp32s3
idf.py menuconfig  # 在图形化界面中选择板卡类型为 SenseCAP Watcher
idf.py build flash monitor

开始对话

现在您已对 SenseCAP Watcher 的基本使用有了初步了解，接下来可以探索其对话与工具调用能力，例如调用摄像头功能或设置主动交互的时间策略。

例如我的角色名字设置为Watcher，设置如下：

唤醒设备

设备在没有唤醒时，会保存待机的状态，从而不会监听周围的对话。当设备被唤醒后，它会开始监听周围的对话，并进行对话或者根据用户指令执行相应的操作。

视觉唤醒
语音唤醒
按键唤醒

目前的视觉唤醒功能提供以下配置选项：

检测目标编号 (target)：指定待检测的目标编号。该编号取决于所使用的视觉模型，默认值为 0。
检测持续时间 (duration)：单位为秒，用于调节视觉唤醒的灵敏度。默认值为 1 秒（该默认值未包含 1 秒防抖处理）。
置信度阈值 (threshold)：视觉模型识别物体的置信度下限，用于调节模型检测灵敏度。以百分比表示，默认值为 75%。
冷却时间 (interval)：单位为秒，表示一次对话结束后再次触发前所需等待的时间，用于避免物体触发频繁打断。默认值为 8 秒。

例如，你可以通过修改 threshold 参数来调整模型的灵敏度。例如你觉得当前的阈值设置，太严格了，你只需要对 Watcher 说：“请设置置信度阈值为 60%”。

调用摄像头

对着 Watcher 说：

请打开摄像头
你看看你能看到什么?
你面前有什么东西？

资源

以下是一些进阶资源，帮助您根据自身需求进一步拓展 SenseCAP Watcher 的应用边界，无论是在本地化部署、隐私保护还是构建个性化知识库方面，都能找到对应的实现方案：

AI 对话驱动全屋智能 - 通过 SenseCAP Watcher 直接语音控制灯光、空调、窗帘等智能家居设备，彻底告别手动操作。

引用

SenseCAP Watcher 硬件概述 - SenseCAP Watcher 的硬件资源、结构设计等
SenseCAP Watcher 操作指南 - SenseCAP Watcher 如何进行开机、关机的基本逻辑
SenseCAP Watcher 端侧视觉模型训练 - SenseCAP Watcher 端侧视觉模型训练指南，包括数据准备、模型训练和部署等步骤。
SenseCAP Watcher - 网页控制面板
SenseCAP Watcher - 设备网络设置指南

核心优势​

SenseCAP Watcher

离线运行的“火眼金睛”：高效端侧视觉处理

零代码构建 AI 应用，像搭乐高一样简单

灵活集成平台与工具

硬件可扩展：额外接口支持

工作原理​

使用指南​

三步快速上手​

模型及固件更新：定制专属技能​

1. 烧录 AI 模型​

2. 烧录 XiaoZhi 固件​

开始对话​

唤醒设备​

调用摄像头​

资源​

引用​