Skip to main content

主动与世界互动的 AI 助手

想象一下

你走进书房,桌上的 SenseCAP Watcher 瞬间感知到你的存在。屏幕亮起,它微笑着向你问好,并显示今天的待办事项——无需你说一句话,甚至不用动一根手指。

SenseCAP Watcher 正在重新定义人与设备的交互方式。

它拥有独特的"无摩擦触发"对话能力,在你接近时主动发起交互。这不仅仅是技术升级,更是交互逻辑的根本性转变:首次实现了主动权从人转向机器,完成了从"人适应机器"到"机器主动适应人"的体验跃迁。

Watcher 的"敏锐之眼"由强大的**本地 AI 视觉芯片(Himax)**驱动,实现快速本地处理的物体识别和目标跟踪。结合可扩展的助手固件,它不仅仅是一台摄像头——而是一个不断进化、理解你需求的专属 AI 助手。

核心优势

SenseCAP Watcher

一款集成本地 AI 视觉和灵活开发环境的智能设备,旨在帮助您轻松构建和部署个性化 AI 应用。

  • 离线"敏锐之眼":高效的本地视觉处理

    配备高性能 AI 视觉芯片(Himax),所有图像处理均在设备本地完成。享受快速响应和增强的隐私保护——您的数据无需上传到云端。

  • 零代码构建 AI 应用,如乐高般简单

    利用 SenseCraft AI 平台部署 AI 模型,只需几次点击即可快速构建特定场景的应用。部署 AI 模型变得像图片编辑一样简单,完全不需要编程背景。

  • 灵活的集成平台和工具

    基于其灵活的 MCP 架构,您可以自由定义新的 AI 工具并快速集成本地或云服务,无缝融入现有的智能系统。

  • 硬件可扩展性:额外接口支持

    具备 GPIO 扩展接口,可轻松连接各种传感器和执行器,实现深度定制并支持更多创意实现。

工作原理

SenseCAP Watcher 可以被视为一个"模块化"的智能机器人,其核心运作依赖于三个主要组件的协作:

  1. 硬件核心(ESP32S3):驱动底层硬件,处理摄像头数据,并维持与云服务的稳定连接。
  2. 视觉神经(Himax AI 芯片):强大的本地 AI 视觉处理单元,赋予设备实时环境感知能力。
  3. 云端大脑(后端服务):负责 AI 角色配置、MCP 工具调度和统一设备管理。

该过程可以简化为:

Watcher 的"眼睛"(摄像头)捕获图像 → "视觉神经"(Himax 芯片)执行识别并唤醒助手 → "大脑"(后端 AI、MCP 服务)理解上下文并响应。

这种模块化设计提供了高度的灵活性和可扩展性。

watcher-chatbot-diagram

入门指南

三步快速开始

只需三步即可激活您的 Watcher:

  1. 设备上电:通过 Type-C 数据线供电;如使用电池,请长按侧面按钮开机。
  2. 连接网络:启动后,设备将生成 Wi-Fi 热点。将您的手机或电脑连接到此热点。| 「Watcher 网络设置
  3. 配置和激活:在浏览器中访问 192.168.4.1 为 Watcher 配置 Wi-Fi,并按照 SenseCraft AI 平台上的说明完成激活。| 「Watcher Web 控制面板
激活提示

如果激活失败,请确认验证码正确且设备认证信息未丢失。以下操作通常会导致认证信息丢失:

  1. 固件被其他程序覆盖。
  2. 执行了重大固件更新而未备份认证信息。
  3. 刷入了全新的固件。

如需重新激活,请将设备的 STA Mac 地址(可从串口日志获取)发送至 [email protected] 寻求帮助。请参考:刷入认证信息

您可以观看下面视频中的详细教程:

模型和固件更新:定制专属技能

开发者或高级用户可以刷入不同的模型或固件,为 Watcher 赋予更强大、更专属的能力。

详细说明请参考我们综合指南中的相关章节:

开始对话

现在您已经对 SenseCAP Watcher 有了基本了解,可以探索其对话和工具调用能力,例如使用摄像头功能或设置基于时间的主动交互策略。

例如,如果我的代理角色名称设置为 Watcher,设置将如下所示:

watcher-agent-role

唤醒设备

设备在未被唤醒时保持待机状态,意味着它不会监听周围的对话。一旦被唤醒,它开始监听并可以根据用户指令进行对话或执行操作。

如何启用视觉唤醒

默认情况下,视觉唤醒功能是禁用的。要开启它,您可以在 Watcher 被唤醒时对它说:

"Hey Watcher, turn on model inference."

当前的视觉唤醒功能提供以下配置选项:

  • 目标 IDtarget):指定要检测的目标 ID。此 ID 取决于使用的视觉模型;默认值为 0。
  • 检测持续时间duration):单位为秒,用于调整视觉唤醒的敏感度。默认为 1 秒(此默认值不包括 1 秒的防抖处理)。
  • 置信度阈值threshold):视觉模型识别物体的最低置信度限制,用于调整检测敏感度。以百分比表示,默认为 75%。
  • 冷却期 (interval):单位为秒,表示一次对话结束后再次触发前所需的等待时间,用于避免同一对象频繁打断。默认为 8 秒。

例如,您可以通过修改 threshold 参数来调整模型的敏感度。如果您发现当前阈值过于严格,只需对 Watcher 说:"请将置信度阈值设置为 60%"。

使用摄像头

对 Watcher 说:

  • Please turn on the camera
  • What can you see?
  • What's in front of you?

资源

以下是一些高级资源,帮助您根据需求进一步扩展 SenseCAP Watcher 的应用边界,无论是本地部署、隐私保护还是构建个性化知识库:

参考资料

Loading Comments...