Skip to main content

语音交互

以下是全球范围内语音交互服务的整体概况。

1. Alexa

Alexa 是亚马逊基于云的语音服务,可用于亚马逊及第三方设备制造商的数千万台设备。通过 Alexa,您可以构建自然的语音体验,为客户提供更直观的方式与他们每天使用的技术进行交互。我们提供的工具、API、参考解决方案和文档使任何人都可以轻松地使用 Alexa 进行开发。

您可以使用 Alexa 构建什么?

  • 为 Alexa 添加功能:使用 Alexa Skills Kit (ASK) 为 Alexa 添加功能或技能。ASK 是一组自助式 API、工具、文档和代码示例。技能使 Alexa 更加智能,并让客户能够通过语音完成更多任务。使用我们的工具包构建自然的语音优先体验,帮助重新定义客户与技术交互的方式。
  • 将 Alexa 集成到您的设备中:通过 Alexa Voice Service (AVS) 将 Alexa 直接集成到您的产品中,为任何连接设备带来免提语音控制的便利。通过 AVS,您可以为您的产品添加一个新的智能界面,并为客户提供越来越多的 Alexa 功能、智能家居集成和技能。
  • 将设备连接到 Alexa:将 Alexa 连接到您的设备,为客户提供愉悦且直观的体验。将 Alexa 添加到您的智能家居设备中,以实现对智能摄像头、灯光、娱乐系统等的语音控制。您还可以构建自己的 Alexa 小工具或创建与 Alexa 小工具(如 Echo Buttons)交互的技能。

开发者资源

2. Google Assistant

Google Assistant SDK 允许您为设备添加热词检测、语音控制、自然语言理解以及 Google 的智能功能。您的设备捕获一个语音请求(例如“我的日程表上有什么?”),将其发送到 Google Assistant,并接收语音响应以及请求的原始文本。

它能做什么?

  • 管理任务:发送短信、设置提醒、开启省电模式并即时查找电子邮件。
  • 规划您的一天:检查航班状态、预订晚餐、查看电影开始时间,并在您的路线中找到咖啡店。
  • 享受娱乐:控制 Google Play 和 YouTube Music 上的音乐。您还可以在 Google Home 上通过 Assistant 继续收听您喜欢的播客。
  • 创造回忆:Assistant 让查找照片变得极其简单,同时也能帮助您拍摄照片。
  • 获取答案:实时获取天气、交通、金融或体育的最新信息。在旅行时快速找到翻译。
  • 控制您的家居:使用手机控制您的智能家居设备。即使您不在家,也可以调整温度、灯光等。

开发者资源

3. Bing Speech

Bing Speech 包括将音频转换为文本、理解意图以及将文本转换回语音,以实现自然响应。

语音识别
将语音音频转换为文本。API 可以实时识别来自麦克风的音频、来自其他实时音频源的音频,或文件中的音频。在所有情况下,均支持实时流式处理,因此在音频发送到服务器的同时,也会返回部分识别结果。

语音转文本 API 使您能够构建语音触发的智能应用程序。要查看其工作原理,请选择目标语言,然后点击麦克风开始讲话。或者直接点击示例语音短语,查看语音识别的工作方式。使用此演示时,您同意将您的语音输入数据提供给 Microsoft 用于服务改进目的。

文本转语音
将文本转换为语音音频。当应用程序需要“与用户对话”时,可以使用此 API 将应用程序生成的文本转换为音频并播放给用户。

文本转语音 API 使您能够构建可以说话的智能应用程序。您可以立即测试,只需选择目标语言,添加您的句子,然后点击播放按钮,查看语音合成的工作方式。使用此演示时,您同意将您的语音输入数据提供给 Microsoft 用于服务改进目的。

开发者资源

4. 百度

百度语音包括语音转文本(STT)、文本转语音(TTS)、语音交互、离线唤醒。

开发者资源

语音交互教程列表

以下是语音交互教程列表。

感谢您选择我们的产品!我们致力于为您提供各种支持,确保您使用我们的产品时体验顺畅。我们提供多种沟通渠道,以满足不同的偏好和需求。

Loading Comments...