Skip to main content

语音交互

这里是全球语音交互服务的整体概览。

1. Alexa

Alexa 是亚马逊基于云的语音服务,可在来自亚马逊和第三方设备制造商的数千万台设备上使用。通过 Alexa,您可以构建自然的语音体验,为客户提供与日常使用的技术进行交互的更直观方式。我们的工具、API、参考解决方案和文档集合让任何人都能轻松使用 Alexa 进行构建。

您可以使用 Alexa 构建什么?

  • 为 Alexa 添加功能:使用 Alexa 技能工具包 (ASK) 为 Alexa 添加功能或技能,这是一个包含自助服务 API、工具、文档和代码示例的集合。技能让 Alexa 更智能,并使客户能够通过语音做更多事情。使用我们的工具包构建自然的语音优先体验,帮助重新定义客户与技术交互的方式。
  • 将 Alexa 集成到您的设备中:使用 Alexa 语音服务 (AVS) 将 Alexa 直接集成到您的产品中,为任何联网设备带来免提语音控制的便利。通过 AVS,您可以为产品添加新的智能界面,并为客户提供越来越多的 Alexa 功能、智能家居集成和技能的访问权限。
  • 将设备连接到 Alexa:将 Alexa 连接到您的设备,为客户提供令人愉悦和直观的体验。将 Alexa 添加到您的智能家居设备中,实现对智能摄像头、灯光、娱乐系统等的语音控制。构建您自己的 Alexa 小工具或创建与 Alexa 小工具(如 Echo Buttons)配合使用的交互式技能。

开发者资源

- Alexa 语音服务入门 - avs-device-sdk

2. Google assistant

Google Assistant SDK 让您可以为设备添加热词检测、语音控制、自然语言理解和 Google 的智能功能。您的设备捕获话语(口语音频请求,例如"我的日历上有什么?"),将其发送到 Google Assistant,并接收口语音频响应以及话语的原始文本。

它能做什么?

  • 管理任务:发送短信、设置提醒、开启省电模式并即时查找电子邮件。
  • 规划您的一天:检查航班状态、预订晚餐、查看电影开始时间,并在路线上找到咖啡店。
  • 享受娱乐:控制 Google Play 和 YouTube Music 上的音乐。您还可以在 Google Home 上通过 Assistant 从上次停止的地方继续收听您喜爱的播客。
  • 创造回忆:您的 Assistant 让查找照片变得非常简单——拍摄照片也是如此。
  • 获取答案:获取实时答案,包括天气、交通、金融或体育的最新信息。旅行时快速查找翻译。
  • 控制您的家:使用手机控制智能家居设备。即使不在家,也能调节温度、照明等。

开发者资源

3. Bing Speech

Bing Speech 包括将音频转换为文本、理解意图,并将文本转换回语音以实现自然响应。

语音识别 将语音音频转换为文本。该 API 可以被指导开启并实时识别来自麦克风的音频,识别来自不同实时音频源的音频,或识别文件中的音频。在所有情况下,都提供实时流式传输,因此当音频被发送到服务器时,部分识别结果也会同时返回。

语音转文本 API 使您能够构建由语音触发的智能应用程序。要查看其工作原理,请选择您的目标语言,然后点击麦克风并开始说话。或者简单地点击其中一个示例语音短语来查看语音识别的工作原理。当您使用此演示时,您同意向 Microsoft 提供您的语音输入数据以用于服务改进目的。

文本转语音 将文本转换为语音音频。当应用程序需要与用户"对话"时,此 API 可用于将应用程序生成的文本转换为可以播放给用户的音频。

文本转语音 API 使您能够构建可以说话的智能应用程序。您现在就可以测试它,只需选择您的目标语言,添加您的句子,然后点击播放按钮来查看语音合成的工作原理。当您使用此演示时,您同意向 Microsoft 提供您的语音输入数据以用于服务改进目的。

开发者资源

4. Baidu

百度语音包括 STT、TTS、语音交互、离线唤醒。

开发者资源

- SDK - API

语音交互教程列表

这里是语音交互教程列表。

感谢您选择我们的产品!我们在这里为您提供不同的支持,以确保您使用我们产品的体验尽可能顺畅。我们提供多种沟通渠道,以满足不同的偏好和需求。

Loading Comments...