Interação por voz
Aqui está a imagem geral dos serviços de interação por voz ao redor do mundo.
1. Alexa
Alexa é o serviço de voz em nuvem da Amazon disponível em dezenas de milhões de dispositivos da Amazon e de fabricantes terceirizados. Com a Alexa, você pode criar experiências de voz naturais que oferecem aos clientes uma forma mais intuitiva de interagir com a tecnologia que usam todos os dias. Nossa coleção de ferramentas, APIs, soluções de referência e documentação facilita para qualquer pessoa desenvolver com a Alexa.
O que você pode criar com a Alexa?
- Adicionar recursos à Alexa: Adicione recursos, ou skills, à Alexa usando o Alexa Skills Kit (ASK), uma coleção de APIs de autoatendimento, ferramentas, documentação e exemplos de código. As skills tornam a Alexa mais inteligente e permitem que os clientes façam mais usando a voz. Crie experiências naturais e com prioridade para voz com nosso kit de ferramentas e ajude a redefinir a forma como seus clientes interagem com a tecnologia.
- Integrar a Alexa ao seu dispositivo: Integre a Alexa diretamente aos seus produtos com o Alexa Voice Service (AVS), trazendo a conveniência do controle de voz sem o uso das mãos para qualquer dispositivo conectado. Por meio do AVS, você pode adicionar uma nova interface inteligente aos seus produtos e oferecer aos clientes acesso a um número crescente de recursos da Alexa, integrações de casa inteligente e skills.
- Conectar dispositivos à Alexa: Conecte a Alexa aos seus dispositivos para proporcionar experiências agradáveis e intuitivas aos seus clientes. Adicione a Alexa aos seus dispositivos de casa inteligente para habilitar o controle por voz de suas câmeras inteligentes, luzes, sistemas de entretenimento e muito mais. E crie seus próprios Alexa Gadgets ou crie skills interativas que funcionem com Alexa Gadgets como o Echo Buttons.
Recurso para desenvolvedores
- Alexa Voice Service Get Started - avs-device-sdk
2. Google assistant
O Google Assistant SDK permite adicionar detecção de palavra de ativação, controle por voz, compreensão de linguagem natural e a inteligência do Google aos seus dispositivos. Seu dispositivo captura um enunciado (um pedido de áudio falado, como What’s on my calendar?), o envia ao Google Assistant e recebe uma resposta em áudio falado, além do texto bruto do enunciado.
O que ele pode fazer?
- GERENCIAR TAREFAS:Enviar uma mensagem de texto, definir lembretes, ativar o modo de economia de bateria e pesquisar e-mails instantaneamente.
- PLANEJAR SEU DIA:Verificar o status do seu voo, fazer uma reserva para o jantar, verificar o horário de início do seu filme e encontrar uma parada para café ao longo do seu trajeto.
- APROVEITAR ENTRETENIMENTO:Controlar músicas no Google Play e YouTube Music. Você também pode retomar de onde parou nos seus podcasts favoritos com seu Assistant no Google Home.
- GUARDAR MEMÓRIAS:Seu Assistant torna incrivelmente simples encontrar suas fotos — e também tirá-las.
- OBTER RESPOSTAS:Obter respostas em tempo real, incluindo as últimas informações sobre clima, trânsito, finanças ou esportes. Encontrar rapidamente traduções enquanto você viaja.
- CONTROLAR SUA CASA:Usar seu telefone para controlar seus dispositivos de casa inteligente. Ajustar a temperatura, iluminação e muito mais, mesmo quando você não está em casa.
Recurso para desenvolvedores
3. Bing Speech
Bing Speech inclui converter áudio em texto, entender a intenção e converter texto de volta em fala para uma resposta natural.
Reconhecimento de fala Converter áudio falado em texto. A API pode ser configurada para ligar e reconhecer áudio proveniente do microfone em tempo real, reconhecer áudio proveniente de outra fonte de áudio em tempo real ou reconhecer áudio de dentro de um arquivo. Em todos os casos, o streaming em tempo real está disponível; assim, enquanto o áudio é enviado ao servidor, resultados parciais de reconhecimento também são retornados.
A API Speech to Text permite criar aplicativos inteligentes ativados por voz. Para ver como funciona, selecione seu idioma de destino, clique no microfone e comece a falar. Ou simplesmente clique em uma das frases de fala de exemplo para ver como funciona o reconhecimento de fala. Ao usar esta demonstração, você concorda em fornecer seus dados de entrada de voz à Microsoft para fins de melhoria do serviço.
Text to Speech Converter texto em áudio falado. Quando os aplicativos precisam “falar” de volta com seus usuários, essa API pode ser usada para converter texto gerado pelo aplicativo em áudio que pode ser reproduzido para o usuário.
A API Text-To-Speech permite criar aplicativos inteligentes que podem falar. Você pode testá-la agora: simplesmente escolha seu idioma de destino, adicione suas frases e clique no botão de reprodução para ver como funciona a síntese de fala. Ao usar esta demonstração, você concorda em fornecer seus dados de entrada de voz à Microsoft para fins de melhoria do serviço.
Recurso para desenvolvedores
4. Baidu
Baidu Speech inclui STT, TTS, interação por voz e ativação offline.
Recurso para desenvolvedores
Lista de tutoriais de Interação por Voz
Aqui está a lista de tutoriais de interação por voz.
Obrigado por escolher nossos produtos! Estamos aqui para fornecer diferentes formas de suporte para garantir que sua experiência com nossos produtos seja a mais tranquila possível. Oferecemos vários canais de comunicação para atender a diferentes preferências e necessidades.