Transcribe tu contenido y ofrece subtítulos precisos

Saca partido a la voz para ofrecer mejores experiencias de usuario

Optimiza tu servicio con información valiosa extraída de las interacciones de los clientes

Precisión de última generación
Speech-to-Text aprovecha los algoritmos de la red neuronal de aprendizaje profundo más avanzados de Google para reconocer la voz automáticamente.

Personalización de modelos sencilla
Crea, gestiona y experimenta con recursos personalizados en la interfaz de usuario de Speech-to-Text.

Despliegue flexible de modelos
Despliega modelos de reconocimiento automático de voz donde los necesites, ya sea en la nube con la API u on‑premise con Speech-to-Text On-Prem.

Características principales
Adaptación de voz
Ofrece sugerencias para mejorar la precisión de la transcripción de términos o frases de un dominio específico o poco frecuentes. Usa las clases para convertir automáticamente los números dichos de viva voz en direcciones, años, divisas y más.

Modelos para dominios específicos
Elige entre una selección de modelos entrenados para recibir comandos de voz o transcribir vídeos y llamadas de teléfono. Estos modelos están optimizados para satisfacer los requisitos de calidad de los dominios específicos.

Compara fácilmente la calidad
Haz experimentos con tus datos de audio con nuestra interfaz de usuario fácil de usar. Prueba distintas configuraciones para optimizar la calidad y la precisión.

Speech-to-Text On-Prem
Mantén el control sobre tu infraestructura y sobre datos de discurso oral protegidos aprovechando la tecnología de reconocimiento de voz de Google on‑premise en tus propios centros de datos privados. Contacta con Ventas para empezar.

Reconocimiento de voz en el dispositivo
Ejecuta los algoritmos de reconocimiento voz de Google Cloud de forma local en cualquier dispositivo, con independencia de tu conexión a Internet. Promete a los usuarios que sus datos de voz nunca saldrán de su dispositivo.