Nota diaria: Hoy aprendí — etiquetas <mark> de Polly SSML
Las etiquetas <mark> de SSML de Polly emiten eventos de temporización a través del flujo. Son útiles para sincronizar los subtítulos en pantalla con la reproducción de voz.
TIL: Las etiquetas SSML <mark> de Polly se presentan como eventos de temporización en el flujo de audio. Si estás haciendo voz + pantalla emergente, puedes sincronizar los subtítulos con la palabra exacta.
<speak>
Please hold while I <mark name="lookup"/> look up your account.
</speak>
En el lado del consumidor, te suscribes a los eventos de marca y cambias el estado de la interfaz cuando se activa lookup. Esta es la pieza que me faltaba para una experiencia de voz + visual de baja latencia que he estado prototipando.
Docs: Amazon Polly → "SpeechMarks" → evento JSON con time y value.
Relacionado
Sigue leyendo
Nota diaria: Publicando la primera entrada del blog desde mi teléfono
El post meta. Levanté este blog, escribí esto desde el sofá en mi teléfono. Quick Note funciona.
Nota diaria: Depurando un flujo de API en producción
La prueba de integración pasó, el entorno de staging está en verde, pero en producción falla para el 1% de los llamadores. El error estaba en un lugar que nunca habría adivinado.
Construyendo Integraciones de Voz sobre Chatbots Asíncronos
¿Qué se rompe cuando enfrentas un chatbot asíncrono con Amazon Connect + Lex, y cómo mantener la latencia, la interrupción y la transferencia de contexto en un nivel razonable?
Continúa
¿A dónde sigues?
Explora más textos técnicos, revisa los casos de estudio o escríbeme directo.