Bot Transcriptor de Reels
Transcripción de reels de Instagram vía bot de Telegram
Problema
Consumo mucho contenido de video corto para investigación y aprendizaje. Ver cada reel completo es lento, y volver a verlo para capturar un detalle específico es aún más lento. Necesitaba una forma de convertir cualquier reel en texto que pudiera leer, guardar y consultar después.
Leer una transcripción toma segundos. Ver dos veces un reel de 90 segundos toma tres minutos.
Stack
Make.com orquesta todo el pipeline. Un servicio de RapidAPI descarga el reel desde Instagram. Gemini API procesa el audio y genera una transcripción estructurada con análisis. El bot solo procesa audio, no cuadros de video. La entrada y la salida pasan por Telegram Bot API.
Diagrama de flujo
7 pasos — disparado al instante
Webhook → HTTP (descarga RapidAPI) → HTTP (procesa medio) → HTTP (descarga archivo, filtro condicional) → Resume (manejo de errores) → HTTP (transcripción Gemini API) → HTTP (envío a Telegram)

~30 segundos por reel. Sin programación horaria.
La salida tiene cuatro secciones: Transcripción, Resumen, Tono y audiencia y Puntos clave.

Iteraciones de prompt
Primer prompt de Gemini: texto sin formato. Ronda 1 definió secciones explícitas de salida (transcripción, resumen, tono, audiencia, puntos clave). Ronda 2 afinó el manejo de audio superpuesto, música de fondo y habla poco clara para marcar los vacíos en vez de adivinar.
Lo más difícil: lograr un formato de salida consistente entre distintos estilos de reel (talking head, voz en off, entrevista).
Fallos resueltos
Fallos de RapidAPI
Las URLs de Instagram no siempre se resuelven. Agregué validaciones y mensajes de error de fallback hacia Telegram.
Timeout en reels largos
Los reels de más de 60 segundos excedían la ventana de ejecución de Make.com. Ajusté los timeouts y agregué un módulo Resume para recuperación.
Resultado
En uso varias veces al día. Envío un link, recibo la transcripción estructurada en ~30 segundos. Reemplazó ver, rever y tomar notas a mano. En producción en v2 sin interrupciones.