← Todos los casos de estudio

Bot Transcriptor de Reels

Transcripción de reels de Instagram vía bot de Telegram

Problema

Consumo mucho contenido de video corto para investigación y aprendizaje. Ver cada reel completo es lento, y volver a verlo para capturar un detalle específico es aún más lento. Necesitaba una forma de convertir cualquier reel en texto que pudiera leer, guardar y consultar después.

Leer una transcripción toma segundos. Ver dos veces un reel de 90 segundos toma tres minutos.

Stack

Make.com orquesta todo el pipeline. Un servicio de RapidAPI descarga el reel desde Instagram. Gemini API procesa el audio y genera una transcripción estructurada con análisis. El bot solo procesa audio, no cuadros de video. La entrada y la salida pasan por Telegram Bot API.

Make.comRapidAPIGemini APITelegram Bot API

Diagrama de flujo

7 pasos — disparado al instante

Webhook → HTTP (descarga RapidAPI) → HTTP (procesa medio) → HTTP (descarga archivo, filtro condicional) → Resume (manejo de errores) → HTTP (transcripción Gemini API) → HTTP (envío a Telegram)

Escenario de Make.com para Reel Transcriber — pipeline de 7 pasos desde el webhook hasta la entrega en Telegram

~30 segundos por reel. Sin programación horaria.

La salida tiene cuatro secciones: Transcripción, Resumen, Tono y audiencia y Puntos clave.

Mensaje de Telegram mostrando la salida estructurada de la transcripción del reel con transcripción, resumen, tono y puntos clave

Iteraciones de prompt

Primer prompt de Gemini: texto sin formato. Ronda 1 definió secciones explícitas de salida (transcripción, resumen, tono, audiencia, puntos clave). Ronda 2 afinó el manejo de audio superpuesto, música de fondo y habla poco clara para marcar los vacíos en vez de adivinar.

Lo más difícil: lograr un formato de salida consistente entre distintos estilos de reel (talking head, voz en off, entrevista).

Fallos resueltos

Fallos de RapidAPI

Las URLs de Instagram no siempre se resuelven. Agregué validaciones y mensajes de error de fallback hacia Telegram.

Timeout en reels largos

Los reels de más de 60 segundos excedían la ventana de ejecución de Make.com. Ajusté los timeouts y agregué un módulo Resume para recuperación.

Resultado

En uso varias veces al día. Envío un link, recibo la transcripción estructurada en ~30 segundos. Reemplazó ver, rever y tomar notas a mano. En producción en v2 sin interrupciones.

¡Enlace copiado!