En resumen: En 2026 hay cuatro caminos para sacar la transcripción de un vídeo de YouTube: la transcripción integrada de YouTube (gratis, pero sin descarga y floja fuera del inglés), la transcripción manual (100 % precisa, pero 30 a 60 minutos por cada vídeo de 10 minutos), las herramientas con IA (pega el enlace, texto limpio en unos 5 segundos, exportación TXT/SRT/VTT y más de 50 idiomas) y las extensiones de navegador (cómodas dentro del navegador, pero con riesgos de privacidad y de que dejen de funcionar). Para un uso habitual con exportaciones, una herramienta con IA es la opción práctica.
Tienes un vídeo de YouTube de 47 minutos. Quieres una cita exacta. O quieres convertirlo en un artículo. O quieres traducirlo. Verlo entero y tomar notas a mano es media tarde. Sacar la transcripción son 30 segundos.
Esta guía cubre cómo obtener la transcripción de un vídeo de YouTube: qué tipos de salida existen, qué hacer con ellas, qué esperar en términos de precisión.
¿Qué es una transcripción de YouTube?
Es el texto hablado del vídeo, escrito de principio a fin. Tres variantes:
- Texto plano: solo las palabras. Sin marcas de tiempo. Ideal para reutilizar como artículo de blog.
- Con marcas de tiempo: cada frase lleva un
[00:14]delante. Útil para "¿qué se dijo en el minuto 5?". - Formato subtítulo (SRT/VTT): igual que el anterior, pero en formato de subtítulo estándar. Se puede subir como CC a otra plataforma.
YouTube genera automáticamente subtítulos para la mayoría de vídeos (auto-captions). Estas son la base de la transcripción.
Tres caminos para obtenerla
1) Desde YouTube Studio (solo tus propios vídeos)
Si subiste el vídeo, lo más simple:
- Abre YouTube Studio
- Menú izquierdo → Subtítulos
- Pulsa el vídeo
- Junto a los subtítulos automáticos → menú de tres puntos
- Descargar subtítulos → elige formato (SRT, VTT, o "Captions" → SBV)
Listo. Pero esto solo funciona para los vídeos que tú has subido.
2) Desde una herramienta externa (vídeos de otras personas)
Para cualquier vídeo de YouTube (el tuyo o ajeno) puedes usar una herramienta de transcripción que pega el enlace y devuelve el texto:
- Copias la URL del vídeo
- La pegas en la herramienta
- Eliges el idioma de salida y el formato
- Descargas
El proceso completo lleva entre 5 segundos (subtítulos manuales del autor) y 2-3 minutos (transcripción IA por Whisper si no hay subtítulos manuales).
3) Whisper directo (si no hay ningún subtítulo)
A veces el vídeo no tiene subtítulos automáticos ni manuales (música, idiomas raros, vídeos viejos). Ahí la herramienta usa OpenAI Whisper, un modelo IA que escucha el audio y produce la transcripción desde cero.
Whisper es preciso (>95% en audio claro), pero más lento. Un vídeo de 1 hora puede tardar 2-3 minutos en transcribirse.
¿Qué calidad esperar?
| Fuente | Precisión | Velocidad |
|---|---|---|
| Subtítulos manuales del autor | ~99% | Instantáneo |
| Subtítulos auto-generados YouTube | 85-90% (inglés), 70-80% (español) | Instantáneo |
| Whisper IA | >95% (claro), 85-92% (ruido) | 1-3 min / 1h vídeo |
Para citas exactas: subtítulos manuales > Whisper > auto-captions. Para velocidad: cualquiera de los dos primeros.
¿Qué puedes hacer con la transcripción?
Reutilizar como blog
Saca la transcripción, quita las marcas de tiempo, mete el texto en un resumidor IA y obtén un artículo de blog. Un vídeo de 30 min puede convertirse en 2-3 artículos.
Traducirla
Exporta como SRT, pásala por un traductor de subtítulos, y obtén el vídeo subtitulado en 5-10 idiomas. Tu vídeo se vuelve global.
Citar con precisión
Con marcas de tiempo, puedes citar exactamente: "En el minuto 5:23 dice...". Periodismo, investigación académica, análisis.
Buscar dentro
Texto buscable. ¿Dónde menciona "machine learning" en este vídeo de 2 horas? Ctrl+F en la transcripción, hecho.
Resumir
Pega la transcripción en un resumidor IA, obtén la idea principal + puntos clave + conclusión en segundos.
Accesibilidad
Algunas personas con discapacidad auditiva o que ven en silencio (avión, biblioteca) prefieren leer la transcripción a ver el vídeo.
Errores comunes
"Sin subtítulos disponibles"
A veces el vídeo no tiene subtítulos. Soluciones:
- Usa Whisper para generarlos desde cero
- Pide al autor que active los subtítulos automáticos (suelen estar desactivados por defecto en canales pequeños)
Caracteres mal codificados (acentos)
Si los caracteres acentuados (á, é, í, ñ) aparecen como ? o símbolos raros, el archivo está en encoding incorrecto. Abre el SRT con un editor que soporte UTF-8 (VS Code, Notepad++).
Marcas de tiempo desfasadas
Whisper a veces produce marcas con 1-2 segundos de desfase. Herramientas como Subtitle Edit permiten desplazar todo el archivo de golpe.
Música o silbidos reconocidos como habla
Whisper a veces interpreta música o ruido como palabras. Si el vídeo tiene mucha música, revisa la transcripción manualmente.
Comparación: transcripción vs resumen
| Objetivo | Usa |
|---|---|
| Cita exacta | Transcripción |
| Idea general | Resumen IA del vídeo |
| Subir a otra plataforma | SRT/VTT |
| Traducir a otro idioma | SRT → traductor de subtítulos |
Preguntas frecuentes
¿Es gratis? Sí. El plan gratuito cubre vídeos de hasta 30 minutos. Para vídeos más largos hay planes Plus (2h), Pro (4h) y Premium (8h).
¿Funciona en cualquier idioma? Los subtítulos automáticos de YouTube cubren los principales (inglés, español, alemán, francés, etc.). Whisper cubre más de 50.
¿Está bien con vídeos con derechos de autor? Para uso personal (notas, investigación, traducción) sí. Para republicar el contenido necesitas permiso del autor.
¿Cuánto tarda? Subtítulos manuales/automáticos: instantáneo. Whisper: 1-3 min por hora de vídeo.
¿Live streams? Funciona después de que termine el directo, no durante.
Conclusión
Obtener la transcripción de un vídeo de YouTube es uno de esos cambios pequeños que liberan mucho tiempo. Convierte el contenido en vídeo (lineal, lento) en contenido en texto (buscable, citable, traducible, rápido).
Pruébalo ahora:
→ Abre CreatorNote, pega un enlace de YouTube, descarga la transcripción en TXT, SRT o VTT. El plan gratuito cubre vídeos cortos; Plus/Pro para uso regular.
Comentarios
Sé el primero en comentar.