Transcribe audio y video
a texto al instante

Upload·Ready

Arrastra tu archivo aquí

o haz clic para elegir desde tu dispositivo

Configurar

Idioma

Origen del audio

Velocidad estimada

Ultra rápido

— Calidad máxima siempre garantizada

Hasta 2 GB por archivo. Formatos: MP3, MPEG, M4A, AAC, WAV, OGG, OPUS, WMA, MP4, MOV, WMV.

Potenciados por

OpenAI
Google
Deepgram
AssemblyAI
Proceso

Tres simples pasos

De tu archivo a texto listo para usar. Sin complicaciones.

01

Sube tu archivo

Audio o video en cualquier formato popular

02

Transcribimos con IA

Procesamos en segundos con máxima precisión

03

Descarga tu texto

En el formato que necesites: TXT, SRT, VTT, JSON

Funcionalidades

Herramientas para transcribir sin límites

Todo lo que necesitas en un solo lugar. Potente, rápido y diseñado para adaptarse a tu flujo de trabajo.

Identifica quién habla

Diferencia las voces automáticamente, agrupa las intervenciones por hablante y te deja renombrarlos con un clic para personalizar la transcripción completa.

  • Hasta 10 hablantes por grabación
  • Avatar con inicial y color único por persona
  • Renombra cualquier hablante con un clic
Transcript
M María

(00:12)Vale, arranquemos. Ana, ¿cómo va el diseño del onboarding?

A Ana

(00:19)Bien, tengo los tres flows en Figma listos para review.

(00:26)Os paso el link esta tarde con comentarios marcados.

C Carlos

(00:34)Perfecto. Yo tengo bloqueada la integración con Stripe.

(00:41)El webhook de subscription.updated no está llegando.

M María

(00:48)Hablemos con infra después del standup.

Exporta en cualquier formato

Descarga tu transcripción en los formatos estándar que ya usas — listos para YouTube, Premiere, integraciones técnicas o archivado.

  • SRT y VTT para subtítulos de vídeo
  • TXT plano y JSON estructurado
  • Descarga también el audio optimizado en MP3
Export
11
200:00:12,000 --> 00:00:18,000
3Vale, arranquemos. Ana, ¿cómo va el diseño del onboarding?
4
52
600:00:19,000 --> 00:00:26,000
7Bien, tengo los tres flows en Figma listos para review.
8
93
1000:00:34,000 --> 00:00:41,000
11Perfecto. Yo tengo bloqueada la integración con Stripe.
12
134
1400:00:48,000 --> 00:00:55,000
15Hablemos con infra después del standup.
16

Editor de traducciones profesional

Traduce tu transcripción a más de 20 idiomas preservando hablantes y marcas de tiempo, con vista de dos columnas sincronizadas tipo editor profesional.

  • Más de 20 idiomas de destino
  • Dos columnas sincronizadas — original y traducción
  • Descarga la traducción en SRT, VTT, TXT o JSON
Translate
OriginalEspañol
English
(00:12)Vale, arranquemos. Ana, ¿cómo va el diseño del onboarding?
(00:19)Bien, tengo los tres flows en Figma listos para review.
(00:34)Perfecto. Yo tengo bloqueada la integración con Stripe.
(00:48)Hablemos con infra después del standup.

Edita con historial completo

Corrige la transcripción en texto plano — máxima compatibilidad con todos los formatos de exportación. Cada cambio queda archivado en un historial al que puedes volver en cualquier momento.

  • Texto plano, compatible con SRT, VTT, TXT y JSON
  • Historial completo de cada edición
  • Restaura cualquier versión con un clic
Editor
Editor · Plain text
(00:12) Vale, arranquemos. Ana, ¿cómo va el diseño del onboarding?
(00:19) Bien, tengo los tres flows en Figma listos para review.
(00:34) Perfecto. Yo tengo bloqueada la integración con Stripe.
(00:48) Hablemos con infra después del standup.
History
AhoraActual
Edición en curso
1 cambio sin guardar
Hace 2 min
Edición
3 cambios guardados
Hace 5 min
Renombrado
Speaker 1 → María
Hace 8 min
Transcripción
Versión original

Timestamps clickables

Cada línea sincronizada con el audio. Haz clic en cualquier momento para saltar al punto exacto.

  • Sincronización precisa
  • Navegación instantánea
  • Resaltado de línea activa
Player
01:22
FAQ

¿Tienes dudas?

Respuestas a las preguntas más comunes sobre transcriptfy — y si no encuentras la tuya, tenemos la página completa al final.

transcriptfy convierte tus archivos de audio y vídeo a texto con inteligencia artificial. Subes la grabación, la procesamos en segundos y te devolvemos el texto con marcas de tiempo, identificación de hablantes y exportable en los formatos estándar (TXT, SRT, VTT, JSON). Está pensado para periodistas, podcasters, investigadores, abogados, estudiantes y cualquiera que pase demasiado tiempo escribiendo a mano lo que alguien dijo.

Aceptamos los formatos más comunes: MP3, WAV, M4A, AAC, OGG, OPUS, WMA y FLAC para audio; MP4, MOV, MKV, WebM, AVI y WMV para vídeo. Si subes un vídeo, extraemos automáticamente la pista de audio — no necesitas convertirlo antes.

Depende de la duración del archivo y las opciones que actives, pero en la mayoría de casos un audio de 30 minutos se transcribe en 1 a 3 minutos. Opciones como el reconocimiento de hablantes o la traducción posterior añaden algo de tiempo. Antes de pulsar «Transcribir» te mostramos una estimación de velocidad basada en el archivo y las opciones elegidas.

Depende de si tienes suscripción activa: hasta 2 GB por archivo y 1 archivo por tanda sin suscripción (invitado o cuenta gratuita), hasta 5 GB por archivo y 3 archivos simultáneos con cualquier paquete activo. Si tu grabación pesa más, divídela en tramos o escríbenos.

Sí. Con la opción «Reconocer hablantes» activa etiquetamos automáticamente quién habla en cada intervención. Funciona bien hasta unos 10 hablantes distintos. Después podrás renombrar cada uno («Hablante 1» → «María Torres») y el cambio se aplica a toda la transcripción, la traducción y el resumen.

Más de +99 idiomas, incluidos español, inglés, francés, alemán, portugués, italiano, chino mandarín, japonés, árabe y todos los principales europeos y asiáticos. Por defecto detectamos el idioma automáticamente con más del 95% de precisión, pero puedes seleccionarlo manualmente si lo sabes — mejora la calidad en audios cortos o con ruido.

Sí. Cada transcripción incluye una pestaña de edición donde corriges el texto palabra a palabra manteniendo los segmentos y los hablantes. Los cambios quedan archivados en un historial de revisiones al que puedes volver en cualquier momento — así experimentas sin miedo a perder la versión anterior.

Sí, a más de 20 idiomas de destino. Traducimos segmento a segmento respetando marcas de tiempo y hablantes, con una vista de dos columnas (original a la izquierda, traducción a la derecha), scroll sincronizado y hover-mirror que resalta el segmento equivalente en la otra columna. Puedes tener varias traducciones activas a la vez para el mismo archivo — por ejemplo español → inglés y español → francés.

Sí. Exportamos en SRT y VTT — los formatos estándar compatibles con YouTube, Premiere, Final Cut, reproductores web y prácticamente todos los editores de vídeo. También puedes descargar en TXT (texto plano), JSON (estructura completa con timestamps, hablantes y metadatos) o el audio original en un clic.

Tus archivos viajan cifrados a Cloudflare R2, con acceso mediante URLs firmadas temporales. La subida desde tu navegador va directa al almacenamiento, sin pasar por servidores intermedios donde queden expuestos. No usamos tu contenido para entrenar modelos de IA ni lo compartimos con terceros más allá del procesamiento necesario para generar la transcripción, traducción o resumen que has pedido.

Sí. En modo invitado puedes transcribir una muestra de 30 segundos por archivo y ver el resultado antes de decidir. Si te convence, al registrarte la muestra se vincula automáticamente a tu cuenta y procesas el archivo completo — sin perder lo que ya habías empezado.

Trabajamos con paquetes de minutos: eliges el que mejor se ajusta a tu volumen mensual y pagas un precio por minuto que disminuye según el paquete. Los paquetes disponibles, el precio por minuto de cada uno y las funcionalidades incluidas están explicados en la página de precios.

transcriptfy