🔥 NUEVO: ¡Convierte texto a voz y viceversa!

Suite de herramientas de voz: Guía completa

Convierte texto en voz natural y audio en texto con precisión IA

220+

Voces IA

Voces de sonido natural

40+

Idiomas

Soporte global

99.5%

Precisión

Reconocimiento de voz

4h

Duración máxima

Por archivo de audio

📚 Lo que aprenderás

Texto a voz (TTS)

  1. 1 Crear tu primer doblaje
  2. 2 Personalizar ajustes de voz
  3. 3 Uso de SSML para control avanzado

Voz a texto (STT)

  1. 4 Convertir tu primer archivo de audio
  2. 5 Gestión de varios oradores
  3. 6 Exportar y formatear resultados
1

Crear tu primer doblaje

Aprende cómo convertir texto en habla de sonido natural en 3 sencillos pasos

Paso 1: Elige tu voz

1. Haz clic en "Nuevo doblaje" en el menú superior

2. Selecciona tu voz preferida:

Google WaveNet

Mejor para uso general

OpenAI

Calidad premium

ElevenLabs

Más natural

💡 Consejo: Escucha muestras de voz antes de elegir. Cada voz tiene características únicas

Paso 2: Ingresa tu texto

1. Escribe o pega tu texto en el editor

2. Usa etiquetas SSML para control:

<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>

Ejemplo: Usa pausas y énfasis para hacer tu voz en off más atractiva

Paso 3: Generar y exportar

1. Haz clic en "Generar" para crear tu audio

2. Previsualizar el resultado

3. Elige formato de exportación:

MP3

Ideal para la web

WAV

Alta calidad

OGG

Comprimido

2

De voz a texto: guía completa

Transforma tu audio en texto preciso con transcripción potenciada por IA

Paso 1: Sube tu audio

Comienza subiendo tu archivo de audio:

  • Formatos compatibles: MP3, WAV, MP4, WebM, M4A
  • Tamaño máximo de archivo: 25 MB
  • Duración máxima: 4 horas
  • Carga por lotes: hasta 10 archivos a la vez

💡 Consejo profesional: Para mejores resultados, utiliza audio claro con mínimo ruido de fondo. Considera usar software de reducción de ruido antes de subir.

Paso 2: Configura los ajustes

Configuración de idioma

  • Detección automática de idioma
  • Selección manual de idioma (más de 40 idiomas)
  • Compatibilidad con varios idiomas
  • Vocabulario personalizado

Opciones de transcripción

  • Diarización de oradores
  • Puntuación
  • Marcas de tiempo
  • Preferencias de formato

Paso 3: Manejo de múltiples oradores

Configurar identificación de oradores:

Detección de orador

  • Habilitar "Varios oradores"
  • Establecer número de oradores (2-10)
  • Detección automática de oradores
  • Asignación manual de oradores

Etiquetas de oradores

  • Orador 1, Orador 2, etc.
  • Nombres personalizados (John, Sarah)
  • Basado en roles (Entrevistador, Invitado)
  • Etiquetas personalizadas

Ejemplo de salida:

[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology. [00:00:20] Guest: Thank you for having me. I\'m excited to share my insights. [00:00:25] Interviewer: Let\'s start with the basics. What is AI?

💡 Consejo profesional: Para mejores resultados con múltiples oradores, asegúrate de una separación clara del audio y ruido de fondo mínimo. Considera usar micrófonos separados para cada orador en grabaciones en vivo.

Paso 4: Revisar y editar

Revisa y refina tu transcripción:

Herramientas de edición

  • Corrección de texto
  • Reasignación de orador
  • Ajuste de marca de tiempo
  • Edición de puntuación

Controles de calidad

  • Verificación de precisión
  • Verificación de identificación de orador
  • Consistencia de formato
  • Precisión del idioma

💡 Consejo pro: Utiliza atajos de teclado (⌘ + E para editar, ⌘ + S para guardar) para acelerar tu proceso de revisión. La IA aprenderá de tus correcciones para mejorar transcripciones futuras.

Paso 5: Exportación e integración

Elige tu formato de exportación y opciones de integración:

Formatos de exportación

TXT Texto sin formato con marcas de tiempo
SRT Formato de subtítulos
VTT Subtítulos de video web
JSON Datos estructurados

Opciones de integración

  • Descarga directa
  • Almacenamiento en la nube (Google Drive, Dropbox)
  • Acceso a API para desarrolladores
  • Notificaciones de Webhook

Ejemplos de formato:

Formato SRT:

1 00:00:15,000 --> 00:00:20,000 Interviewer: Welcome to our podcast. 2 00:00:20,000 --> 00:00:25,000 Guest: Thank you for having me.

Formato JSON:

{ "segments": [ { "start": "00:00:15", "end": "00:00:20", "speaker": "Interviewer", "text": "Welcome to our podcast." } ] }

💡 Consejo profesional: Usa el formato JSON para acceso programático o cuando necesites procesar más los datos de transcripción. El formato SRT es ideal para subtítulos de video, mientras que VTT es perfecto para reproductores de video web.

3

Características y Consejos Avanzados

Domina funciones avanzadas para aprovechar al máximo Voice Tools Suite

Texto a Voz Avanzado

Voice Cloning

Sube una muestra de voz para crear una voz personalizada

Control de Emociones

<prosody emotion="happy">I\'m excited to share this!</prosody>

Voz a Texto Avanzado

Diarización de Hablantes

Identificar automáticamente diferentes hablantes

Vocabulario Personalizado

Agrega términos específicos de la industria para mayor precisión

Atajos de Teclado

⌘ + N Nuevo proyecto
⌘ + P Vista previa de audio
⌘ + E Exportar
⌘ + / Mostrar todos los atajos

¿Listo para transformar tu contenido?

Comienza a crear locuciones y transcripciones profesionales hoy