Suite de herramientas de voz: Guía completa
Convierte texto en voz natural y audio en texto con precisión IA
Voces IA
Voces de sonido natural
Idiomas
Soporte global
Precisión
Reconocimiento de voz
Duración máxima
Por archivo de audio
📚 Lo que aprenderás
Texto a voz (TTS)
- 1 Crear tu primer doblaje
- 2 Personalizar ajustes de voz
- 3 Uso de SSML para control avanzado
Voz a texto (STT)
- 4 Convertir tu primer archivo de audio
- 5 Gestión de varios oradores
- 6 Exportar y formatear resultados
Crear tu primer doblaje
Aprende cómo convertir texto en habla de sonido natural en 3 sencillos pasos
Paso 1: Elige tu voz
1. Haz clic en "Nuevo doblaje" en el menú superior
2. Selecciona tu voz preferida:
Google WaveNet
Mejor para uso general
OpenAI
Calidad premium
ElevenLabs
Más natural
💡 Consejo: Escucha muestras de voz antes de elegir. Cada voz tiene características únicas
Paso 2: Ingresa tu texto
1. Escribe o pega tu texto en el editor
2. Usa etiquetas SSML para control:
<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>
Ejemplo: Usa pausas y énfasis para hacer tu voz en off más atractiva
Paso 3: Generar y exportar
1. Haz clic en "Generar" para crear tu audio
2. Previsualizar el resultado
3. Elige formato de exportación:
MP3
Ideal para la web
WAV
Alta calidad
OGG
Comprimido
De voz a texto: guía completa
Transforma tu audio en texto preciso con transcripción potenciada por IA
Paso 1: Sube tu audio
Comienza subiendo tu archivo de audio:
- Formatos compatibles: MP3, WAV, MP4, WebM, M4A
- Tamaño máximo de archivo: 25 MB
- Duración máxima: 4 horas
- Carga por lotes: hasta 10 archivos a la vez
💡 Consejo profesional: Para mejores resultados, utiliza audio claro con mínimo ruido de fondo. Considera usar software de reducción de ruido antes de subir.
Paso 2: Configura los ajustes
Configuración de idioma
- Detección automática de idioma
- Selección manual de idioma (más de 40 idiomas)
- Compatibilidad con varios idiomas
- Vocabulario personalizado
Opciones de transcripción
- Diarización de oradores
- Puntuación
- Marcas de tiempo
- Preferencias de formato
Paso 3: Manejo de múltiples oradores
Configurar identificación de oradores:
Detección de orador
- Habilitar "Varios oradores"
- Establecer número de oradores (2-10)
- Detección automática de oradores
- Asignación manual de oradores
Etiquetas de oradores
- Orador 1, Orador 2, etc.
- Nombres personalizados (John, Sarah)
- Basado en roles (Entrevistador, Invitado)
- Etiquetas personalizadas
Ejemplo de salida:
[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology.
[00:00:20] Guest: Thank you for having me. I\'m excited to share my insights.
[00:00:25] Interviewer: Let\'s start with the basics. What is AI?
💡 Consejo profesional: Para mejores resultados con múltiples oradores, asegúrate de una separación clara del audio y ruido de fondo mínimo. Considera usar micrófonos separados para cada orador en grabaciones en vivo.
Paso 4: Revisar y editar
Revisa y refina tu transcripción:
Herramientas de edición
- Corrección de texto
- Reasignación de orador
- Ajuste de marca de tiempo
- Edición de puntuación
Controles de calidad
- Verificación de precisión
- Verificación de identificación de orador
- Consistencia de formato
- Precisión del idioma
💡 Consejo pro: Utiliza atajos de teclado (⌘ + E para editar, ⌘ + S para guardar) para acelerar tu proceso de revisión. La IA aprenderá de tus correcciones para mejorar transcripciones futuras.
Paso 5: Exportación e integración
Elige tu formato de exportación y opciones de integración:
Formatos de exportación
Opciones de integración
- Descarga directa
- Almacenamiento en la nube (Google Drive, Dropbox)
- Acceso a API para desarrolladores
- Notificaciones de Webhook
Ejemplos de formato:
Formato SRT:
1
00:00:15,000 --> 00:00:20,000
Interviewer: Welcome to our podcast.
2
00:00:20,000 --> 00:00:25,000
Guest: Thank you for having me.
Formato JSON:
{
"segments": [
{
"start": "00:00:15",
"end": "00:00:20",
"speaker": "Interviewer",
"text": "Welcome to our podcast."
}
]
}
💡 Consejo profesional: Usa el formato JSON para acceso programático o cuando necesites procesar más los datos de transcripción. El formato SRT es ideal para subtítulos de video, mientras que VTT es perfecto para reproductores de video web.
Características y Consejos Avanzados
Domina funciones avanzadas para aprovechar al máximo Voice Tools Suite
Texto a Voz Avanzado
Voice Cloning
Sube una muestra de voz para crear una voz personalizada
Control de Emociones
<prosody emotion="happy">I\'m excited to share this!</prosody>
Voz a Texto Avanzado
Diarización de Hablantes
Identificar automáticamente diferentes hablantes
Vocabulario Personalizado
Agrega términos específicos de la industria para mayor precisión
Atajos de Teclado
¿Listo para transformar tu contenido?
Comienza a crear locuciones y transcripciones profesionales hoy