Suite d'outils vocaux : Guide complet
Transformez du texte en parole naturelle et convertissez l'audio en texte avec une précision alimentée par l'IA
Voix IA
Voix à son naturel
Langues
Support mondial
Précision
Reconnaissance vocale
Durée maxi
Par fichier audio
📚 Ce que vous apprendrez
Texte en parole (TTS)
- 1 Création de votre premier doublage
- 2 Personnalisation des paramètres de la voix
- 3 Utilisation de SSML pour un contrôle avancé
Parole en texte (STT)
- 4 Conversion de votre premier fichier audio
- 5 Gestion de plusieurs orateurs
- 6 Exportation et formatage des résultats
Création de votre premier doublage
Apprenez à convertir du texte en parole naturelle en 3 étapes simples
Étape 1 : Choisissez votre voix
1. Cliquez sur "Nouvel enregistrement" dans le menu supérieur
2. Sélectionnez votre voix préférée :
Google WaveNet
Idéal pour un usage général
OpenAI
Qualité premium
ElevenLabs
Plus naturel
💡 Astuce : Écoutez des échantillons de voix avant de choisir. Chaque voix a des caractéristiques uniques
Étape 2 : Entrez votre texte
1. Tapez ou collez votre texte dans l'éditeur
2. Utilisez des balises SSML pour contrôler :
<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>
Exemple : Utilisez des pauses et des emphases pour rendre votre voix off plus engageante
Étape 3 : Générer et exporter
1. Cliquez sur "Générer" pour créer votre audio
2. Prévisualiser le résultat
3. Choisissez le format d'exportation :
MP3
Meilleur pour le web
WAV
Haute qualité
OGG
Compressé
De la parole au texte : guide complet
Transformez votre audio en texte précis avec transcription assistée par IA
Étape 1 : téléchargez votre audio
Commencez par télécharger votre fichier audio :
- Formats pris en charge : MP3, WAV, MP4, WebM, M4A
- Taille de fichier maximale : 25 Mo
- Durée maximale : 4 heures
- Téléchargement par lots : jusqu'à 10 fichiers à la fois
💡 Astuce pro : pour de meilleurs résultats, utilisez un audio clair avec un minimum de bruit de fond. Envisagez d'utiliser un logiciel de réduction du bruit avant de télécharger.
Étape 2 : configurez les paramètres
Paramètres linguistiques
- Détection automatique de la langue
- Sélection manuelle de la langue (40+ langues)
- Prise en charge de plusieurs langues
- Vocabulaire personnalisé
Options de transcription
- Diarisation des locuteurs
- Ponctuation
- Horodatages
- Préférences de format
Étape 3 : Gestion de plusieurs intervenants
Configurer l'identification des intervenants :
Détection de locuteur
- Activer « Plusieurs intervenants »
- Définir le nombre d'intervenants (2-10)
- Détection automatique des intervenants
- Attribution manuelle des intervenants
Étiquettes des intervenants
- Intervenant 1, Intervenant 2, etc.
- Noms personnalisés (John, Sarah)
- Basé sur les rôles (Intervieweur, Invité)
- Étiquettes personnalisées
Exemple de sortie :
[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology.
[00:00:20] Guest: Thank you for having me. I\'m excited to share my insights.
[00:00:25] Interviewer: Let\'s start with the basics. What is AI?
💡 Astuce pro : Pour de meilleurs résultats avec plusieurs intervenants, assurez une séparation audio claire et un bruit de fond minimal. Envisagez d'utiliser des microphones séparés pour chaque intervenant lors des enregistrements en direct.
Étape 4 : Révision & Edition
Révisez et affinez votre transcription :
Outils d'édition
- Correction de texte
- Réaffectation du locuteur
- Ajustement des horodatages
- Édition de la ponctuation
Contrôles de qualité
- Vérification de la précision
- Vérification de l’identification du locuteur
- Cohérence du format
- Précision linguistique
💡 Astuce pro : utilisez les raccourcis clavier (⌘ + E pour éditer, ⌘ + S pour enregistrer) pour accélérer votre processus de révision. L’IA apprendra de vos corrections pour améliorer les futures transcriptions.
Étape 5 : Exportation & intégration
Choisissez votre format d’exportation et vos options d’intégration :
Formats d'exportation
Options d’intégration
- Téléchargement direct
- Stockage cloud (Google Drive, Dropbox)
- Accès API pour développeurs
- Notifications de webhook
Exemples de format :
Format SRT :
1
00:00:15,000 --> 00:00:20,000
Interviewer: Welcome to our podcast.
2
00:00:20,000 --> 00:00:25,000
Guest: Thank you for having me.
Format JSON :
{
"segments": [
{
"start": "00:00:15",
"end": "00:00:20",
"speaker": "Interviewer",
"text": "Welcome to our podcast."
}
]
}
💡 Conseil de pro : Utilisez le format JSON pour un accès programmatique ou lorsque vous devez traiter davantage les données de transcription. Le format SRT est idéal pour les sous-titres vidéo, tandis que le VTT est parfait pour les lecteurs vidéo Web.
Fonctionnalités avancées et conseils
Maîtrisez les fonctionnalités avancées pour tirer le meilleur parti de Voice Tools Suite
Synthèse vocale avancée
Voice Cloning
Téléchargez un échantillon vocal pour créer une voix personnalisée
Contrôle des émotions
<prosody emotion="happy">I\'m excited to share this!</prosody>
Reconnaissance vocale avancée
Diarisation des locuteurs
Identifier automatiquement les différents locuteurs
Vocabulaire personnalisé
Ajoutez des termes spécifiques à l'industrie pour une meilleure précision
Raccourcis clavier
Prêt à transformer votre contenu ?
Commencez à créer des voix off et des transcriptions professionnelles dès aujourd'hui