Voice Tools Suite: Complete handleiding
Transformeer tekst naar natuurlijke spraak en converteer audio naar tekst met AI-gestuurde precisie
AI-stemmen
Natuurlijk klinkende stemmen
Talen
Wereldwijde ondersteuning
Nauwkeurigheid
Spraakherkenning
Maximale duur
Per audiobestand
📚 Wat je zult leren
Tekst-naar-spraak (TTS)
- 1 Je eerste voice-over maken
- 2 Steminstellingen aanpassen
- 3 SSML gebruiken voor geavanceerde controle
Spraak-naar-tekst (STT)
- 4 Je eerste audiobestand converteren
- 5 Meerdere sprekers afhandelen
- 6 Resultaten exporteren en formatteren
Je eerste voice-over maken
Leer hoe je tekst in natuurlijk klinkende spraak omzet in 3 eenvoudige stappen
Stap 1: Kies je stem
1. Klik op "Nieuwe Voice-Over" in het bovenste menu
2. Kies je favoriete stem:
Google WaveNet
Best voor algemeen gebruik
OpenAI
Premiumkwaliteit
ElevenLabs
Meest natuurlijk
💡 Tip: Luister naar stemmonsters voordat u kiest. Elke stem heeft unieke kenmerken
Stap 2: Voer uw tekst in
1. Typ of plak uw tekst in de editor
2. Gebruik SSML-tags voor controle:
<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>
Voorbeeld: Gebruik pauzes en nadruk om uw voice-over boeiender te maken
Stap 3: Genereren & exporteren
1. Klik op "Genereren" om uw audio te maken
2. Bekijk een voorbeeld van het resultaat
3. Kies exportformaat:
MP3
Het beste voor web
WAV
Hoge kwaliteit
OGG
Gecomprimeerd
Spraak-naar-tekst: complete handleiding
Converteer je audio naar nauwkeurige tekst met AI-gestuurde transcriptie
Stap 1: Upload je audio
Begin met het uploaden van je audiobestand:
- Ondersteunde formaten: MP3, WAV, MP4, WebM, M4A
- Maximale bestandsgrootte: 25 MB
- Maximale duur: 4 uur
- Batch-upload: tot 10 bestanden tegelijk
💡 Pro-tip: Voor beste resultaten gebruik je heldere audio met minimale achtergrondruis. Overweeg ruisonderdrukkingssoftware te gebruiken voordat je uploadt.
Stap 2: Stel instellingen in
Taalinstellingen
- Automatische taalherkenning
- Handmatige taalkeuze (40+ talen)
- Meerdere taalondersteuning
- Aangepaste woordenschat
Transcriptie-opties
- Sprekerdiarisatie
- Interpunctie
- Tijdstempels
- Opmaakvoorkeuren
Stap 3: Meerdere sprekers behandelen
Configureer sprekeridentificatie:
Sprekerdetectie
- Schakel "Meerdere sprekers" in
- Stel aantal sprekers in (2-10)
- Automatisch sprekers detecteren
- Handmatige sprekertoewijzing
Sprekerlabels
- Spreker 1, Spreker 2, enz.
- Aangepaste namen (John, Sarah)
- Rolgebaseerd (Interviewer, Gast)
- Aangepaste labels
Voorbeeld uitvoer:
[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology.
[00:00:20] Guest: Thank you for having me. I\'m excited to share my insights.
[00:00:25] Interviewer: Let\'s start with the basics. What is AI?
💡 Pro tip: Voor de beste resultaten met meerdere sprekers, zorg voor een duidelijke audiokenscheiding en minimaal achtergrondgeluid. Overweeg aparte microfoons voor elke spreker bij live-opnames.
Stap 4: Controleren & Bewerken
Beoordeel en verfijn je transcriptie:
Bewerkingshulpmiddelen
- Tekstcorrectie
- Spreker opnieuw toewijzen
- Aanpassing van tijdstempel
- Interpunctie bewerken
Kwaliteitscontroles
- Nauwkeurigheidsverificatie
- Controle sprekeridentificatie
- Formaatconsistentie
- Taalnauwkeurigheid
💡 Pro tip: Gebruik de sneltoetsen (⌘ + E om te bewerken, ⌘ + S om op te slaan) om je beoordelingsproces te versnellen. De AI leert van je correcties om toekomstige transcripties te verbeteren.
Stap 5: Exporteren & integratie
Kies je exportformaat en integratie-opties:
Exportformaten
Integratie-opties
- Direct downloaden
- Cloudopslag (Google Drive, Dropbox)
- API-toegang voor ontwikkelaars
- Webhook-meldingen
Voorbeeldindelingen:
SRT-formaat:
1
00:00:15,000 --> 00:00:20,000
Interviewer: Welcome to our podcast.
2
00:00:20,000 --> 00:00:25,000
Guest: Thank you for having me.
JSON-formaat:
{
"segments": [
{
"start": "00:00:15",
"end": "00:00:20",
"speaker": "Interviewer",
"text": "Welcome to our podcast."
}
]
}
💡 Pro-tip: Gebruik het JSON-formaat voor programmatische toegang of wanneer u de transcriptiegegevens verder moet verwerken. Het SRT-formaat is ideaal voor videobijschriften, terwijl VTT perfect is voor webvideospelers.
Geavanceerde functies en tips
Beheers geavanceerde functies om het meeste uit Voice Tools Suite te halen
Geavanceerde tekst-naar-spraak
Voice Cloning
Upload een stemmonster om een aangepaste stem te maken
Emotiecontrole
<prosody emotion="happy">I\'m excited to share this!</prosody>
Geavanceerde spraak-naar-tekst
Sprekerdiarisering
Identificeer automatisch verschillende sprekers
Aangepaste woordenschat
Voeg branchespecifieke termen toe voor betere nauwkeurigheid
Sneltoetsen
Klaar om uw inhoud te transformeren?
Begin vandaag nog met het maken van professionele voice-overs en transcripties