Voice Tools Suite: Komplet guide
Transformer tekst til naturlig tale og konverter lyd til tekst med AI-drevet præcision
AI-stemmer
Naturligt klingende stemmer
Sprog
Global support
Nøjagtighed
Talegenkendelse
Maksimal varighed
Pr. lydfil
📚 Hvad du vil lære
Tekst-til-tale (TTS)
- 1 Opret din første speak
- 2 Tilpas stemmeindstillinger
- 3 Brug af SSML til avanceret kontrol
Tale-til-tekst (STT)
- 4 Konverter dit første lydfil
- 5 Håndtering af flere talere
- 6 Eksport og formatering af resultater
Opret din første speak
Lær hvordan du konverterer tekst til naturligt klingende tale i 3 enkle trin
Trin 1: Vælg din stemme
1. Klik på "Ny Speak" i topmenuen
2. Vælg din foretrukne stemme:
Google WaveNet
Bedst til generel brug
OpenAI
Premium kvalitet
ElevenLabs
Mest naturlig
💡 Tip: Lyt til stemmeprøver, før du vælger. Hver stemme har unikke egenskaber
Trin 2: Indtast din tekst
1. Skriv eller indsæt din tekst i editoren
2. Brug SSML-tags til kontrol:
<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>
Eksempel: Brug pauses og betoning for at gøre din voice-over mere engagerende
Trin 3: Generer og eksporter
1. Klik på "Generer" for at oprette din lyd
2. Forhåndsvis resultatet
3. Vælg eksportformat:
MP3
Bedst til web
WAV
Høj kvalitet
OGG
Komprimeret
Tale-til-tekst: komplet guide
Forvandl dit lyd til nøjagtig tekst med AI-drevet transskription
Trin 1: Upload dit lydklip
Start med at uploade din lydfil:
- Understøttede formater: MP3, WAV, MP4, WebM, M4A
- Maksimal filstørrelse: 25 MB
- Maksimal varighed: 4 timer
- Batch-upload: Op til 10 filer på én gang
💡 Pro-tip: For bedste resultater skal du bruge klart lyd med minimal baggrundsstøj. Overvej at bruge støjreducerende software før upload.
Trin 2: Konfigurer indstillinger
Sprogindstillinger
- Automatisk sprogdetektion
- Manuelt sprogvalg (40+ sprog)
- Understøttelse af flere sprog
- Brugerdefineret ordforråd
Transskriptionsmuligheder
- Talerdiarisering
- Tegnsætning
- Tidsstempler
- Formateringsindstillinger
Trin 3: Håndtering af flere talere
Konfigurer taleridentifikation:
Talerregistrering
- Aktivér "Flere talere"
- Indstil antal talere (2-10)
- Auto-registrering af talere
- Manuel tildeling af talere
Talermærkater
- Taler 1, Taler 2 osv.
- Brugerdefinerede navne (John, Sarah)
- Rollebaseret (Interviewer, Gæst)
- Brugerdefinerede etiketter
Eksempeloutput:
[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology.
[00:00:20] Guest: Thank you for having me. I\'m excited to share my insights.
[00:00:25] Interviewer: Let\'s start with the basics. What is AI?
💡 Pro tip: For bedste resultater med flere talere, sørg for klar lydseparation og minimal baggrundsstøj. Overvej at bruge separate mikrofoner til hver taler i liveoptagelser.
Trin 4: Gennemse & Rediger
Gennemse og forfine din transkription:
Redigeringsværktøjer
- Tekstkorrektion
- Gen tildeling af taler
- Justering af tidsstempel
- Redigering af tegnsætning
Kvalitetskontroller
- Verifikation af nøjagtighed
- Tjek af taleridentifikation
- Formatkonsistens
- Sprog nøjagtighed
💡 Pro tip: Brug tastaturgenveje (⌘ + E for redigering, ⌘ + S for gem) for at fremskynde din gennemgang. AI’en lærer af dine rettelser for at forbedre fremtidige transskriptioner.
Trin 5: Eksport & integration
Vælg dit eksportformat og integrationsmuligheder:
Eksportformater
Integrationsmuligheder
- Direkte download
- Cloud storage (Google Drive, Dropbox)
- API-adgang for udviklere
- Webhook-underretninger
Format eksempler:
SRT-format:
1
00:00:15,000 --> 00:00:20,000
Interviewer: Welcome to our podcast.
2
00:00:20,000 --> 00:00:25,000
Guest: Thank you for having me.
JSON-format:
{
"segments": [
{
"start": "00:00:15",
"end": "00:00:20",
"speaker": "Interviewer",
"text": "Welcome to our podcast."
}
]
}
💡 Pro-tip: Brug JSON-format til programmatisk adgang eller når du skal behandle transskriptionsdata yderligere. SRT-formatet er ideelt til video-undertekster, mens VTT er perfekt til web-videoafspillere.
Avancerede funktioner og tips
Mestring af avancerede funktioner for at få mest muligt ud af Voice Tools Suite
Avanceret tekst-til-tale
Voice Cloning
Upload en stemmeprøve for at oprette en brugerdefineret stemme
Kontrol over følelser
<prosody emotion="happy">I\'m excited to share this!</prosody>
Avanceret tale-til-tekst
Taler-diarisering
Identificer automatisk forskellige talere
Brugerdefineret ordforråd
Tilføj branche-specifikke termer for bedre nøjagtighed
Tastaturgenveje
Klar til at transformere dit indhold?
Begynd at skabe professionelle voice-overs og transskriptioner i dag