Suite Alat Suara: Panduan Lengkap
Ubah teks menjadi ucapan alami dan konversi audio ke teks dengan presisi berbasis AI
Suara AI
Suara terdengar alami
Bahasa
Dukungan global
Akurasi
Pengenalan ucapan
Durasi Maksimum
Per file audio
📚 Apa yang Akan Anda Pelajari
Teks-ke-Ucapan (TTS)
- 1 Membuat sulih suara pertama Anda
- 2 Menyesuaikan pengaturan suara
- 3 Menggunakan SSML untuk kontrol lanjutan
Ucapan-ke-Teks (STT)
- 4 Mengonversi file audio pertama Anda
- 5 Menangani beberapa pembicara
- 6 Mengekspor dan memformat hasil
Membuat sulih suara pertama Anda
Pelajari cara mengubah teks menjadi ucapan alami dalam 3 langkah sederhana
Langkah 1: Pilih Suara Anda
1. Klik "Sulih Suara Baru" di menu atas
2. Pilih suara pilihan Anda:
Google WaveNet
Terbaik untuk penggunaan umum
OpenAI
Kualitas premium
ElevenLabs
Paling alami
💡 Tip: Dengarkan sampel suara sebelum memilih. Setiap suara memiliki karakteristik unik
Langkah 2: Masukkan Teks Anda
1. Ketik atau tempel teks Anda di editor
2. Gunakan tag SSML untuk kontrol:
<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>
Contoh: Gunakan jeda dan penekanan untuk membuat narasi Anda lebih menarik
Langkah 3: Hasilkan & Ekspor
1. Klik "Hasilkan" untuk membuat audio Anda
2. Pratinjau hasilnya
3. Pilih format ekspor:
MP3
Terbaik untuk web
WAV
Kualitas tinggi
OGG
Terkompresi
Ucap-ke-Teks: Panduan Lengkap
Ubah audio Anda menjadi teks akurat dengan transkripsi bertenaga AI
Langkah 1: Unggah audio Anda
Mulailah dengan mengunggah file audio Anda:
- Format yang didukung: MP3, WAV, MP4, WebM, M4A
- Ukuran file maksimum: 25 MB
- Durasi maksimum: 4 jam
- Unggah massal: Hingga 10 file sekaligus
💡 Pro Tip: Untuk hasil terbaik, gunakan audio jernih dengan gangguan latar belakang minimal. Pertimbangkan menggunakan perangkat lunak reduksi kebisingan sebelum mengunggah.
Langkah 2: Konfigurasikan Pengaturan
Pengaturan Bahasa
- Deteksi bahasa otomatis
- Pemilihan bahasa manual (40+ bahasa)
- Dukungan multi-bahasa
- Kosakata kustom
Opsi transkripsi
- Pemisahan pembicara
- Tanda baca
- Cap Waktu
- Preferensi pemformatan
Langkah 3: Menangani beberapa pembicara
Konfigurasi identifikasi pembicara:
Deteksi pembicara
- Aktifkan "Beberapa Pembicara"
- Atur jumlah pembicara (2-10)
- Deteksi pembicara otomatis
- Penugasan pembicara manual
Label pembicara
- Pembicara 1, Pembicara 2, dll.
- Nama kustom (John, Sarah)
- Berdasarkan peran (Penanya, Tamu)
- Label kustom
Contoh keluaran:
[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology.
[00:00:20] Guest: Thank you for having me. I\'m excited to share my insights.
[00:00:25] Interviewer: Let\'s start with the basics. What is AI?
💡 Tips pro: Untuk hasil terbaik dengan beberapa pembicara, pastikan pemisahan audio yang jelas dan kebisingan latar belakang minimal. Pertimbangkan menggunakan mikrofon terpisah untuk setiap pembicara dalam rekaman langsung.
Langkah 4: Tinjau & Edit
Tinjau dan perbaiki transkripsi Anda:
Alat pengeditan
- Koreksi teks
- Penugasan ulang pembicara
- Penyesuaian cap waktu
- Pengeditan tanda baca
Pemeriksaan kualitas
- Verifikasi akurasi
- Pemeriksaan identifikasi pembicara
- Konsistensi format
- Akurasi bahasa
💡 Pro Tip: Gunakan pintasan keyboard (⌘ + E untuk edit, ⌘ + S untuk simpan) untuk mempercepat proses tinjau Anda. AI akan belajar dari koreksi Anda untuk meningkatkan transkripsi di masa depan.
Langkah 5: Ekspor & Integrasi
Pilih format ekspor dan opsi integrasi Anda:
Format ekspor
Opsi integrasi
- Unduhan langsung
- Penyimpanan cloud (Google Drive, Dropbox)
- Akses API untuk pengembang
- Notifikasi webhook
Contoh format:
Format SRT:
1
00:00:15,000 --> 00:00:20,000
Interviewer: Welcome to our podcast.
2
00:00:20,000 --> 00:00:25,000
Guest: Thank you for having me.
Format JSON:
{
"segments": [
{
"start": "00:00:15",
"end": "00:00:20",
"speaker": "Interviewer",
"text": "Welcome to our podcast."
}
]
}
💡 Tip Profesional: Gunakan format JSON untuk akses terprogram atau saat Anda perlu memproses data transkripsi lebih lanjut. Format SRT ideal untuk subtitle video, sedangkan VTT sempurna untuk pemutar video web.
Fitur dan Tips Lanjutan
Kuasai fitur lanjutan untuk mendapatkan hasil maksimal dari Voice Tools Suite
Teks-ke-Suara Lanjutan
Voice Cloning
Unggah sampel suara untuk membuat suara kustom
Kontrol Emosi
<prosody emotion="happy">I\'m excited to share this!</prosody>
Ucapan-ke-Teks Lanjutan
Diarisasi Pembicara
Identifikasi pembicara berbeda secara otomatis
Kosakata Kustom
Tambahkan istilah khusus industri untuk akurasi yang lebih baik
Pintasan Keyboard
Siap Mengubah Konten Anda?
Mulailah membuat pengisi suara profesional dan transkripsi hari ini