🔥 BARU: Konversi Teks ke Suara & Sebaliknya!

Suite Alat Suara: Panduan Lengkap

Ubah teks menjadi ucapan alami dan konversi audio ke teks dengan presisi berbasis AI

220+

Suara AI

Suara terdengar alami

40+

Bahasa

Dukungan global

99.5%

Akurasi

Pengenalan ucapan

4h

Durasi Maksimum

Per file audio

📚 Apa yang Akan Anda Pelajari

Teks-ke-Ucapan (TTS)

  1. 1 Membuat sulih suara pertama Anda
  2. 2 Menyesuaikan pengaturan suara
  3. 3 Menggunakan SSML untuk kontrol lanjutan

Ucapan-ke-Teks (STT)

  1. 4 Mengonversi file audio pertama Anda
  2. 5 Menangani beberapa pembicara
  3. 6 Mengekspor dan memformat hasil
1

Membuat sulih suara pertama Anda

Pelajari cara mengubah teks menjadi ucapan alami dalam 3 langkah sederhana

Langkah 1: Pilih Suara Anda

1. Klik "Sulih Suara Baru" di menu atas

2. Pilih suara pilihan Anda:

Google WaveNet

Terbaik untuk penggunaan umum

OpenAI

Kualitas premium

ElevenLabs

Paling alami

💡 Tip: Dengarkan sampel suara sebelum memilih. Setiap suara memiliki karakteristik unik

Langkah 2: Masukkan Teks Anda

1. Ketik atau tempel teks Anda di editor

2. Gunakan tag SSML untuk kontrol:

<speak>
<prosody rate="slow">Welcome to our guide.</prosody>
<break time="1s"/>
<prosody pitch="high">Let\'s get started!</prosody>
</speak>

Contoh: Gunakan jeda dan penekanan untuk membuat narasi Anda lebih menarik

Langkah 3: Hasilkan & Ekspor

1. Klik "Hasilkan" untuk membuat audio Anda

2. Pratinjau hasilnya

3. Pilih format ekspor:

MP3

Terbaik untuk web

WAV

Kualitas tinggi

OGG

Terkompresi

2

Ucap-ke-Teks: Panduan Lengkap

Ubah audio Anda menjadi teks akurat dengan transkripsi bertenaga AI

Langkah 1: Unggah audio Anda

Mulailah dengan mengunggah file audio Anda:

  • Format yang didukung: MP3, WAV, MP4, WebM, M4A
  • Ukuran file maksimum: 25 MB
  • Durasi maksimum: 4 jam
  • Unggah massal: Hingga 10 file sekaligus

💡 Pro Tip: Untuk hasil terbaik, gunakan audio jernih dengan gangguan latar belakang minimal. Pertimbangkan menggunakan perangkat lunak reduksi kebisingan sebelum mengunggah.

Langkah 2: Konfigurasikan Pengaturan

Pengaturan Bahasa

  • Deteksi bahasa otomatis
  • Pemilihan bahasa manual (40+ bahasa)
  • Dukungan multi-bahasa
  • Kosakata kustom

Opsi transkripsi

  • Pemisahan pembicara
  • Tanda baca
  • Cap Waktu
  • Preferensi pemformatan

Langkah 3: Menangani beberapa pembicara

Konfigurasi identifikasi pembicara:

Deteksi pembicara

  • Aktifkan "Beberapa Pembicara"
  • Atur jumlah pembicara (2-10)
  • Deteksi pembicara otomatis
  • Penugasan pembicara manual

Label pembicara

  • Pembicara 1, Pembicara 2, dll.
  • Nama kustom (John, Sarah)
  • Berdasarkan peran (Penanya, Tamu)
  • Label kustom

Contoh keluaran:

[00:00:15] Interviewer: Welcome to our podcast. Today we\'re discussing AI technology. [00:00:20] Guest: Thank you for having me. I\'m excited to share my insights. [00:00:25] Interviewer: Let\'s start with the basics. What is AI?

💡 Tips pro: Untuk hasil terbaik dengan beberapa pembicara, pastikan pemisahan audio yang jelas dan kebisingan latar belakang minimal. Pertimbangkan menggunakan mikrofon terpisah untuk setiap pembicara dalam rekaman langsung.

Langkah 4: Tinjau & Edit

Tinjau dan perbaiki transkripsi Anda:

Alat pengeditan

  • Koreksi teks
  • Penugasan ulang pembicara
  • Penyesuaian cap waktu
  • Pengeditan tanda baca

Pemeriksaan kualitas

  • Verifikasi akurasi
  • Pemeriksaan identifikasi pembicara
  • Konsistensi format
  • Akurasi bahasa

💡 Pro Tip: Gunakan pintasan keyboard (⌘ + E untuk edit, ⌘ + S untuk simpan) untuk mempercepat proses tinjau Anda. AI akan belajar dari koreksi Anda untuk meningkatkan transkripsi di masa depan.

Langkah 5: Ekspor & Integrasi

Pilih format ekspor dan opsi integrasi Anda:

Format ekspor

TXT Teks biasa dengan stempel waktu
SRT Format subtitle
VTT Teks video web
JSON Data terstruktur

Opsi integrasi

  • Unduhan langsung
  • Penyimpanan cloud (Google Drive, Dropbox)
  • Akses API untuk pengembang
  • Notifikasi webhook

Contoh format:

Format SRT:

1 00:00:15,000 --> 00:00:20,000 Interviewer: Welcome to our podcast. 2 00:00:20,000 --> 00:00:25,000 Guest: Thank you for having me.

Format JSON:

{ "segments": [ { "start": "00:00:15", "end": "00:00:20", "speaker": "Interviewer", "text": "Welcome to our podcast." } ] }

💡 Tip Profesional: Gunakan format JSON untuk akses terprogram atau saat Anda perlu memproses data transkripsi lebih lanjut. Format SRT ideal untuk subtitle video, sedangkan VTT sempurna untuk pemutar video web.

3

Fitur dan Tips Lanjutan

Kuasai fitur lanjutan untuk mendapatkan hasil maksimal dari Voice Tools Suite

Teks-ke-Suara Lanjutan

Voice Cloning

Unggah sampel suara untuk membuat suara kustom

Kontrol Emosi

<prosody emotion="happy">I\'m excited to share this!</prosody>

Ucapan-ke-Teks Lanjutan

Diarisasi Pembicara

Identifikasi pembicara berbeda secara otomatis

Kosakata Kustom

Tambahkan istilah khusus industri untuk akurasi yang lebih baik

Pintasan Keyboard

⌘ + N Proyek Baru
⌘ + P Pratinjau Audio
⌘ + E Ekspor
⌘ + / Tampilkan semua pintasan

Siap Mengubah Konten Anda?

Mulailah membuat pengisi suara profesional dan transkripsi hari ini