- Kampus Berkomitmen Berdampak melalui Kehadiran Tokoh Legislatif
- Perlengkapan canggih diserahkan untuk memperkuat keamanan daerah
- Akreditasi Baik Sekali diraih
- Gerakan lingkungan diperkuat, desa dan kelurahan berprestasi menerima insentif berseri
- Gagasan Strategis Unggul Raih Penghargaan Terbaik di Lembaga Pendidikan Perwira
- Arah Baru Pembangunan Daerah Diperkuat
- Tradisi menyemarakkan puncak perayaan ke-770
- Delapan TKP Berakhir, Tewas Saat Diamankan
- Peringatan 770 Tahun Diselenggarakan Sederhana, Arah Tumbuh Semakin Tangguh
- Ketangguhan Masyarakat Teruji di Tengah Erupsi Tanpa Korban Jiwa
Podcastle Luncurkan Model Teks ke Suara dengan 450 Suara AI
Podcasting platform Podcastle launches a text-to-speech model with more than 450 AI voices https://techcrunch.com/2025/03/03/podcasting-platform-podcastle-launches-a-text-to-speech-model-with-more-than-450-ai-voices/

Keterangan Gambar : Podcastle Luncurkan
Podcastle, sebuah platform merekam dan penyunting podcast, baru saja memasuki permainan AI-powered, text-to-speech dengan merilis model AI sendiri bernama Asyncflow v1.0. Platform ini juga akan menawarkan API untuk pengembang sehingga mereka dapat secara langsung mengintegrasikan model teks ke suara dalam aplikasi mereka.
Dengan model baru ini, Podcastle dapat menawarkan lebih dari 450 suara AI yang dapat menceritakan teks. Perusahaan ini menyatakan bahwa mereka mengembangkan teknologi dan model tersebut dengan cara yang memungkinkan biaya pelatihan dan penginfeksi yang rendah, memberikan mereka keuntungan atas kompetitor.
Dengan langkah ini, Podcastle bergabung dengan beberapa perusahaan startup lain, termasuk ElevenLabs, Speechify, dan WellSaid, yang telah mengembangkan teknologi dan model AI untuk mengubah jenis teks menjadi suara clip yang diungkapkan oleh AI. Teknologi ini dapat digunakan dalam kasus seperti pemasaran, iklan, kreativitas konten, pendidikan, dan pelatihan corporate.
Pemilik Podcastle, Arto Yeritsyan, mengatakan bahwa perusahaan ini selalu ingin membangun model teks ke suara, tetapi biaya pelatihan dan kebutuhan data untuk itu sangat tinggi.
“Kami ingin membangun model teks ke suara sejak awal. Namun, biaya pengembangan itu sangat tinggi. Terkait dengan perkembangan model bahasa besar terbaru, kami berhasil mencapai titik di mana kami dapat membangun model suara yang berkualitas tinggi tanpa memerlukan banyak data,” Yeritsyan mengatakan.
Perusahaan ini juga didukung dalam upaya mereka dengan dana Series A sebesar $13,5 juta pada tahun sebelumnya.
Yeritsyan mengatakan bahwa meskipun Podcastle mengutamakan biaya sebesar $40 per 500 menit konversi teks ke suara, ElevenLabs mengutamakan biaya sebesar $99 untuk hal yang sama.
Fitur cloning suara Podcastle juga akan diperbarui untuk membuat proses pelatihan lebih cepat.
Sebelumnya, proses pelatihan melibatkan membaca sekitar 70 kalimat berbeda. Sekarang, proses pelatihan hanya memerlukan beberapa detik rekor dari Anda untuk menciptakan klon suara Anda. Proses baru ini juga menggunakan AI Magic Dust Podcastle, yang diterbitkan pada tahun sebelumnya, untuk meningkatkan kualitas rekaman suara.
Dalam pengujian, suara yang dibuat dengan proses baru terdengar sedikit robotik, tetapi mengikuti nada kita. Perusahaan mengatakan bahwa, dalam jangka panjang, fitur ini akan diperbaiki. Selain itu, Anda dapat melatih sampel suara Anda untuk mendapatkan hasil yang berbeda.
Podcastle mengatakan bahwa, selain biaya, memiliki alat untuk rekaman, video, podcast, dan narasi AI di bawah satu situs yang dirancang akan memberikan mereka keuntungan atas kompetitor. Yeritsyan mengatakan bahwa, meskipun mayoritas pengguna Podcastle bekerja pada konten audio, video juga mulai menangkap perhatiannya.
Dalam pengembangan teknologi AI, Podcastle bergabung dengan beberapa startup lain yang telah mengembangkan teknologi dan model AI untuk mengubah jenis teks menjadi suara clip yang diungkapkan oleh AI.






