Bizimle iletişime geçin

Haberler

Açık kaynaklı ve ücretsiz ses klonlama aracı: Zonos

Zyphra, metni doğal sesli konuşmaya dönüştüren ve sadece saniyeler süren ses verisi kullanarak sesleri klonlayabilen açık kaynaklı bir model olan Zonos-v0.1’i yayınladı. 

Yayınlanma tarihi

on

Zyphra, metni doğal sesli konuşmaya dönüştüren ve sadece saniyeler süren ses verisi kullanarak sesleri klonlayabilen açık kaynaklı bir model olan Zonos-v0.1’i yayınladı.

Yeni model beş dili destekliyor (İngilizce, Japonca, Çince, Fransızca ve Almanca) ve kullanıcılara konuşma hızı, perde, ses kalitesi ve duygusal ton üzerinde kontrol sağlıyor.

Zyphra’ya göre, model bir RTX 4090 GPU’da çalışırken sesi gerçek zamanlıdan daha hızlı işliyor. Zyphra, Zonos’u iki sürümde kullanıma sundu: saf bir dönüştürücü model ve dönüştürücülerle durum alanı modellerini birleştiren bir hibrit model.

Her iki sürüm de çoğunlukla İngilizce olmak üzere yaklaşık 200.000 saatlik ses verisi üzerinde eğitildi.

Kullanıcılar, yerel kullanım için kolay Docker kurulumuyla, kullanıcı dostu bir Gradio arayüzü aracılığıyla Zonos’u deneyebilirler. Modele ayrıca Zyphra Playground veya bulut tabanlı çözümleri tercih edenler için API aracılığıyla erişilebilir.

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haberler

Podcast ses kalitenizi iyileştiren araç: Audylicc

Audyllic, podcast’leri en sevdiğiniz radyo istasyonu kadar kolay dinlenebilir hale getirmek için yayın standardı Orban Optimod aracını kullanan podcast’ler için bir ses işleme aracı. Ayda iki saat ücretsiz kullanım hakkı oldukça cazip gözüküyor.

Yayınlanma tarihi

=>

Audyllic, podcast’leri en sevdiğiniz radyo istasyonu kadar kolay dinlenebilir hale getirmek için yayın standardı Orban Optimod aracını kullanan podcast’ler için bir ses işleme aracı. Ayda iki saat ücretsiz kullanım hakkı oldukça cazip gözüküyor.

Audyllic, dinleyicilerin daha pürüzsüz, daha tutarlı ve dinlemesi daha kolay bir deneyim yaşaması için ses dosyalarını profesyonel sınıf bir ses işlemcisi olan Orban’s Optimod kullanarak işleyen çevrimiçi bir platformu. Ses dosyalarına bu profesyonel sesi veriyor ve bunu yapmanın çok daha düşük maliyeti, donanım veya yazılım satın almak yerine gerektiğinde proje bütçesine eklenebiliyor.

Audyllic ayrıca ses yüksekliğinizi podcast standardı olan -16 LUF’a ayarlıyor.

Audyllic öncelikle podcast yayıncıları ve ses prodüksiyon stüdyoları için tasarlandı, ancak sesli kitaplar ve turist rehberleri için de kullanışlı olabilir ve müzik yapımcılarının mikslerinin radyoda nasıl ses çıkaracağını duymalarını sağlayabilir.

Audyllic’i kullanmak için ihtiyacınız olan tek şey, sesinizi bir PCM WAV dosyası (yaygın olarak kullanılan herhangi bir bit hızında veya örnekleme hızında, ancak 16 bit 44.1 veya 48 Khz öneriliyor) veya bir MP3, AAC veya M4A dosyası olarak kaydetme yöntemi. Ayrıca bir internet bağlantısı ve web tarayıcısı olması yeterli.

Okumaya devam et

Haberler

Apple Podcasts, podcast yayınlama süreçlerini kolaylaştırıyor

Apple, Apple Podcasts’te podcast yayınlama süreçlerini basitleştirmek ve hızlandırmak için adım atıyor. En temel değişikliklerden birisi önce bir Apple hesabı açma zorunluluğu ortadan kalkıyor.

Yayınlanma tarihi

=>

Apple, Apple Podcasts’te podcast yayınlama süreçlerini basitleştirmek ve hızlandırmak için adım atıyor. En temel değişikliklerden birisi önce bir Apple hesabı açma zorunluluğu ortadan kalkıyor.

Uzun süredir podcast yayıncılarının şikayet konusu olan Apple Podcast’e podcast gönderme süreci nihayet Apple’ın süreci basitleştiren yeni adımlarıyla kolaylaşacak gibi gözüküyor. Uzun süren eleştirilere kulak veren Apple, seçilen podcast sunucularını kullanan içerik oluşturucular için otomatik olarak program göndermeye yönelik yeni ve kolaylaştırılmış bir süreç başlattı.

Bu sayede önce bir Apple hesabı açma zorunluluğu ortadan kalkıyor. Lansman için seçilen podcast sunucuları şunlardır: Audioboom, Audiomeans, Ausha, Blubrry, Buzzsprout, Captivate, Castos, Hubhopper, Libsyn, Pinecast, Podbean, Podspace ve Transistor.

İçerik oluşturucular daha sonra isterlerse programlarını Apple Podcasts Connect’te talep edebilirler. Bunun için RSS beslemenize yerleştirmek üzere bir belirteç kullanan yeni ve kolaylaştırılmış bir süreç var. Yeni süreç aynı zamanda podcast’lerin bir hesaptan diğerine aktarılmasını da sağlıyor.

Eğer başka bir sunucuda yayın yapıyorsanız, mevcut program gönderme yöntemi ortadan kalkmıyor.

Okumaya devam et

Haberler

Spotify, ElevenLabs ile işbirliğine giderek yapay zeka ile kaydedilen sesli kitapları platformuna taşıdı

Spotify, ElevenLabs’ın yapay zeka ses teknolojisi kullanılarak seslendirilen sesli kitapları artık kabul ettiğini duyurdu. ElevenLabs ile yazarlar sesli kitaplarını aralarında Türkçe’nin de bulunduğu 29 dilde seslendirebiliyor.

Yayınlanma tarihi

=>

Spotify, ElevenLabs’ın yapay zeka ses teknolojisi kullanılarak seslendirilen sesli kitapları artık kabul ettiğini duyurdu. ElevenLabs’ın şu anda en tanınmış yapay zeka ses sağlayıcıları arasında yer aldığı göz önüne alındığında, bu yeni ortaklığın platformdaki yapay zeka anlatımlı sesli kitapların sayısını artırması bekleniyor.

Yapay zeka tarafından seslendirilen bir sesli kitap yüklemek için yazarların ElevenLabs’tan dosya paketini indirmeleri ve ardından Spotify’ın sesli kitap dağıtım hizmeti olan Findaway Voices’ı ziyaret etmeleri gerekiyor. Kaydın yayınlanabilmesi için daha sonra bir inceleme sürecinden geçmesi gerekiyor. Spotify, yapay zeka tarafından seslendirilen başlıkları etiketliyor.

ElevenLabs ile yazarlar sesli kitaplarını aralarında Türkçe’nin de bulunduğu 29 dilde seslendirebiliyor. Ücretsiz sürüm her ay yalnızca 10 dakikalık metinden konuşmaya izin verirken, 99 $/ay Pro planı 500 dakikaya kadar anlatım sağlıyor.

Bu son ortaklık, Spotify’ın Google Play Books ile yapay zeka anlatımlı sesli kitaplar sunmak üzere işbirliği yapmasından iki yıl sonra gerçekleşti. Spotify sesli kitap kütüphanesini genişletmek için daha fazla şirketle ortaklık yapmayı planlıyor.

Bununla birlikte, yapay zeka tarafından üretilen sesli kitapların yükselişinin yayıncılık camiasında önemli tartışmalara yol açması bekleniyor. Bazı sektör profesyonelleri, bu yapay zeka kayıtlarının dinleyiciler için sesli kitapların genel kalitesini tehlikeye atabileceğini savunuyor.

Kaynak: TechCrunch

Okumaya devam et

En son