OpenAI, daha güvenilir konuşmadan metne dönüştürme ve arka plan gürültüsü ve aksanlar gibi zorlu ses koşullarının daha iyi işlenmesini sağlayan gpt-4o-transcribe ve gpt-4o-mini-transcribe adlı geliştirilmiş ses...
Gemini'nin yeni "Sesli Genel Bakış" özelliği, belgeleri ve sunumları podcast tarzı özetlere dönüştürüyor ve burada yapay zeka tarafından oluşturulan iki moderatör içeriği tartışıyor ve özetliyor.
Spotify Sesli Kitaplar (Spotify Audiobooks), bağımsız yazarları Spotify tarafından sesli kitap oluşturma ve yayınlama değerlendirmesi için kısa biçimli hikayeler göndermeye teşvik eden yeni bir web sitesi...
Üretken yapay zeka alanında bugüne kadar odak noktası çoğu metin, görüntü ve daha fazlasını üretmek için kullanılan metin tabanlı arayüzler oldu. Bir sonraki dalga ses gibi...
Yapay zeka girişimi Anthropic, yapay zeka destekli sohbet robotu Claude için ses yetenekleri üzerinde çalışıyor.
Yapay zeka şirketi Sesame, etkileyici derecede gerçekçi sesli asistan Maya'ya güç veren temel modeli yayınladı.
Podcast yayıncıları için önemli bir sorun olan üst üste binmiş sesleri düzenlemek, AudioShake'in geliştirdiği "Multi-Speaker" yapay zeka modeli ile artık mümkün. AudioShake'in üst üste binen sesleri...