Araştırma

Dünyanın ilk yüzde 100 yapay zeka tarafından oluşturulan podcast’lerinden birini nasıl yaptım?

Yapay zeka ve makine öğrenimiyle podcast geliştirme üzerine araştırma ve çalışmaların sayısı artıyor. Eric Borgos da bu meraklı podcast araştırmacılarından birisi. Borgos, bu yazısında dünyanın ilk yüzde 100 yapay zeka tarafından oluşturulan podcast’lerinden birini nasıl yaptığını ayrıntılarıyla anlatıyor.

Yayınlanma tarihi

2 yıl önce

11 Kasım 2022

Yazar :

Podcast Turkey

Birkaç hafta önce, “Joe Rogan interviews Steve Jobs” adlı AI (yapay zeka) tarafından oluşturulan bir podcast, dinlerken yarattığı gerçekçilik hissiyle viral oldu. Etkileyici bir başarıydı, ama gerçekten de halihazırda çalışmakta olduğum çeşitli teknolojilerin (GPT-3 ve ses klonlama gibi) gelişmiş bir kombinasyonuydu; bu yüzden kendi versiyonumu yapmaya karar verdim.

Ünlü kişilere dayalı yapay zeka modelleri oluşturmanın bazı potansiyel sorunları var. Yasal olarak ünlülerin adlarının, fotoğraflarının, suretlerinin ve seslerinin izinsiz kullanımını yasaklayan bir “tanıtım hakkı” var. Bunu bir parodi olarak veya eğitim amaçlı yapıyorsanız bunu aşabilirsiniz, ancak bu benim durumum için geçerli değildi.

Bunun yerine, şunu buldum:

BoredHumans.com AI Podcast’i

Katılan ünlü yok. Podbot.ai‘den ilham aldı; ancak benim sürümüm daha otomatik. Çünkü podcast bölüm başlığı kendi başına geliyor. Diğer benzer AI podcast’leri arasında Lexman ve Roborah bulunuyor.

Bu proje için programlamanın ilk adımı, AI’nın daha sonra podcast’in başlığı olarak kullanılacak bir konu hakkında “düşünmesini” sağlamaktı. Bir ML modelini blog gönderi başlıkları üzerine eğitmenin podcast’lerden daha iyi olacağına karar verdim. Bu yüzden iyi olanları yazmayı öğrenmesi için 100.000 blog gönderi başlığını açık kaynaklı aitextgen‘e koydum; ama bu korkunç oldu (neden olduğundan emin değilim). Bunun yerine GPT-J kullanan NLPCloud.com Metin Oluşturma API‘sine geçtim (GPT-3’e benzer). İnce ayara gerek yoktu; bunun yerine en iyi neyin işe yaradığını görmek için çeşitli istemleri denemeye güvendim. Denediğim bazı iyi şeyler şunlardı:

“Bir blog yazısı yazdım. Adı:”, “Blog yazımın adı:”, “Adında bir yazı yazdım:”, “Blog yazım için bir isim düşündüm. Bu:”, “İlk 3 blog gönderisi adı:” ve “İlk 3 makale adı:”.

Hepsi otomatikleştirilmiş olsa da, rahatsız edici veya r-dereceli (r-rated) podcast’leri çıkarmak istemedim. Bu yüzden kullanılmadan önce her bir başlığa manuel olarak baktım ve uygunsuz olanları sildim. Ayrıca, kullanmak istemediğim kelimeleri içeren başlıkları otomatik olarak silmek için bir “kötü kelimeler” filtresi ekledim, ancak ben onları yönetmedikçe bazıları yine de geçti.

Ardından, önceden oluşturduğum 8 ana sunucudan oluşan bir kitaplıktan bölüm için bir AI ana sunucusu seçecek şekilde programladım. Her ana sunucunun adı ve soyadı, açık kaynaklı nameCreator (AI değil) kullanılarak oluşturuldu ve ana sunucunun görüntüsü “AI-Generated Faces” web sitemden rastgele seçildi. Daha sonra her ana bilgisayar, resemble.ai‘den bir AI sesiyle rastgele eşleştirildi (bunun kullanımı maliyetli, ancak Coqui ve Tortoise gibi açık kaynaklı alternatifler var).

Podcast’in metin içeriğini almak için başlığı NLPCloud’un Blog Post Generator API‘siyle destekledim. AI podcast içeriği için özel olarak herhangi bir program veya API bulamadım; bu yüzden şimdilik blog yazısı olması gereken şeyi kullanıyorum. Programlamam, ortaya çıkan metni otomatik olarak SSML ile çoğaltıyor; belirli kısımlarını daha yüksek sesle (başlık ve her bölümün adı gibi) yapıyor ve ana sunucunun sesini daha insancıl hale getirmek için her paragrafın arasına duraklamalar ekliyor. Resemble.ai API‘sinden Text-To-Speech daha sonra bu metni bir sese dönüştürüyor.

Resmi bir podcast gibi görünmesi için her bölüme Storyblocks.com‘dan indirdiğim kısa MP3 dosyaları kitaplığından rastgele seçilmiş giriş ve çıkış müziği verdim. Her ikisi de açık kaynak olan FFmpeg ve MoviePy, her ikisi de açık kaynak, daha sonra sesi otomatik olarak karıştırmak için kullanıldı.

Bölümler için kapak resmi, ona bir cümle (“istem”) verdiğiniz ve konseptinizi makine öğrenimini kullanarak bir görüntüye dönüştürdüğünüz yeni bir metinden görüntüye program olan Stable Difusion (açık kaynak) kullanılarak oluşturuldu. Her podcast bölümü için başlık bilgi istemiydi.

Podcast’i sunucumda barındırabilirdim, ancak bunun yerine ücretsiz hesap seviyelerini kullanarak BuzzSprout’a yükledim ve podcast oynatıcılarını BoredHumans.com AI Podcast sayfama yerleştirdim. Bunu kısmen daha resmi görünmesi için yaptım, ama aynı zamanda podcast’i Apple, Spotify, Amazon ve podcast’lerin duyulduğu diğer yerlere gönderebilmem için yaptım.

Şu anda yalnızca 1 bölümüm tamamlandı, ancak planım 100 bölüm daha oluşturmak ve haftada 1 bölümü otomatik olarak yüklemek için BuzzSprout API’sini kullanmak için kod yazmak. Podcast’ler RSS beslemeleri kullanılarak dağıtılır, yani yeni bir bölüm yüklediğimde tüm büyük podcast uygulamalarında otomatik olarak görünecek.

Ayrıca sesli podcast’imi Synthesia kullanarak bir video podcast’e dönüştürmeyi düşünüyorum, aşağıya bakın:

AI Video Barındırıcıları

Ancak bununla ilgili potansiyel bir sorun var. Şartlar ve koşullar sayfasında, yapmak istediklerimi yasaklayan iki kısıtlama var:

Kısıtlama 1: Stok Avatar’ın her türlü görüş beyanında bulunduğu “Kullanıcı Tarafından Oluşturulan İçerikte”, herhangi bir kişisel tercih veya deneyimin Stok Avatar’ın tercihleri veya deneyimleriymiş gibi ifade edilmesi de buna dahil.

Kısıtlama #2: Stok Avatar’ın din, siyaset, ırk, cinsiyet, cinsellik veya belirli demografik özelliklere duyarlı olduğu bilinen diğer benzer konularla ilgili herhangi bir gerçek beyanında bulunduğu “Kullanıcı Tarafından Oluşturulan İçeriklerde.”

Çözüm benim için başka bir benzer hizmeti kullanmak veya kendi metinden videoya yazılımımı oluşturmak olurdu; bu yüzden üzerinde çalışacağım bir sonraki şey bu.

Kaynak: Eric Borgos / Medium

Benzer konular:

Bir sonraki

Fırsatlar getiren bir podcast sponsorluk teklifi nasıl yazılır?

Kaçırmayın

Yeni bir topluluk podcast dizini: Podcast Guide

Okumaya devam et

Yorum yapmak için tıklayın

Araştırma

Podcast tüketicilerinin yüzde 77’si artık ses ve görüntü arasında geçiş yapıyor

15-64 yaş arası 1.000 ABD’li podcast tüketicisiyle yapılan yeni bir anket, %77’sinin ses ve video arasında geçiş yaptığını ortaya koyuyor; bu da mecranın hibrit kullanımına doğru büyük bir kayma olduğunu gösteriyor. Tüketicilerin dörtte birinden azı (%23) yalnızca ses veya video kullanıyor.

Yayınlanma tarihi

1 hafta önce

4 Nisan 2025

Podcast Turkey

Coleman Insights Başkan Yardımcısı/Danışmanı Jay Nachlis ve Amplifi Media Kurucusu/CEO’su Steve Goldstein, Chicago McCormick Place Kongre Merkezi’nde düzenlenen Podcast Movement Evolutions’ın açılış oturumunda bu veri noktasını ve “The State of Video Podcasting 2025” başlıklı çalışmalarından elde ettikleri diğer bulguları sundu.

Çalışma ayrıca genç ve yaşlı kullanıcıların podcast tüketim alışkanlıklarında çok az fark olduğunu belirtiyor. Nachlis, “15-29 yaş arasındaki Z kuşağı podcast tüketicilerine baktığımızda, %83’ünün ses ve videoyu birbirinin yerine kullandığını görüyoruz; bu oran genel nüfustan sadece biraz daha yüksek. Video podcast’ler gençlere özgü bir fenomen değil” diyor.

Araştırma ayrıca podcast tüketicilerinin YouTube’daki içeriğe erişim yöntemlerinde de kayda değer bir değişim olduğunu ortaya koyuyor. Goldstein, Coleman/Amplifi’nin sadece 18 ay önce yaptığı çalışmada YouTube podcast tüketiminin çoğunun akıllı telefonlarda gerçekleştiğini, bunu bilgisayarların takip ettiğini ve Akıllı TV’lerin çok gerilerde kaldığını açıklıyor. Bugün ise Smart TV kullanımı önemli ölçüde artmış ve ikinci sırada bilgisayarlarla eşitlenmiş durumda. Goldstein’ın da belirttiği gibi, “Çok sayıda insanın YouTube’u podcast için kullandığını söylemek yeterli değil. YouTube’u kullanma biçimleri de değişiyor.”

Kaynak: PodNews

Okumaya devam et

Araştırma

Sesli yapay zekaya ilgi artıyor, ancak reklam ajanslarına göre hala insan sesi üstün

Voices pazar araştırmasına göre, sesli yapay zekaya ilgi artmaya devam ediyor, ancak reklam ajansları insan sesinin hala üstün olduğu konusunda hemfikir.

Yayınlanma tarihi

1 hafta önce

2 Nisan 2025

Podcast Turkey

Dünyanın önde gelen ses çözümleri platformu Voices, bugün reklam ajanslarının üretken yapay zeka çağında seslendirmeyi nasıl tedarik ettiklerini ve kullandıklarını araştıran bir pazar araştırması olan Reklam Ajansı Trendleri Raporunu yayınladı.

Seslendirme yapan yüzlerce reklam ajansıyla bağlantı kuran rapor, katılımcıların yarısından fazlasının (%56) yaratıcı sürecin bir noktasında yapay zeka sesi kullandığını ortaya koyuyor. Buna rağmen, sektör genel olarak, özgünlüğü daha güçlü duygusal rezonans ve ilişkilendirilebilirlik sağladığı için insan sesinin nihai prodüksiyonlar için yeri doldurulamaz olduğu konusunda hemfikir.

Ajansı seslendirme için Voices kullanan HOGARTH STUDIOS’ta Yardımcı Ses Prodüktörü Kyle St. Agathe, “Yapay zeka ve teknolojinin yükselişiyle zaman çizelgelerini karşılamak daha kolay hale geliyor olabilir, ancak her dilde tercüme edilebilen özgünlüğe duyulan ihtiyaç da devam ediyor” diyor.

Rapor, yapay zeka tarafından üretilen seslendirmelerin yer tutucular ve ilk taslaklar sağlayarak yaratıcı süreci hızlandırmaya yardımcı olduğunu ve müşteri inceleme aşamalarında hızlı yinelemelere olanak tanıdığını ortaya koydu.

Voices Pazarlama Direktörü Ruth Zive, “Ajansların, özellikle yeteneklerin çıkarlarını gözeten etik bir şekilde yaklaşıldığında, yaratıcı süreçlerine yapay zeka seslendirmelerini dahil etmeye yavaş yavaş ısındığını görüyoruz. Seslendirmede yapay zeka söz konusu olduğunda, asıl fırsat, yaratıcı içeriğin gerçekten yankı uyandırmasını sağlayan insan dokunuşunu kaybetmeden iş akışlarında verimliliği artırmak arasındaki doğru dengeyi bulmakta yatıyor” diyor.

Raporda öne çıkan diğer önemli noktalar arasında şunlar yer alıyor:

Teknoloji, seslendirme iş akışlarını yeniden tanımlıyor: Ankete katılan ajansların %87’si, seslendirme kayıtlarının çoğunun uzaktan tamamlandığını ve Voices, Zoom, Source Connect, Google Meet ve Microsoft Teams’in işbirliği için en yaygın kullanılan platformlar olduğunu söylüyor.
Ajans kreatifleri yapay zeka ses kullanımı konusunda ikiye bölünmüş durumda: Ajansların %56’sı kreatif süreçlerinde yapay zeka sesi kullanırken, bu grubun %80’i yapay zeka sesini kaba çekimlerde ve cızırtılarda kullanıyor. Ajansların %44’ü ise insan sesini tercih ettiklerini, kaliteyle ilgili endişelerini ve etik kaygılarını gerekçe göstererek yapay zeka sesi kullanmıyor.
Seslendirme yeteneklerinde çeşitlilik önemli: Katılımcıların %63’ü Kuzey Amerika dışından seslendirme yeteneklerini işe aldı; bu da reklamcılıkta yerelleştirmenin önemini ve talebini yansıtıyor.
Müşteriler arkadaş canlısı ve ilişki kurulabilir sesler istiyor: “İlgili”, ‘Duygusal’ ve ‘Empatik’, müşteri brief’lerinde en sık talep edilen seslendirme tonları oldu.

Raporun tamamını BURADAN okuyabilirsiniz.

Okumaya devam et

Araştırma

Z kuşağı podcastleri nasıl dinliyor?

YouTube genel olarak podcast dinlemeye hakim olsa da, Transistor.fm’in son anketi Z Kuşağının Spotify’ı güçlü bir şekilde tercih ettiğini (%56) ve video yerine yalnızca ses formatlarını (76%) tercih ettiğini ortaya koyuyor. Bu bulgular genç dinleyicilerin podcast tüketim alışkanlıkları hakkındaki yaygın varsayımları sorguluyor.

Yayınlanma tarihi

4 hafta önce

15 Mart 2025

Podcast Turkey

Video mu yoksa sesli podcast’ler mi? Podcast barındırma şirketi Transistor tarafından yapılan yeni bir ankete göre, Z kuşağı podcast hayranlarına (13-28 yaş arası) göre video skibidi, ses ise slay – ezici bir çoğunlukla sesli podcastleri tercih ediyorlar. 76’sı öncelikli olarak sesli podcast dinlerken, %18’i ses ve videonun bir karışımını tüketiyor ve küresel ankete göre sadece %6’sı öncelikli olarak video podcast izliyor.

Temel bulgular

Spotify, Z kuşağının tercih ettiği podcast platformu olmaya devam ediyor (%56)
Yalnızca sesli dinleme baskındır (%76)
Z kuşağı podcast tüketiminin çoğu evde mobil cihazlarda gerçekleşiyor (%59)
Kurgu podcast’leri bu demografik grup arasında şaşırtıcı derecede popüler

Podcast sektörü son yıllarda YouTube ve video podcast’ler hakkındaki tartışmalarla dolup taşıyor.

Edison Research, YouTube’un artık tüm yaş gruplarında en popüler podcast tüketim platformu olduğunu ve dinleyicilerin %31’ini yakaladığını söylüyor. Sonuçlarına göre Spotify %27 ile ikinci sırada ve Apple %15 ile üçüncü sırada.

Sektördeki pek çok gözlemci, YouTube’un büyümesinin büyük bir kısmının, podcast hayranlarının oluşturduğu genç nesil Z kuşağından kaynaklandığını varsayıyordu.

İlginçtir ki, Edison Research’ün Gen Z Podcast Dinleyicisi raporunda Gen Z’nin hangi podcast uygulamasını tercih ettiğine dair veri yer almıyor.

Bulabildiğim tek veri 2021 yılında yaptığımız ankettendi.

Bu boşluğu doldurmak için, özellikle “Z Kuşağı podcast hayranlarına” yönelik yeni bir anket düzenledik. Anket, Şubat 2025’te 100’den fazla Z Kuşağı podcast dinleyicisinden (13-29 yaş arası) demografik ve dinleme alışkanlığı verilerini topladı.

Z kuşağı hangi podcast uygulamasını tercih ediyor?

Spotify hala Z kuşağı için en popüler podcast uygulaması. Katılımcıların %56’sı bunu diğer seçeneklere tercih ediyor (2021 anketimizdeki %47’den fazla). Ayrıca, video etrafındaki abartıya rağmen, çoğu (%88) yalnızca ses dinlerken, %12’si ses ve video tüketiminin bir karışımını tercih ediyor.

Katılımcıların %21’i podcast’leri tükettikleri yerin YouTube olduğunu söylüyor. Bu sayı 2021 anketimizden (%10) daha yüksek. Spotify kullanıcılarının aksine, YouTube kullanıcılarının video tüketme olasılığı daha yüksek: %52’si her zaman veya bir süre video podcast’leri izlediklerini belirtti.

Apple Podcasts %10 ile üçüncü sırada yer aldı (2021’deki %16’dan düşüş). Z kuşağı katılımcıları arasında Apple Podcasts kullanıcıları Spotify ve YouTube kullanıcılarından biraz daha yaşlı olma eğilimindedir.

Ankete katılanların bahsettiği diğer podcast uygulamaları arasında Pocket Casts, Podcast Addict ve AntennaPod yer alıyor.

Z kuşağı sesli podcastleri mi yoksa görüntülü podcastleri mi tercih ediyor?

Anket verilerimize göre Z kuşağı podcast hayranları sesli yayınları tercih ediyor!

“Podcastleri en çok nasıl tüketiyorsunuz?” sorusuna Z kuşağı katılımcılarımız şu yanıtı verdi:

Öncelikle ses dinliyorum – %76
Ses ve videonun karışımı – %18
Öncelikle video izliyorum – %6

Z kuşağı evde podcast tüketiyor

Şaşırtıcı olmayan bir şekilde, Z kuşağı katılımcılarımız arabada eski nesiller kadar müzik dinlemiyor.

“Podcast’leri en çok nerede tüketiyorsunuz?” sorusuna verilen 102 yanıta dayalı anket verilerimiz :

Evde, telefonumda/tabletimde – %59
Otobüste/toplu taşımada – %12
Yürürken / bisiklet sürerken – %10
Arabada – %9
Diğer – %6
Evde, televizyonda – %3
İşyerinde, telefonumda – %2

“Bağlantılı TV” ve “oturma odası podcast video tüketimi” etrafındaki tüm abartılara rağmen, ankete katılanların yalnızca %3’ü podcast’leri çoğunlukla evde televizyonlarında tükettiğini söyledi.

Z kuşağının en çok dinlediği podcast’ler hangileri?

Bu jenerasyonda kurgusal drama ve korkunun ne kadar popüler olduğunu görünce şaşırdım. İşte en iyi podcast’ler, kaç kez bahsedildiklerine göre sıralanmış:

Night Vale’ye Hoş Geldiniz – 11 bahis
Magnus Arşivleri – 11 bahis
Kötü Niyetli – 7 kez bahsediliyor
Magnus Protokolü – 6 kez bahsediliyor
Kardeşim Kardeşim ve Ben – 5 bahis

Tekrar tekrar adı geçen diğer diziler arasında şunlar yer alıyor: Rotten Mango, Acquired, Joe Rogan, Life in the World to Come, Wolf 359, The Daily, If Books Could Kill, So True with Caleb Hearon ve Normal Gossip.

Bonus: “Popüler podcaster” olarak kimleri görüyorlar?

Anketin sonunda, “Popüler podcaster’ları düşündüğünüzde aklınıza hangi isimler geliyor?” diye sordum. Joe Rogan, açık ara en çok bahsedilen isimdi:

Joe Rogan – 28 kez bahsediliyor
Alex Cooper – 5 kez bahsediliyor
Theo Von – 5 kez bahsediliyor
Ona Baba Deyin – 3 kez bahsedildi

Peki bu durum podcast yayıncıları için ne anlama geliyor?

2025 anketimiz, Z Kuşağı podcast dinleyicileriyle ilgili yaygın sektör varsayımlarını sorgulayan birkaç önemli içgörüyü ortaya koyuyor:

Platform tercihleri genel eğilimlerden farklıdır: YouTube genel podcast tüketimine öncülük ederken, Z Kuşağı hala Spotify’ı güçlü bir şekilde tercih ediyor. Spotify’ın genç nesli nasıl ele geçirdiği hakkında daha fazla bilgi edinin .
Ses ölmedi: Z kuşağı podcast hayranları, endüstrinin videoya geçişine rağmen ezici bir çoğunlukla yalnızca sesli içeriği tercih ediyor. Bu, içerik oluşturucuların içeriklerini geliştirmediği sürece video eklemek için baskı hissetmemeleri gerektiğini gösteriyor. Daha genç bir demografiyi hedefliyorsanız, sesli bir podcast başlatmak için harika bir zaman.
Kurgu türünün şaşırtıcı gücü: Z kuşağı dinleyicileri arasında kurgu türündeki anlatı podcast’lerinin popülerliği, podcast pazarında sıklıkla gözden kaçan bir fırsatı vurguluyor.
Mobil öncelikli tüketim: Tüketicilerin %59’u evde ağırlıklı olarak mobil cihazlardan müzik dinliyor; dolayısıyla mobil dinleme deneyimlerini optimize etmek hâlâ çok önemli.

[Anket hakkında ham veriler ve metodoloji dahil daha fazla bilgi için bu bağlantıyı ziyaret edinebilirsiniz]

Kaynak: Transistor.fm

Okumaya devam et