Bizimle iletişime geçin

Araştırma

Dünyanın ilk yüzde 100 yapay zeka tarafından oluşturulan podcast’lerinden birini nasıl yaptım?

Yapay zeka ve makine öğrenimiyle podcast geliştirme üzerine araştırma ve çalışmaların sayısı artıyor. Eric Borgos da bu meraklı podcast araştırmacılarından birisi. Borgos, bu yazısında dünyanın ilk yüzde 100 yapay zeka tarafından oluşturulan podcast’lerinden birini nasıl yaptığını ayrıntılarıyla anlatıyor.

Yayınlanma tarihi

on

Birkaç hafta önce, “Joe Rogan interviews Steve Jobs” adlı AI (yapay zeka) tarafından oluşturulan bir podcast, dinlerken yarattığı gerçekçilik hissiyle viral oldu. Etkileyici bir başarıydı, ama gerçekten de halihazırda çalışmakta olduğum çeşitli teknolojilerin (GPT-3 ve ses klonlama gibi) gelişmiş bir kombinasyonuydu; bu yüzden kendi versiyonumu yapmaya karar verdim.

Ünlü kişilere dayalı yapay zeka modelleri oluşturmanın bazı potansiyel sorunları var. Yasal olarak ünlülerin adlarının, fotoğraflarının, suretlerinin ve seslerinin izinsiz kullanımını yasaklayan bir “tanıtım hakkı” var. Bunu bir parodi olarak veya eğitim amaçlı yapıyorsanız bunu aşabilirsiniz, ancak bu benim durumum için geçerli değildi.

Bunun yerine, şunu buldum:

BoredHumans.com AI Podcast’i

Katılan ünlü yok. Podbot.ai‘den ilham aldı; ancak benim sürümüm daha otomatik. Çünkü podcast bölüm başlığı kendi başına geliyor. Diğer benzer AI podcast’leri arasında Lexman ve Roborah bulunuyor.

Bu proje için programlamanın ilk adımı, AI’nın daha sonra podcast’in başlığı olarak kullanılacak bir konu hakkında “düşünmesini” sağlamaktı. Bir ML modelini blog gönderi başlıkları üzerine eğitmenin podcast’lerden daha iyi olacağına karar verdim. Bu yüzden iyi olanları yazmayı öğrenmesi için 100.000 blog gönderi başlığını açık kaynaklı aitextgen‘e koydum; ama bu korkunç oldu (neden olduğundan emin değilim). Bunun yerine GPT-J kullanan NLPCloud.com Metin Oluşturma API‘sine geçtim (GPT-3’e benzer). İnce ayara gerek yoktu; bunun yerine en iyi neyin işe yaradığını görmek için çeşitli istemleri denemeye güvendim. Denediğim bazı iyi şeyler şunlardı:

“Bir blog yazısı yazdım. Adı:”, “Blog yazımın adı:”, “Adında bir yazı yazdım:”, “Blog yazım için bir isim düşündüm. Bu:”, “İlk 3 blog gönderisi adı:” ve “İlk 3 makale adı:”.

Hepsi otomatikleştirilmiş olsa da, rahatsız edici veya r-dereceli (r-rated) podcast’leri çıkarmak istemedim. Bu yüzden kullanılmadan önce her bir başlığa manuel olarak baktım ve uygunsuz olanları sildim. Ayrıca, kullanmak istemediğim kelimeleri içeren başlıkları otomatik olarak silmek için bir “kötü kelimeler” filtresi ekledim, ancak ben onları yönetmedikçe bazıları yine de geçti.

Ardından, önceden oluşturduğum 8 ana sunucudan oluşan bir kitaplıktan bölüm için bir AI ana sunucusu seçecek şekilde programladım. Her ana sunucunun adı ve soyadı, açık kaynaklı nameCreator (AI değil) kullanılarak oluşturuldu ve ana sunucunun görüntüsü “AI-Generated Faces” web sitemden rastgele seçildi. Daha sonra her ana bilgisayar, resemble.ai‘den bir AI sesiyle rastgele eşleştirildi (bunun kullanımı maliyetli, ancak Coqui ve Tortoise gibi açık kaynaklı alternatifler var).

Podcast’in metin içeriğini almak için başlığı NLPCloud’un Blog Post Generator API‘siyle destekledim. AI podcast içeriği için özel olarak herhangi bir program veya API bulamadım; bu yüzden şimdilik blog yazısı olması gereken şeyi kullanıyorum. Programlamam, ortaya çıkan metni otomatik olarak SSML ile çoğaltıyor; belirli kısımlarını daha yüksek sesle (başlık ve her bölümün adı gibi) yapıyor ve ana sunucunun sesini daha insancıl hale getirmek için her paragrafın arasına duraklamalar ekliyor. Resemble.ai API‘sinden Text-To-Speech daha sonra bu metni bir sese dönüştürüyor.

Resmi bir podcast gibi görünmesi için her bölüme Storyblocks.com‘dan indirdiğim kısa MP3 dosyaları kitaplığından rastgele seçilmiş giriş ve çıkış müziği verdim. Her ikisi de açık kaynak olan FFmpeg ve MoviePy, her ikisi de açık kaynak, daha sonra sesi otomatik olarak karıştırmak için kullanıldı.

Bölümler için kapak resmi, ona bir cümle (“istem”) verdiğiniz ve konseptinizi makine öğrenimini kullanarak bir görüntüye dönüştürdüğünüz yeni bir metinden görüntüye program olan Stable Difusion (açık kaynak) kullanılarak oluşturuldu. Her podcast bölümü için başlık bilgi istemiydi.

Podcast’i sunucumda barındırabilirdim, ancak bunun yerine ücretsiz hesap seviyelerini kullanarak BuzzSprout’a yükledim ve podcast oynatıcılarını BoredHumans.com AI Podcast sayfama yerleştirdim. Bunu kısmen daha resmi görünmesi için yaptım, ama aynı zamanda podcast’i Apple, Spotify, Amazon ve podcast’lerin duyulduğu diğer yerlere gönderebilmem için yaptım.

Şu anda yalnızca 1 bölümüm tamamlandı, ancak planım 100 bölüm daha oluşturmak ve haftada 1 bölümü otomatik olarak yüklemek için BuzzSprout API’sini kullanmak için kod yazmak. Podcast’ler RSS beslemeleri kullanılarak dağıtılır, yani yeni bir bölüm yüklediğimde tüm büyük podcast uygulamalarında otomatik olarak görünecek.

Ayrıca sesli podcast’imi Synthesia kullanarak bir video podcast’e dönüştürmeyi düşünüyorum, aşağıya bakın:

AI Video Barındırıcıları

Ancak bununla ilgili potansiyel bir sorun var. Şartlar ve koşullar sayfasında, yapmak istediklerimi yasaklayan iki kısıtlama var:

Kısıtlama 1: Stok Avatar’ın her türlü görüş beyanında bulunduğu “Kullanıcı Tarafından Oluşturulan İçerikte”, herhangi bir kişisel tercih veya deneyimin Stok Avatar’ın tercihleri ​​veya deneyimleriymiş gibi ifade edilmesi de buna dahil.

Kısıtlama #2: Stok Avatar’ın din, siyaset, ırk, cinsiyet, cinsellik veya belirli demografik özelliklere duyarlı olduğu bilinen diğer benzer konularla ilgili herhangi bir gerçek beyanında bulunduğu “Kullanıcı Tarafından Oluşturulan İçeriklerde.”

Çözüm benim için başka bir benzer hizmeti kullanmak veya kendi metinden videoya yazılımımı oluşturmak olurdu; bu yüzden üzerinde çalışacağım bir sonraki şey bu.

Kaynak: Eric Borgos / Medium

Okumaya devam et
Yorum yapmak için tıklayın

Yanıt Ver

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Araştırma

Yeni podcast araştırmasında video kazanıyor

Sounds Profitable’ın yeni yayınlanan çalışması The Advertising Landscape’de Signal Hill Insights tarafından yürütülen bir anket podcast tüketiminde videonun yükselişini gösteren son araştırma oldu.

Yayınlanma tarihi

=>

Sounds Profitable’ın yeni yayınlanan çalışması The Advertising Landscape’de Signal Hill Insights tarafından yürütülen bir anketi temsil eden 34 bilgi dolu slayt buluyoruz. Beş binden fazla 18 yaş üstü Amerikalının katıldığı online araştırma, Amerika’da podcasting ve reklamcılık üzerine yapılan en büyük kamu çalışması olma iddiasını taşıyor. (Buradan indirebilirsiniz.)

Anket katılımcılarının tamamı en az bir tür reklam destekli medya tüketicisi.

Video Kazanıyor

Bugünlerde video aracılığıyla önemli ölçüde dinleme yapılmadığını ortaya koymayan bir ses/podcast anketi yayınlanmıyor. Aşağıdaki grafikte, ankete katılanların %12’si için videonun özel tüketim kanalı olduğunu görüyoruz. (NOT: bu veriler adı geçen tek bir podcast ile ilgili).

Videonun eşit, çoğunlukla ve münhasıran kullanıldığını gösteren pasta dilimlerini birleştirdiğimizde, katılımcıların üçte ikisinin (%67) podcast’lerini bir dereceye kadar video ile aldığını görüyoruz:

Beş özet nokta buradaki öğrenmelerin belkemiğini oluşturuyor ve ilginç bir şekilde detaylandırılmışlar:

  • 18 yaş üstü her on Amerikalıdan üçünden fazlası aylık reklam destekli podcast tüketicisi. Podcast dinleyicilerinin önemli bir yüzdesi reklamlarla karşılaşmadıklarını düşünüyorlar; podcast deneyimi Premium ve Reklam Destekli’nin bilinçli bir seçim olmaması açısından sıra dışı.
  • Aylık tüketicilerin günlüğe yakın ve “PRIME” tüketicilere dönüşümü ortalamanın altında. Podcast’ler önemli bir tercih olmaya devam etse de, bunun günlük bir tempoya dönüşmesi gerekmiyor.
  • Podcasting, 18-34 yaş grubu için sözlü sese açılan bir kapı olabilir. Müzik akışının öne çıkması ve ticari AM/FM radyonun 18-34’ler arasında düşüşünün devam etmesiyle podcasting, sözlü sesin geleceği için önemli bir meşale taşıyor.
  • Podcasting çok yönlü bir mecra. Giderek daha fazla insanın podcast’e geri döndüğünü öğreniyoruz. En sevdikleri programların sesli ve görüntülü versiyonları arasında gidip gelebiliyorlar; bu çok yönlülüğü ön plana çıkarmamız gerekiyor.
  • Podcast tüketicileri dikkatlerini veriyor. Bir sonraki raporumuz medya kanallarındaki dikkat ölçümlerini daha derinlemesine inceleyecek olsa da, reklam destekli podcast kitlesinin markalardan gelen mesajlara dikkat ettiği açık.

Kaynak: RainNews

Okumaya devam et

Araştırma

Kadın podcast dinleyici sayısı 10 yılda üç katına çıktı

Edison Research ve SiriusXM Media tarafından yayınlanan Women & Podcasts raporuna göre, kadınların podcast dinleyiciliği on yılda üç kat arttı. ABD’deki tüm kadınların %45’i (60 milyon) aylık podcast dinleyicisi ve %52’si bir şekilde podcast tüketiyor (ister dinliyor ister izliyor olsun).

Yayınlanma tarihi

=>

Edison Research ve SiriusXM Media tarafından yayınlanan Women & Podcasts raporuna göre, kadınların aylık podcast dinleyiciliği son on yılda üç kat artarak 2015’te %15’ten 2025’te %45’e yükseldi. Bu rapor, kadınlar ve ses tüketimi arasındaki ilişkiyi inceleyen iki bölümlük bir web semineri serisinin ilk bölümüdür. Video podcast izleyiciliği de hesaba katıldığında tahminler daha da yükseliyor. 18 yaş üstü kadınların %52’si artık bir şekilde podcast tüketiyor.

Edison Research Başkan Yardımcısı Megan Lazovick ve SiriusXM Media Satış Araştırmaları Başkan Yardımcısı Melissa Paris tarafından sunulan araştırma, podcast yayıncılığında kadınların dikkat çekici büyüme hikayesini vurguluyor ve kadınların podcast içerikleriyle nasıl etkileşim kurduğuna dair içgörüler sunuyor.

Kadınların Sesi Raporundan Önemli Bulgular:

  • Kadınlar Arasında Podcast Tüketimi Patlayıcı Bir Büyüme Gösteriyor
  • Kadınların aylık podcast dinleme oranı 2015’te %15 iken 2025’te üç katına çıkarak %45’e ulaşmıştır ve bu da tahminen 60 milyon ABD’li kadın anlamına gelmektedir.
  • Hem sesli hem de görüntülü podcast tüketimi birleştirildiğinde, 18 yaş üstü kadınların %52’si aylık olarak bir şekilde podcast tüketmektedir.
  • Kadın podcast tüketicileri daha genç (%39’u 18-34 yaş arasında), daha yüksek gelirli (%29’unun hane geliri 100 bin doların üzerinde) ve daha yüksek eğitim seviyesine sahip (%51’i üniversite mezunu).

Kadınlar Podcast İçerikleriyle Anlamlı Bir Şekilde Etkileşim Kuruyor

  • Aylık podcast tüketicisi kadınların başlıca motivasyonları arasında konuları derinlemesine keşfetmek (%53), öğrenmek (%46) ve eğlence (%44) yer alıyor.
  • 79’u hoşlandıkları bir sunucuya sahip olmanın önemli olduğunu düşünürken, %72’si ilişkilendirilebilir podcast’lere değer veriyor.
  • ABD’li aylık podcast tüketicisi kadınlar günde ortalama 1 saat 40 dakikadan fazla podcast içeriği dinliyor.

Kadın Podcast Dinleyicileri Yüksek Ticari Bağlılık Gösteriyor ve Otantik Temsil Arıyor

  • Aylık kadın podcast tüketicilerinin %64’ü yaşam zorluklarının üstesinden gelmek için podcast’lere başvururken, %44’ü ruh sağlığı desteği için podcast’leri kullanıyor.
  • Bir podcast’te reklam duyan aylık kadın tüketicilerin %75’i reklamı duyduktan sonra harekete geçmiştir.
  • Aylık kadın tüketicilerin %45’inin, kadınların ev sahipliği yaptığı veya ürettiği podcast’leri destekleyen markaları dikkate alma olasılığı daha yüksektir.
  • Haftalık kadın dinleyiciler arasında ilk 25 programın neredeyse yarısı (%48) kadın sunucu veya yardımcı sunuculara sahiptir – bu oran tüm haftalık dinleyiciler arasında sadece %40’tır.

SiriusXM Media Satış Araştırmalarından Sorumlu Başkan Yardımcısı Melissa Paris, “Kadınların aylık podcast dinleme oranı on yılda üç katına çıktı; bu tekrar etmeye değer. Ama aynı zamanda önemli olan, podcast tüketiminde videonun artan rolü; kadınların %33’ü artık podcast izliyor. Ses ve video formatlarında toplam aylık podcast tüketimine baktığımızda, tüm kadınların %52’sine ulaşıyoruz” dedi.

Kadınların Sesi Raporu, son bir ay içinde ses dinlemiş 18 yaş üstü kadınlarla yapılan 2.520 görüşmeye dayanmaktadır. Veriler ABD kadın nüfusunun yaş, etnik köken ve nüfus sayımı bölgelerine göre ağırlıklandırıldı. Çalışmada ayrıca Edison Research’ün Infinite Dial serisi, Share of Ear günlük dinleme çalışması ve Edison Podcast Metrics’in istatistikleri de kullanıldı.

Kaynak: PodNews

Okumaya devam et

Araştırma

Podcast’ler: Biri ya da diğeri değil

Amplifi Media ve Coleman Insights’ın “The State of Video Podcasting 2025” adlı yeni bir araştırmasına göre, podcast tüketicilerinin %85’i podcast’in sesli veya görüntülü olabileceğini söylüyor. Araştırma, duruma bağlı olarak podcast dinleyicilerinin %77’sinin video ve ses arasında geçiş yaptığını ortaya koydu. Tüketiciler, ne yaptıklarına ve nerede olduklarına bağlı olarak, örneğin ekranda izlemek veya arabalarında dinlemek gibi, akıcı bir şekilde geçiş yapıyorlar.

Yayınlanma tarihi

=>

Sektör podcast’i nasıl tanımlamalı? Tüketiciler bunu açıkça görüyor.

Geçen hafta Podcast Movement Evolutions’da Coleman Insights’tan Jay Nachlis ve ben, Amplifi Media ve Coleman Insights‘ın podcasting endüstrisi için önemli bir dönüm noktasına işaret eden “The State of Video Podcasting 2025” adlı yeni bir araştırmasını sunduk.

Şişenin içinden net bir şekilde görmek zor olabilir. Sektör bir podcast’in nasıl tanımlanacağı ile boğuşmaya devam ederken, olaylara tüketicinin gözünden bakmak daha önemli ve daha açıklayıcıdır. İşte bu noktada verilerimiz özellikle değerli hale geliyor. Rapordan çıkarılacak önemli bir sonuç: Tüketicilerin podcast’in ne olduğu konusunda kafası karışık değil.

Ulusal araştırmamıza göre, podcast tüketicilerinin %85’i podcast’in sesli veya görüntülü olabileceğini söylüyor. Bu bir belirsizlik değil; netlik. Halk konuştu ve formatlar arasında geçiş yapmakta tamamen rahatlar. Bunu biraz daha açalım.

Hibrit Alışkanlığı

Araştırmamız, duruma bağlı olarak podcast dinleyicilerinin %77’sinin video ve ses arasında geçiş yaptığını ortaya koydu. Ne yaptıklarına ve nerede olduklarına bağlı olarak, örneğin ekranda izlemek veya arabalarında dinlemek gibi, akıcı bir şekilde geçiş yapıyorlar.

Günümüzde podcast yayıncılığı ikili değil. Bu bir süreklilik.

Neredeyse yarısı sese yöneliyor

Videoya gösterilen ilgiye rağmen, ses podcast deneyiminin temel taşı olmaya devam ediyor. “Yalnızca ses” tüketicileri ile ‘çoğunlukla ses’ tüketicilerini topladığımızda, tüm katılımcıların %47’sinin sese yöneldiğini görüyoruz.

Bu veriler, sesin hiçbir yere gitmediğini güçlü bir şekilde hatırlatıyor. Hala birçok kişi için giriş noktası ve çoklu görev ve mobilite için tercih edilen mod. Jay blog yazısında daha derinlere iniyor: “Video Podcasting’in Yükselişi Neden Sesi Öldürmüyor?”

Video Birçokları (Ama Hepsi Değil) İçin Vazgeçilmezdir

Aynı zamanda video, özellikle genç kitleler için önemli ve büyüyen bir güçtür. Z kuşağı podcast tüketicilerinin %37’si çoğunlukla veya tamamen video tabanlı olduklarını söylüyor. Daha da önemlisi, YouTube, özellikle sıradan dinleyiciler ve ilk kez dinleyenler için keşfetmeyi domine ediyor.

Video, podcast ortamının önemli bir parçası haline geldi. Ancak bu herkese uyan bir durum değil. Bazıları için doğru uyum değil. Pek çok “sohbet programı” için video etkili bir temel oluşturabilir ve bazıları için tek gerekli olan da bu olabilir. iHeart Başkanı Will Pearson’ın View From The Top panelimizde söylediği gibi, “en başarılı programlarımızdan bazıları sadece iyi aydınlatılmış sohbetlerdir.” Bunu sevdim. Diğerleri, özellikle de daha dinamik veya eğlence ağırlıklı alanlarda rekabet eden podcast’ler için bu sadece bir başlangıç noktası. Seste olduğu gibi, her video stratejisinin de içeriğin ve kitlenin ihtiyaçlarına hizmet edecek şekilde ısmarlama olması gerekir.

Kafa Koparan Cihaz Hikayesi

Podcast tüketim davranışının tanımı hızla değişiyor.

Aralık ayında YouTube dudak uçuklatan bir istatistik açıkladı: akıllı TV’lerde sadece bir ayda 400 milyon saat podcast tüketildi. NYU’daki öğrencilerim de bunu doğruluyor; televizyonları genellikle açık ve YouTube’a ayarlı.

Daha derine inmeyi merak eden araştırmamız, podcast tüketicilerinin %46’sının akıllı TV’lerde podcast dinlediğini veya izlediğini söylediğini ortaya çıkardı.

Podcast’ler oturma odaları, yatak odaları ve hatta mutfaklardaki 55 inçlik ekranlarda görünerek resmen evde izleme deneyiminin bir parçası haline geldi. Üstelik sadece video değil, sesli podcast’ler de TV’de arkaya yaslanmış bir şekilde izleniyor.

İçeriğiniz artık kulaklıklarla veya araba gösterge panelleriyle sınırlı değil. Artık büyük ekran manzarasının bir parçası.

Karmaşık Bir Platform Dünyasında Yaşıyoruz.

Yıllar önce Bristol, Connecticut’taki ESPN genel merkezindeydim. Ana binalardan birine kazınmış misyon ifadeleri vardı:
“Sporseverlere hizmet etmek. Her zaman. Her yerde.”

Bu hedef her podcaster için doğru olmayabilir. Tüm içerikler her biçimde ya da her platformda aynı derecede iyi çalışmayabilir.

Ancak düşünce doğru.

Çok platformlu bir dünyada yaşıyoruz ve podcast yayıncıları, diğer tüm medya markaları gibi, stratejilerini kitlelerinin içeriği nasıl ve nerede tükettiğiyle uyumlu hale getirmelidir.

Strateji Sıfırlama Zamanı.

İçinde bulunduğumuz an, teşhis ve yeniden düzenleme gerektiren bir zihniyet değişimini gerektiriyor. Her podcaster bu soruları sormalı:

  • Format stratejimiz nedir? Ses mi, video mu, yoksa ikisi birden mi?
  • Dinleyicilerimizin tercih ettiği platformlar için optimize edilmiş miyiz?
  • Sadece içerik oluşturmayı değil, aynı zamanda akıllı TV’ler gibi cihazlar da dahil olmak üzere içeriğin nasıl tüketileceği bağlamını da düşünüyor muyuz?
  • Podcast endüstrisi podcast’in tanımıyla boğuşuyor ve ekonomi geliştiği için bu uygun ve anlaşılabilir bir durum. Ancak 10.000 feet yukarı çıkın ve şunu düşünün ….. diğer sektörler zaten evrim geçirdi.
  • Televizyon ve filmler yayınlanabilir, talep üzerine izlenebilir ve sosyalleşebilir hale geldi.
  • Gazeteler mobil öncelikli ve haber bülteni odaklı hale geldi.
  • Müzik satın alımdan akışa adapte oldu.

Podcasting şu anda benzer bir yol ayrımında olsa da, tüketici podcast tanımına takılıp kalmıyor. Onlar zaten format akışkan, cihaz çeşitliliğine sahip, çok platformlu bir gerçeklik içinde yaşıyorlar.

Çalışmamız, içeriğin nasıl sunulacağı ve insanların bunu nasıl tüketmek istedikleri konusunda netlik sunuyor.

Sektörü sarsan ilk anketi yapmamızdan bu yana geçen 18 ay içinde çok şey değişti.

Açık olan şu ki, artık bir şey (ses) diğerine (video) karşı değil.

Kaynak: Steve Goldstein / Amplifi Media

Okumaya devam et

En son