Co się teraz dzieje w podcaście

wiecejnizslowa.pl 1 rok temu

Dzieje się przede wszystkim to, iż „Opowiem Ci coś” cały czas nadaje, choć oczywiście zaszło w nim kilka istotnych zmian. I o tym właśnie chciałbym poinformować w tym wpisie. A tych, którzy nie wiedzą lub trafili na WNS po raz pierwszy, informuję, iż w „Opowiem Ci coś” publikuję moją twórczość, a główne miejsca, gdzie można jej posłuchać, to Spotify oraz mój kanał na YuoTube. Zachęcam do zasubskrybowania i pomocy w rozpropagowywaniu kolejnych odcinków. A teraz do rzeczy.

Kilka tygodni temu skończyłem emisję „Nieuniknionego”. Dla niezorientowanych: „Nieuniknione” to moja najnowsza powieść, która pierwotnie ukazała się jako płatny e-book, cały czas zresztą dostępny zarówno u mnie, jak i w czołowych księgarniach zewnętrznych. Można go kupić, jeżeli ktoś woli czytać, lub jako cegiełkę wspierającą moją pracę. Darmowa wersja audio zawiera pełny tekst i jej wypuszczenie poza tym, iż bardziej niż na pieniądzach mimo wszystko zależy mi na dotarciu z przekazem do odbiorców, miało być swego rodzaju eksperymentem, w ramach którego chciałem się przekonać, czy uda mi się kogoś być może pragnącego poznać całą historię szybciej nakłonić do zakupu e-booka. Od razu ujawniam: niestety się nie udało.

Potem planowałem w ten sam sposób opublikować poprzednią powieść „Drugie przykazanie”. Ale na razie się z tego wycofałem. Stwierdziłem, iż dobrze będzie jednak odpocząć od dłuższych form i w ramach przerywnika i nabrania oddechu przed kolejną serią wrócić do opowiadań.

Stali słuchacze zauważyli, iż są to, jak dotąd, re-publikacje tekstów, które już kiedyś pojawiły się na łamach „Opowiem Ci coś”, a do tego, w przeciwieństwie do pierwotnych wersji, nie czytam ich ja, ale głosy syntetyczne. O przejściu na sztucznych lektorów szerzej za chwilę, natomiast teraz tylko małe wyjaśnienie w kwestii samych opowiadań: głównym powodem ich powtórzenia nie jest przejście na syntezatory, bo gdyby chodziło jedynie o to, zostawiłbym stare wersje; po prostu dokonałem ich reedycji. Owszem, robię takie rzeczy. Podobnie zresztą jak wielu pisarzy, którzy cały czas udoskonalają już opublikowane utwory. Np. Różewicz potrafił wypuścić kilkadziesiąt aktualizacji tego samego wiersza w kilku kolejnych tomikach.

Dla mnie jako nieodrodnego intelektualnego dziecka postmodernizmu zmaganie się z materią tekstu jest fascynujące samo w sobie i stanowi integralny element obcowania z nim. Powiedzmy, iż chciałem się tą przygodą trochę podzielić z czytelnikami / słuchaczami. Nawiasem mówiąc, obecne w podcaście opowiadanie „Ballada o wannie” wcześniej dwukrotnie ukazało się w druku w dwóch różnych wersjach. Wraz z trafieniem do podcastu raczej osiągnęło już swój optymalny kształt, ale… kto wie.

A teraz o głosach.

Decydując się na tę zmianę w trakcie „Nieuniknionego” być może popełniłem taktyczny błąd. Jak to mówią mądrzy ludzie: nie zmienia się konia w trakcie bitwy. Chciałem jednak zrobić to jak najszybciej, gdy tylko pozyskałem odpowiednie know-how. Chciałem tego, bo nigdy nie uważałem swojego głosu za odpowiedni do roli lektora. Wiem, iż nikt nie lubi brzmienia własnego głosu, ale mój… cóż, mój po prostu obiektywnie jest kiepski. I mówi to gość z ponadrocznym stażem w radiu. Ech. Na profesjonalnych lektorów nie miałem funduszy, a na to, iż mógłbym wykorzystywać syntezatory mowy, najzwyczajniej nie wpadłem.

Albo inaczej: wpaść jak najbardziej wpadłem, tyle iż jakość syntezy pozostawiała wiele do życzenia. Temat zacząłem tak naprawdę nieco poważniej zgłębiać dopiero wówczas, gdy zainteresowałem się możliwościami sztucznej inteligencji, o czym zresztą już pisałem tutaj.

No właśnie, w kwestii owej jakości pojawiły się ostatnio pewne kontrowersje. Po zakończeniu „Nieuniknionego”, które nagrywałem dzięki ogólnodostępnego, na przykład w Edge, głosu Marek, przesiadłem się na generyczne głosy SAPI 5. Wiedziałem, iż będzie to skutkować obniżką jakości, ale, przyznając szczerze, miałem trochę dość walczenia z Markiem, który, jak to AI, zbyt często próbował być za bardzo smart, co skutkowało błędnym odczytywaniem niektórych słów i koniecznością kombinowania, jak zredagować tekst w taki sposób, by czytał je poprawnie. Jednym z bardziej kuriozalnych przykładów – którego niestety wtedy nie udało mi się obejść – było słowo „smuga” uporczywie czytane przez Mareczka jako „smiuga”.

Ślęcząc nad tym, opracowałem cały system life hacków pozwalający wiele z tych baboli obejść. Tyle że, jak już wspomniałem, zmęczyło mnie to. Syntezatory SAPI 5, choć robotyczne, były mi zdecydowanie bardziej posłuszne i sądziłem, iż uda mi się do nich przekonać słuchaczy. Niestety po fali – no dobrze, falce, faluni, ale przy moich mikroskopijnych zasięgach cztery opinie to też dużo – krytyki postanowiłem jednak wrócić do Marka. I na razie będę na nim bazował, cały czas udoskonalając moje triki.

O głosach, i ogólnie TTS, mógłbym zresztą w ogóle tu gadać i gadać, bo w ostatnich tygodniach zyskałem w tej materii spore doświadczenie. Rozwiązań na rynku jest tak naprawdę mnóstwo, choć w przypadku języka polskiego ta paleta dość drastycznie się zawęża – przynajmniej jeżeli nie chcesz wydrenować sobie portfela. Jest całkiem sporo całkiem ładnie brzmiących głosów multilingual, czyli najczęściej domyślnie angielskich, ale potrafiących czytać również inne języki, tyle iż na polskim się wykrzaczają. Potrafią np. bardzo płynnie lecieć przez polski tekst i nagle zacząć czytać polskie słowa z angielską wymową, po czym równie nagle wrócić do polskiej. Póki co nie umiem tego obejść.

A wracając do podcastu: na razie jeszcze przez jakiś czas będą chodziły opowiadania – reedycje, o których pisałem, ale też teksty premierowe. Będę je ze sobą mieszał. Pozostaną też syntetyczni lektorzy. No dobrze, na razie jeden, ale z pewnością będę coraz bardziej szedł w tym kierunku. Jest technologia, więc nie widzę powodu, by z niej nie korzystać.

Idź do oryginalnego materiału