Zamiana mowy w tekst. Automatyczna transkrypcja i triki w edytorach tekstu

sektor3-0.pl 10 miesięcy temu

Każdy kto wykonuje żmudne lub powtarzalne czynności z otwartymi ramionami wita nowe rozwiązania technologiczne. Zwłaszcza takie, które mogą pomóc w przyspieszeniu pracy lub wykonać ja za nas. Zamiana mowy w tekst brzmi jak zaklęcie, ale do tej pory była po prostu orką na klawiaturze. Każdy kto miał “okazję” do takiej pracy wie, iż transkrypcja jednej minuty trwa o wiele więcej niż 60 sekund. Mamy dobrą informację: era manualnego spisywania już się skończyła!

Najpierw nagranie, potem zamiana mowy w tekst

Rozwiązania, które zaprezentujemy będą opieraly na się na zarejestrowanej ścieżce audio. Nagranie możemy wykonać choćby dyktafonem w telefonie, możemy pobrać dźwięk z filmu – musi być czytelny i zrozumiały. Dwie możliwości będa opierały się na dyktowaniu, ale ich zastosowanie będzie też zależało od naszej kreatywności. Co więcej pokażemy, iż transkrypcja online za darmo jest na wyciągnięcie ręki. Dzięki niej łatwiej przygotujemy notatki, wywiady czy artykuły.

Good Tape – narzędzie do transkrypcji

To idealny przykład narzędzia, które wkroczyło do Internetu we adekwatnym momencie. Korzysta z AI żeby tłumaczyć nasze nagrania, robi to dobrze i zostało przez nas sprawdzone w bojach. W wersji bezpłatnej (po założeniu konta) możemy wykorzystać je do spisania 3 nagrań miesięcznie. Nie mogą jednak one przekraczać 90 minut. Czas oczekiwania różni się w zależności od długości przesłanej ścieżki. Aby uzyskać więcej transkrypcji i pamięci masowej oraz zminimalizować czas oczekiwania można oczywiście płacić, ale wersja bezpłatna może nam wystarczyć w zupełności.


Duńskie narzędzie po prostu robi swoją robotę. Zamiana mowy w tekst, automatycznie i do tego pliki wyjściowe. Przeciągamy plik dźwiękowy, wybieramy język (lub może zidentyfikować go za nas) i czekamy. Po czasie oczekiwania możemy pobrać tekst w trzech wersjach w plikach txt. Z kodami czasowymi, bez (ściana tekstu) lub jako napisy (srt). Nasze teksty po automatycznej transkrypcji trafiają do archiwum, które znajduje się w menu po lewej stronie. To tyle!

Riverside.fm – zamień dźwięk i film w tekst

Kolejne narzędzie to część składowa Riverside.fm, która jest dostępna bez logowania. Również nie jest to rozwiązanie nie jest bardzo skomplikowane. Przeciągamy, upuszczamy i już. Czas oczekiwania może być dłuższy niż w przypadku Good Tape, w praktyce może sprawdzać się lepiej w krótszych fragmentach. To funkcja, którą wykorzystuje także sam Riverside, o którym więcej możecie przeczytać i usłyszeć tutaj.

Transkrypcja automatyczna w Riverside działa także na telefonie. Możemy wybrać z biblioteki naszego telefona nagranie lub nagrać je z marszu. Możemy także załadować wideo, z którego zostanie pobrany i spisany dźwięk – to może być istotna przewaga nad przykładem powyższym.

Word i Google Docs – zamień mowę w tekst dzięki funkcji dyktowania tekstu

Ten akapit został podyktowany w całości głosem. Używam do tego funkcji dyktafon w Wordzie online. Musimy pamiętać o tym, aby dać dostęp do naszego mikrofonu i w ustawieniach ustawić język Polski. Po podyktowaniu tekstu trzeba go jeszcze oczywiście uważnie sprawdzić i poprawić. Czy jest to narzędzie w 100 procentach niezawodne? Nie. Ale może znacząco przyspieszyć naszą pracę. Dyktafon znajdziemy w zakładce “narzędzia główne” po prawej stronie. Word zapewnia także obszerną zakładkę z odpowiedziami na pytania.

Pisanie głosowe jest także dostępne w Google Docs, znajdziemy je w zakładce “Narzędzia”. Ta wersja wydaje się być nieco bardziej precyzyjna niż Word, ale przez cały czas zdarzają mu się potknięcia. Google Docs może łatwo zamienić się w Google Dogs. Tych narzędzi i funkcji możemy używać, jeżeli sami chcemy coś przedyktować (zakładamy słuchawki i powtarzamy) lub zrobić szybkie notatki.

Sztuczka – zamiana mowy w tekst sprawniej

Jeśli zależy Wam na szybkim spisaniu bezpośrednio do Worda lub Google Doca możecie przeprowadzić eksperyment. Wystarczy włączyć funkcję zamiany mowy w tekst w wybranym rozwiązaniu i na komputerze uruchomić plik z nagraniem. Wówczas funkcja spisywania potraktuje to jako mowę i przepisze do dokumentu całą zawartość. Zawsze jednak pozostaje nasza korekta stylistyczna i merytoryczna.

Przeczytaj także

(Podcast) Bo treść jest najważniejsza. Jak tworzyć angażujące wideo?
(Wideo) Nigdy więcej błędów w tekście dzięki LanguageTool
(Artykuł) Uwolnij supermoce swojej przeglądarki. 22 wtyczki do Google Chrome

Idź do oryginalnego materiału