Stlačte "Enter" na preskočenie k obsahu

Prepisujeme nahrávky do textu 1. časť

Za posledných niekoľko rokov opakovane dostávam otázku, ako automaticky prepísať audio súbor do textu. V sérii článkov sa pozriem na aktuálne dostupné nástroje. V súčasnosti je riešení viacero, preto som si na začiatok stanovil kritériá: Nástroj by mal byť prístupný s čítačmi obrazovky, môže byť online alebo čiastočne offline, a ideálne zdarma, prípadne súčasťou niečoho, čo už používame.

Prepisujeme nahrávky offline a pomôžeme si editorom titulkov

V tomto článku si ukážeme, ako prepisovať nahrávky s pomocou aplikácie Subtitle Edit. Program slúži hlavne na vytváranie a tvorbu titulkov k filmom. Má však veľmi dobre integrovanú podporu pre Whisper. Whisper je umelá inteligencia, ktorú rovnako ako Chat GPT, vytvorila spoločnosť Open AI. Ak by sme chceli Whisper používať bez Subtitle Edit, nezaobišlo by sa to bez príkazového riadka. Možno by pre vás potom bolo jednoduchšie nahrávku prepisovať ručne, ako v príkazovom riadku inštalovať všetky závislosti a cez príkazový riadok inštruovať Whisper, aký súbor má prepísať, v akom jazyku a kam ho uložiť. Subtitle Edit použijeme aj preto, že dokáže používať Whisper lokálne. Takže naše nahrávky nemusíme posielať na cloud a môžeme prepisovať aj bez pripojenia na internet. Presnejšie, pripojiť sa musíme na začiatku, aby sme si stiahli aplikáciu a model. Nevýhodou je, že prepis môže trvať dlhšie, ak máme menej výkonný počítač.

Inštalácia Subtitle Edit

Program Stiahneme zo Stránky vývojára. Prejdeme na nadpis 2. úrovne s označením „files“ (súbory). Ak chceme Subtitle Edit štandardne nainštalovať, stiahneme prvý súbor, označený ako setup.zip. Máme dostupnú aj prenosnú verziu, označenú ako SE_cislo_verzie.zip.

Ak ste sa rozhodli použiť prenosnú verziu, rozbaľte ju a prejdite v tomto článku k ďalšiemu bodu. Štandardná inštalácia vyzerá nasledovne:

  • rozbalíme súbor.
  • Spustíme Exe súbor, ktorý je vo vnútri archívu.
  • Potvrdíme spustenie inštalačného súboru.
  • Zvolíme si jazyk. Dostupná je aj Čeština. Jazyk inštalácie však neovplyvňuje jazyk samotného programu.
  • Odsúhlasíme licenčné podmienky.
  • Zvolíme umiestnenie aplikácie.
  • Zvolíme súčasti, ktoré sa majú inštalovať.
  • Povolíme alebo zamietneme inštaláciu odkazov do ponuky Štart.
  • V ďalšom kroku začiarkneme, či chceme odkaz na ploche, inštaláciu pre všetkých používateľov a asociovanie s príponami.
  • Po inštalácii sa zobrazí zoznam zmien.
  • Inštaláciu ukončíme aktivovaním tlačidla ďalej a dokončiť.

Jedna poznámka k prístupnosti

Pokiaľ ide o prepisovanie nahrávok, Subtitle Edit je pre nás takmer prístupný. Jediným problémom je, že NVDA v zoznamoch nedokáže automaticky získať fokus. Preto na zistenie aktuálnej položky v zozname postupujeme tak, že šípkou dole zmeníme položku a skratkou NVDA+TAB si zistíme, ktorá položka má fokus. Môžeme si to hneď otestovať pri výbere jazyka. Aplikácia má vstavanú lokalizáciu do Češtiny. Nastavíme ju nasledovne:

  • Klávesom alt otvoríme panel ponúk.
  • Šípkou doprava prejdeme na položku „Options“ (možnosti).
  • Rozbalíme šípkou dole a aktivujeme položku „Choose language“ (vybrať jazyk).
  • Šípkou hore prechádzame v zozname a NVDA+TAB si overíme vybratý jazyk. Odporúčam zvoliť Češtinu. Potvrdíme klávesom Enter.

Prvotné nastavenie

Ak potrebujete prepísať nahrávku v dĺžke jednej minúty, doterajší proces vám pravdepodobne zabral viac času. Prvotné nastavenie nám skutočne bude ešte chvíľku trvať:

  • Na panely ponúk prejdite na položku video a tam aktivujte položku audio na text (Whisper).
  • Pri prvom použití tejto funkcie sa program môže opýtať, či chceme stiahnuť FFMPEG. Ide o knižnicu, vďaka ktorej Subtitle Edit dokáže otvoriť mnohé audio a video súbory. Preto potvrdíme stiahnutie tlačidlom áno.
  • Subtitle Edit potvrdí stiahnutie FFMPEG a zároveň sa opýta, či chceme stiahnuť Model Purfwiev’s faster whisper – XXL. Ide o rozhranie pre model whisper, ktoré budeme používať na preklad, preto potvrdíme tlačidlom áno.
  • Sťahovanie bude chvíľku trvať.
  • Po dokončení sa ocitneme v okne s nastaveniami. Tabulátorom prejdeme na položku Jazyky a modely. V zozname zvolíme jazyk, v ktorom je naša nahrávka.
  • Tabulátorom prejdeme na položku vybrať model a následne opäť tabulátorom na nepopísané tlačidlo.
  • Po jeho aktivovaní si zvolíme, ktorý model budeme používať. Na výber máme viacero modelov. Platí, že modely Small vyžadujú menší výkon, zároveň ale nie sú presné. Modely large prepisujú nahrávku dlhšie, vyžadujú väčší výkon, aj viac miesta na disku, ale výsledok je presnejší. Ja v tomto kroku volím Large-V3.
  • Opäť počkáme, kým dôjde k stiahnutiu modelu.

Prepisujeme prvú nahrávku

Konečne sme prešli stiahnutím všetkého potrebného. Vyššie spomenuté kroky stačí urobiť len raz. Ostávame v dialógu Prevodu audia na text.

  • Prejdeme na tlačidlo Pridať a aktivujeme ho medzerou.
  • Otvorí sa štandardný dialóg na výber súboru. Typ súboru zmeníme na Súbory audia. Následne na disku vyhľadáme náš súbor a potvrdíme.
  • Aktivujeme tlačidlo vygenerovať.
  • A teraz nám ostáva už len čakať. Okno Subtitle Edit nie je veľmi výrečné, avšak to, že sa niečo deje spoznáme na pomalšom výkone nášho počítača a majitelia notebookov aj na zvýšených otáčkach chladenia.
  • Ukončenie prepisu oznámi Subtitle Edit novým oknom s tlačidlom OK.

Získali sme titulky, takže potrebujeme ešte jeden krok

V priečinku s pôvodným súborom sa teraz nachádza nový súbor s príponou .srt. Ide o titulky, teda okrem textu sú v súbore uvedené aj časové údaje. Tie zvyčajne pri prepise nepotrebujeme. Zbavíme sa ich opäť pomocou Subtitle Edit nasledovne:

  • skratkou Ctrl+o (alebo menu súbor, otvoriť) vyvoláme štandardné okno na otvorenie súboru. Tu zvolíme srt súbor, ktorý sme dostali.
  • Na panely ponúk opäť otvoríme menu súbor. Následne aktivujeme položku Export a potom Prostý text.
  • Zvolíme zlúčiť všetky riadky. Necháme odčiarknuté možnosti zobraziť čísla riadkov a zobraziť časový kód.
  • Aktivujeme tlačidlo Uložiť ako a súbor štandardne uložíme.

Ak prepisujeme viacero nahrávok, je vhodné zatvoriť aktuálne otvorené titulky otvorením nového projektu, skratkou ctrl+n, resp. v menu Súbor aktivovaním položky Nový.

Stálo to za to?

Pre účely tohto článku ponúkam na vypočutie nahrávky a prepisy. Chyby v prepisoch som zámerne ponechal, aby ste mali predstavu, koľko práce môže byť s úpravou takto prepísaného textu.

Prvá nahrávka je nahratá v teréne, prejav je rušený vetrom:

"Únia nevidiacich a slabozrakých Slovenska kedysi organizovala hudobné prehliadky pre svojich členov, no žiaľ ich organizovanie skončilo niekedy v roku 2015 a chýbalo nám to viacerým hudobníkom a práve počas tej korony bolo také obdobie, že sme všetci sedeli doma a nemali sme, tak povediac, do čoho pichnúť a tým pádom sme ešte s jednou kamarátkou rozmýšľali nad tým, že napíšeme si projekt na taký pekný koncert a keď sa bude dať hrať, tak zorganizujeme takýto koncert, no a našťastie v tom lete 2021 sa trošku tie podmienky zmiernili, dali sa organizovať aj kultúrne podujatia, aj keď si pamätám, že boli tam veľké peripétie s tým vtedy, museli sme počítať návštevníkov a podobne, sledovali sme farbu okresu a no, zkrátka a dobre, našťastie sa to podarilo a ten prvý ročník sa zrodil a dopadol myslím, že nad očakávania."

Druhá nahrávka je nahratá cez telefón.

"V Jurinovej jeseni sa na prvom mieste v kategórii proza umiestnil Jozef Páleník. Tá vaša proza je veľmi zaujímavá, pretože vy popisujete život a dielo Jana Harantu. Vy ste mali aj možnosť prísť do kontaktu s Janom Harantom, alebo teda vychádzate aj z nejakých vlastných skúseností? Áno, mal som s ním osobnú skúsenosť. Keď prišiel do našej farnosti vo Svinnej, mal som 8 rokov a keď zomrel, mal som 28 rokov. To znamená, že celé detstvo a mladosť som prežil s ním. Zaskúsenosť bola naozaj dlhodobá. Tie dve ukážky, ktoré som ja čítal v zborníku, vyzerajú byť súčasťou nejakého väčšieho diela? Čiže je to nejaká možno kniha, na ktorej pracujete? Je to niečo, k čomu sa budeme môcť časom dostať a prečítať si to celé? Zatiaľ ani nie. To sú len také utryškové spomienky. Výšli som situáciu alebo skutočnosť, že tohto roku pýdnulo 40 rokov od smrti dekána Harantu. Tak som si spomenul na nejaké dve udalosti a literárne som ich stvárnil. Samozrejme, že tá hlavná myšlienka vychádza z reality, z skutočnosti, ale ten zvyšok je už literárne zatvorený."

Záver

V tomto článku sme si ukázali, ako prepisovať nahrávky s použitím modelov od Open AI lokálne na našom počítači. Ak sa vám postup zdá byť zložitý a neprekáža vám nahrávky nahrať na cloud, prečítajte si druhú časť článku. Zameriame sa na prepis pomocou Office 365 a Google Notebook LLM.

Jeden komentár

  1. Roman
    Roman 14. októbra 2025

    Dobrý den, děkuji za dobrý tip a zároveň za podrobný návod pro instalaci a použití . Taktéž i za ukázku funkčnosti.
    Už se skoro dá říct, a přepisovatelé audia do textu nebudou mít co žrát 🤣.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Táto stránka používa Akismet na obmedzenie spamu. Zistite, ako sa spracovávajú údaje o vašich komentároch.