Stlačte "Enter" na preskočenie k obsahu

FineScanner PRO: OCR aplikácia v mobilnom telefóne

Každý z nás sa v bežnom živote stretáva s informáciami vo forme čiernotlače na papieri. Či ide o komunikáciu s úradmi, štúdium či záujmové a voľnočasové aktivity, všade tam sa stretneme s papierovou formou sprostredkovania obsahu. Vidiaci človek v takomto prípade použije zrak a bleskurýchlo prijíma tlačený obsah. Nevidiaci a slabozrakí používatelia podstupujú zložitejší proces, aby sa dostali k tomu, čo papier obsahuje. Tlačený obsah spracujú technickými pomôckami do elektronickej podoby tak, aby ho vedela asistenčná technológia v podobe čítača obrazovky alebo zväčšovacieho softvéru sprostredkovať zrakovo postihnutému človeku. Spracovanie pozostáva z dvoch krokov: Najprv sa obsah nasníma v podobe fotografie či obrázku. Ten je vernou kópiou tlačenej podoby, ktorá je však stále neprístupná pre sprostredkovanie nevidiacemu používateľovi. Slabozrakí človek si môže vystačiť aj s týmto stupňom spracovania. Zväčšovacie aplikácie už dokážu túto formu spracovať a dostatočne zväčšiť či farebne upraviť. Druhým krokom spracovania je optické rozpoznanie obsahu nasnímanej podoby tlačeného textu. Túto funkcionalitu zabezpečia takzvané OCR aplikácie. Z prostredia PC alebo notebookov je známa aplikácia Fine Reader od spoločnosti ABBYY. Tá je hojne využívaná nevidiacimi a slabozrakými používateľmi. Rovnomenná spoločnosť poskytuje aj riešenia pre mobilné telefóny. My sme mali možnosť otestovať aplikáciu FineScanner PRO pre operačný systém Android. V texte nižšie si popíšeme spôsob práce s ňou.

Inštalácia

Aplikáciu sme nainštalovali z obchodu Google Play. Slovenská pobočka ABBYY nám zapožičala licenciu pre aplikáciu FineScanner Pro určenú pre operačný systém Android. Po inštalácii si aplikácia vypýta povolenie na prístup k fotoaparátu a k súborom v úložisku. Používateľské rozhranie aplikácie je v anglickom jazyku a nie je možné ho prepnúť do žiadneho iného jazyka.

Práca v aplikácii

FineScanner umožňuje skenovanie obsahu textových predlôh prostredníctvom ich nasnímania integrovaným fotoaparátom mobilného telefónu. Druhou možnosťou je vyhľadanie uloženého súboru na internom úložisku. Po spustení aplikácie je zobrazená úvodná obrazovka, ktorá slúži ako hlavná pracovná plocha. Pri prvom spustení je prázdna. Obsahuje iba ovládacie tlačidlá. Prácou s dokumentami sa tu objavia všetky nasnímané a neodstránené predlohy. Aplikácia nazýva nasnímané predlohy dokumenty. Spustenie novej úlohy uskutočníme potvrdením tlačidla New document. Tlačidlo je umiestnené v pravom dolnom rohu na spôsob iných Android aplikácií.

Nasnímanie predlohy

Aktivovaním tlačidla New document je aktivovaný fotoaparát. Na displeji sa zobrazí obsah snímaný zadnou kamerou. V pravom hornom rohu je umiestnené tlačidlo Flash, ktorým zapneme alebo vypneme osvetlenie bleskom. Vedľa neho vľavo je umiestnené tlačidlo Automatic cropping (automatické orezanie). V rovnakej úrovni úplne vľavo nájdeme nepopísané tlačidlo, ktoré znamená krok späť. Jeho aktivovaním sa vrátime na základnú obrazovku aplikácie. V dolnej časti nájdeme tlačidlo spúšť fotoaparátu (opäť nepopísané, identifikovať ho môžeme iba podľa zvuku prechodu medzi prvkami) a vpravo sa nachádzajúce tlačidlo Gallery, ktorým prejdeme do galérie uložených snímok. Poklepaním na spúšť fotoaparátu dochádza k nasnímaniu aktuálne zameraného obsahu. Snímanie je sprevádzané zvukom, podľa ktorého vieme, že sa udialo, čo sme chceli. Po nasnímaní obrazu sú zmenené tlačidlá v dolnej časti obrazovky. Vľavo je umiestnené tlačidlo Delete na odstránenie posledného nasnímaného obsahu, v strede ostalo tlačidlo spúšte fotoaparátu a vľavo sa objavilo tlačidlo indikujúce počet nasnímaných strán. V jednej úlohe môžeme nasnímať niekoľko strán a tak vytvoriť viacstranový dokument. Uskutočníme to tak, že opakovane stláčame tlačidlo spúšte fotoaparátu. Po dokončení snímania predlôh poklepeme na tlačidlo označujúce počet nasnímaných strán, čím aplikácia prejde na ďalší krok spracovania nasnímaného obsahu. Máme možnosť upraviť farebnú škálu obrazu na čierno-bielu, odtiene sivej, plnofarebnú, alebo vrátiť sa k pôvodne nasnímanému obsahu. Ďalej je možnosť orezania snímky, posunu doľava alebo doprava, uplatnenia filtrov, či odstránenia stránky. Ak sme so snímkou spokojní, poklepeme na tlačidlo Save umiestnené v pravom hornom rohu. Dokument je uložený do zoznamu na hlavnej obrazovke aplikácie. Nájdeme ho ako prví zhora. Z pohľadu nevidiaceho či slabozrakého používateľa je nasnímanie predlohy a následná úprava snímky proces, ktorý táto aplikácia nemá dostatočne zvládnutý. Odhliadnuc od nepopísaných tlačidiel nie je nijako oznámené zameranie snímaného obsahu. Taktiež chýba samostatné vyhodnotenie svetelných podmienok a riadenie osvetlenia predlohy.

Rozpoznanie obsahu snímky

Rozpoznanie obsahu uskutočníme tak, že nájdeme dokument, ktorý chceme spracovať v zozname dokumentov na hlavnej obrazovke aplikácie. Dvojitým poklepaním naň ho otvoríme. V dolnej časti obrazovky je umiestnené tlačidlo Recognize slúžiace na spustenie rozpoznávania. Poklepaním naň sa sprístupnia možnosti nastavenia parametrov rozpoznávania. K dispozícii sú:

  • Nastavenie jazyka rozpoznávaného dokumentu – prednastavený jazyk je Angličtina UK. Poklepaním na označenie jazyka je sprístupnený zoznam podporovaných jazykov. Označením jedného alebo viacerých určíme poradie jazykov, ktoré budú pri rozpoznávaní vyhodnocované ako jazyk obsahu dokumentu.
  • Výstupný formát. Určíme do akého formátu bude uložený výsledok rozpoznávania. Poklepaním na označenie výstupného formátu je sprístupnený zoznam podporovaných formátov, z ktorých si jeden vyberieme.

Rozpoznávanie spustíme poklepaním na tlačidlo Recognize the text. Proces spracovania je oznamovaný premenlivým tlačidlom v strede v dolnej časti obrazovky. Ukončenie rozpoznávania indikuje dané tlačidlo s označením výstupného formátu, ktorý sme zvolili pred spustením procesu rozpoznávania. Poklepaním na tlačidlo s označením výstupného formátu dôjde k uloženiu výsledku rozpoznávania a k otvoreniu výsledku. Pri otváraní výsledného súboru sa nás aplikácia opýta na inštalovanú aplikáciu, v ktorej sa má výsledok otvoriť. Vyberieme si jednu z ponúkaných možností poklepaním na príslušnú ikonu. V otvorenom dokumente sa následne orientujeme už podľa spôsobu práce pre danú aplikáciu. Štandardne dôjde k prečítaniu obsahu po priložení prsta na obrazovku a krátkom pridržaní na mieste. Pri teste sme vyskúšali automatickú detekciu orientácie obsahu. Aplikácia správne detegovala text otočený na ležato aj dole hlavou. Pri testovaní sme narazili na situácie, v ktorých došlo k nekvalitnému nasnímaniu predlohy. V takom prípade proces rozpoznávania nedopadol dobre a nebolo nič rozpoznané. Tento stav bol indikovaný textom „Not recognized“ tlačidla v strede dolnej časti obrazovky. Na základnú obrazovku sa vrátime tlačidlom Späť v ľavom hornom rohu alebo systémovým tlačidlom Späť.

Prehľad dokumentov

Dokumenty, ktoré prešli rozpoznávaním, majú dostupný náhľad výsledku rozpoznania po ich otvorení dvojitým poklepaním z hlavnej obrazovky. Spracované dokumenty môžeme odstrániť zo zoznamu na hlavnej obrazovke aplikácie. Funkcia Delete sa nachádza v zozname funkcií, ktorý sa zobrazí po poklepaní na tlačidlo Ďalšie v pravom hornom rohu pri otvorenom dokumente. Pre uľahčenie orientácie v spracovaných dokumentoch aplikácia ponúka filtrovanie na základnej obrazovke. Ďalšou z funkcií je zdieľanie dokumentov s inými používateľmi. Na to slúži funkcia Share dostupná na základnej obrazovke.

Nastavenia

Aplikácia umožňuje vykonať niekoľko používateľských nastavení. Tie sú dostupné po poklepaní na tlačidlo Navigate up v ľavom hornom rohu základnej obrazovky aplikácie a aktivovaním položky Settings. V zobrazenej ponuke nastavení je možné zapnúť automatické orezávanie, zobrazenie atribútov dokumentu, ukladanie originálu snímky, vylepšovanie produktu ABBYY či odosielanie prevádzkových informácií spoločnosti ABBYY.

Záver

Aplikácia je dobrým pomocníkom pri sprístupňovaní obsahu sprostredkovaného tlačenou formou. Pre obsluhu nevidiacimi používateľmi nie je úplne vyladená, keďže obsahuje niekoľko nepopísaných tlačidiel a nedotiahnutý proces snímania predlohy, ako sme uviedli v článku. Ako mierny nedostatok sa javí aj absencia používateľského rozhrania v slovenskom jazyku. Aplikácia je náročná na batériu. Rozpoznávanie sa nespustí, ak má batéria hodnotu nastavenú ako hranicu pre systém Android, ktorý už vyžaduje potrebu pripojenia nabíjacieho adaptéra. Spracovanie niekoľkých dokumentov odkrojí aj niekoľko desiatok percent z kapacity batérie. V obchode Google Play je dostupná aj bezplatná verzia tejto aplikácie, ktorá sa dá vyskúšať na obmedzenom počte dokumentov.

Jeden komentár

  1. Michal Sihelský
    Michal Sihelský 30. januára 2019

    Zdravím,
    síce túto apku od abbyy som neskúšal, ale ich apku text grabber občas používam a súdiac z článku mi príde jednoduchšia na používanie a hlavne k rozpoznanému textu sa rýchlejšie dostanem, lebo nemusím nič ukladať a následne inde otvárať, rovno to čítam v aplikácii. Taktiež ak sa nemýlim, tak text grabber je omnoho lacnejšia aplikácia, hoc spomínaná aplikácia občas býva v zľave.
    Takže neviem či ten príplatok stojí za to, lebo ak rozpoznáva text rovnako kvalitne ako grabber, tak nevidím zmysel si priplácať.
    No na rozpoznávanie textu čo sa týka kvality rozpoznávania, sú aj lepšie riešenia v podobe napríklad be my eyes pro a podobne, kde okrem iných pre nevidiacich užitočných funkcií, tak aj rozpoznávanie textu je kvalitnejšie ako u abbyy.

Napísať odpoveď pre Michal Sihelský Zrušiť odpoveď

Vaša e-mailová adresa nebude zverejnená.

Táto webová stránka používa Akismet na redukciu spamu. Získajte viac informácií o tom, ako sú vaše údaje z komentárov spracovávané.