Stlačte "Enter" na preskočenie k obsahu

CAPTCHA – čo to je a ako sa s ňou vysporiadať

S bezpečnostným mechanizmom zabraňujúcim zneužívaniu poskytovaných online služieb sa stretol už každý z Vás. Či už ide o zriadenie bezplatnej  e-mailovej schránky alebo zapojenie sa do diskusie, je potrebné absolvovať jednoduchý test. Tento by mal zabezpečiť, že prihlasovaným používateľom je človek a nie automatizovaný softvérový nástroj.

Najrozšírenejším bezpečnostným systémom je CAPTCHA. Denne sa na celom svete použije niekoľko desiatok milión krát.

Čo to je CAPTCHA

CAPTCHA je systém navrhnutý na odlíšenie človeka od automatizovaného stroja. CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) v preklade verejný kompletne automatizovaný turingov test na odlíšenie človeka od počítača. Alan Turing bol britský matematik. Vo svojej práci „Vypočtové stroje a inteligencia“ z roku 1950 navrhol test, na základe ktorého by sa dalo rozhodnúť, či inteligenčné schopnosti počítača dosiahli úroveň človeka. Tento postup je označovaný ako „Turingov test“. V CAPTCHA ide o jednoduchú formu tohto testu, kde sú človeku predkladané úlohy, s ktorými majú aktuálne počítačové systémy problém.  Ide o odpísanie znakov z obrázka, vyriešenie jednoduchej matematickej úlohy, rozpoznanie tvarov, zvieratiek či tvárí známych ľudí. Systém CAPTCHA predpokladá, že s ním komunikuje robot až dovtedy, kým mu správnym splnením úlohy nie je dokázaný opak.

V súčasnosti je situácia s plnením logických úloh počítačmi značne odlišná. Zaslúžil sa o to pokrok v rozvoji neurónových sietí a v samoučiacich sa systémoch. Tieto dokázali prekonať aj najnovšie druhy CAPTCHA. Napríklad spoločnosť Google začala v apríli 2016 používať spôsob, keď stačilo používateľovi kliknúť na obrázok s nápisom „Ja nie som robot“. Avšak už onedlho neurónová sieť tej istej spoločnosti dokázala tento mechanizmus spoľahlivo prekonať.

Formy CAPTCHA

Textová

Prvé CAPTCHA sa začali používať v roku 1997. Implementovali ich vývojári pre prehliadač Altavista. K masívnemu rozšíreniu došlo v roku 2000 pri jeho nasadení pre spoločnosť Yahoo pri registrácii do ich emailovej služby.

Pri vývoji sa návrhári inšpirovali manuálom skenera a navrhli také obrázky, aby s nimi mala OCR technológia problém. Postupom času dochádza k rôznym úpravám používaných obrázkov. Pridávajú sa písmená, používajú sa malé a veľké znaky a rôzne sa deformujú.

Používatelia, snažiaci sa zneužiť online služby, používajú vo svojich automatizovaných nástrojoch OCR technológiu a rôzne techniky predprípravy obrázku. Takto sa snažia vylepšiť výsledok OCR rozpoznávania.

Postupne ako sa zdokonaľuje OCR a spôsoby prieku cez CAPTCHA, tak sa aj „komplikujú“ Captcha obrázky. Pridáva sa pozadie či už jednofarebné alebo rôzne vzorované, znaky sa nakláňajú a rôzne deformujú. Používajú sa rôzne fonty a znaky sa spájajú čiarami.

Tento spôsob má svoje výhody nakoľko je možné automaticky generovať rôzne varianty znakov a použiť na ne určitý počet grafických filtrov vybraných náhodne.

Zvuková

Rovnako jednoduchým spôsobom je aj zvuková CAPTCHA. Ide o hlasom interpretované znaky a číslice na rôzne zašumenom pozadí. Tento spôsob sa používa ako doplnok k obrázkovej CAPTCHA ako spôsob jej sprístupnenia pre handicapovaných používateľov.

Tento spôsob je však, z pohľadu poskytovateľov služby, taktiež zraniteľný. Zdokonalené a neustále zlepšujúce sa nástroje na rozpoznanie reči nemajú problém zo zvukovou podobou CAPTCHA. Ako reakcia na to sú do nahrávok pridávané rôzne šumy a ruchy prostredia. To spôsobuje ťažkú rozpoznateľnosť obsahu.

Obrázková

Objavujú sa aj obrázkové CAPTCHA. Známy je spôsob identifikovať medzi skupinou obrázkov tie s rovnakým zvieratkom. Najznámejším praktickým riešením bolo identifikovanie mačiek v skupine obrázkov známe ako Kitte nAuth. V sérii obrázkov by nebol problém identifikovať obrázky mačiek ani pre automat. Človek nemá problém rozpoznať mačku ani ak je obrázok značne deformovaný alebo ak ide o animovanú postavičku kocúra v čižmách a podobne. Táto forma je ťažko prístupná pre zrakovo postihnutých používateľov. Aby takýto test bol prístupný je nevyhnutné, aby jednotlivé obrázky mali vyplnený alternatívny popis. Inak je bez pomoci vidiacej osoby tento test neprekonateľný.

Pri obrázkových CAPTCHA sa spoločnosť Microsoft spojila s portálom na sprostredkovanie adopcie zvieratiek a používa obrázky z ich databázy. Ide o obmeňujúci sa zoznam so 150 000 položkami a takýmto spôsobom sa znižuje možnosť jeho automatického prelomenia.

Logická

Inou formou je odpoveď na jednoduché otázky. Napríklad „Aký deň nasleduje po nedeli?“ alebo „Koľko je dva plus päť?“. Takáto forma má jednoznačnú výhodu pre zrakovo postihnutých používateľov. Ide tu o textovú variantu a čítače s ňou nemajú žiaden problém.

Pre použitie logických otázok vznikla databáza so 180 miliónmi otázok a ich odpoveďami. Vývojárom webov je voľne k dispozícii. Problémom je, že je iba v angličtine a pre inojazyčné komunity je jej použitie značne obmedzené. Pri postupujúcom pokroku na poli umelej inteligencie je odpovedanie na pomerne jednoduché logické otázky ľahkou úlohou. S umelou inteligenciou sa môže stretnúť aj bežný človek. Ide o hlasovú asistentku Siri od spoločnosti Apple alebo Cortanu od Microsoftu. Špecializované systémy ako je napríklad Watson od spoločnosti IBM dokážu poraziť vo vedomostných úlohách aj najlepších z ľudských súťažiacich.

reCAPTCHA

V roku 2009 vznikol nápad kedy by sa kapacity používané pre splnenie CAPTCHA testov použili aj na plnenie úloh, ktoré sú verejne prospešné a počítače majú s nimi problém. Vznikol projekt na prepis „nerozpoznateľných“ slov do textovej podoby. Pri digitalizácii tlačeného obsahu sa vyskytujú slová, ktoré OCR nástroj nedokáže rozpoznať. Tieto sa následne ponúknu používateľom ako CAPTCHA. Pýtate sa ako následne systém vie, že prepis človekom je správny. Používateľovi sa ponúknu dve slová pričom jedno je rozpoznané a druhé je nesprávne. Slová sa zobrazia v náhodnom poradí. Predpokladá sa, že ak človek odpovedal správne na rozpoznané slovo, tak rozpoznal správne aj doposiaľ neznáme slovo. Pri určitom množstve správny odpovedí sa následne neznáme slovo označí ako rozpoznané a už sa ďalej nepoužíva ako nerozpoznané.

Takýmto spôsobom sa podarilo úspešne dotiahnuť digitalizáciu novín New York Times.

Herná

Veľmi zaujímavou formou je herná CAPTCHA. Používateľovi sa zobrazí herná plocha a má za úlohu napríklad umiestniť kvety do vázy, oči na tvár, ingrediencie na pizzu a podobne. V tejto variante poletujú po ploche šampióny, rajčiny, kladivá a tričká a vašou úlohou je myškou chytiť jednotlivé ingrediencie a premiestniť ich na pizzu. Problémom môže byť samotné pochopenie úlohy.

Tvarová

Nedostatkom s ťažkým pochopením netrpí variant s kreslením tvarov. Ide o obkreslenie jednoduchých geometrických tvarov. Používateľovi sa zobrazí interaktívna plocha s geometrickým tvarom a jeho úlohou je obkresliť tento tvar. Nejde o dokonalosť ale o približné ale dostatočne presné obkreslenie tvaru. Keďže ide o stále tú istú úlohu, tak nie je problém s jej jazykovou mutáciou.

Tieto obrázkové CAPTCHA sú však absolútne neprístupné pre nevidiacich používateľov.

Skryté pole

Špecifickým prípadom je použitie skrytých polí. Ide o textové pole, ktoré sa používateľovi na stránke vôbec nezobrazí. Robot pri vyplňovaní formulára vôbec nevie, že pole je skryté a automaticky ho vyplní. Formulár pri spracovaní je vyhodnotený ako vyplnený robotom, nakoľko je vyplnené aj pole, ktoré používateľ nemal prístupné. Skryté pole môže byť vyplnené aj nejakou predvolenou hodnotu, ktorú robot prepíše a to je znakom, že ide  robota.

Delený obrázok

Pre zamedzenie zneužitia služby robotom je efektívny spôsob úpravy CAPTCHA obrázku. Obrázok horizontálne rozdelíme do niekoľkých častí a následne ho pomocou CSS zobrazíme používateľovi ako jeden celok. Takto upravený obrázok nemusí mať ani nejako zvlášť deformovaný text. Pre robota je takto upravený obrázok nezmysel a človek ho poľahky rozpozná.

Vytvorenie vlastnej CAPTCHA

Vo všeobecnosti platí, že si môžeme vymyslieť vlastný spôsob ako rozpoznať človeka prihlasujúceho sa do našej služby. Ak náš test bude jedinečný, môže robotov zmiasť. No v čase keď sa naša služba stane dostatočne populárnou, stane sa atraktívnou aj pre jej zneužitie. V takom prípade sa môže stať, že útočník napíše robota prispôsobeného na náš test a dôjde k zneužitiu služby.

Prekonanie CAPTCHA

Pre prelomenie CAPTCHA obrázkov sa používajú rôzne techniky od predprípravy obrázku pre OCR rozpoznávanie po ručné ošetrenie výberu tematických obrázkov zo skupiny, napísanie špecializovaných robotov až po použitie ľudskej sily.

Pri „potrebe“ prelomenia CAPTCHA sa v môžeme obrátiť aj na služby na internete, ktoré za poplatok ponúkajú identifikáciu CAPTCHA človekom. Napríklad za 100 USD si môžeme dať rozpoznať 100 000 obrázkových CAPTCHA. Služba nám ponúkne integráciu zdrojového kódu a my po jeho implementácii na našu stránku automaticky odošleme Captcha obrázok a do niekoľkých minút sa nám vráti výsledok. Rozpoznávanie robí človek sediaci za počítačom.

Nevyhnutnosť či otrava

Mnohí z nás často hromžia nad prekážkou, ktorá sa pred nami objaví pri používaní niektorej online služby. Narazíme na CAPTCHA test a neostáva nám nič iné iba sa s ním popasovať. V tom lepšom prípade je dostupná zvuková alternatíva. Používanie CAPTCHA testov je v súčasnosti nevyhnutnosťou. Poskytovatelia by sa inak nevyhli zneužívaniu svojich služieb automatizovanými nástrojmi (robotmi), ktoré by ich využili napríklad na spamovanie.

Prístupnosť CAPTCHA

Použité formy CAPTCHA sme si už uviedli, teraz si priblížime ako je to s ich prístupnosťou pre nevidiaceho používateľa.

Takýto používateľ má spustený čítač obrazovky, ktorý mu oznamuje zobrazovaný obsah. Obsah, ktorý sa dá prečítať je zvyčajne textovej povahy. Avšak ani u textov spracovaných ako obrázok nie je situácia beznádejná. Vieme použiť OCR technológiu na rozpoznávanie textu. OCR funguje dobre ak je predloha kontrastná a písmo je štandardné. Pri deformovaných písmenách je výsledok zlý.

Pre uvedené dôvody potrebujú zrakovo handicapovaní používatelia na úspešné absolvovanie CAPTCHA pomoc.

  1. Pomôže nám vidiaci človek. Ide o „najefektívnejšiu“ pomoc. No málokedy je situácia, že je niekto nablízku práve vtedy, kedy pomoc potrebujeme.
  2. Druhym spôsobom je, že je CAPTCHA prístupná. Tu patrí napríklad alternatívny popis obrázkov, zvuková alternatíva obrázka, možnosť registrácie odoslaním formulára mailom, logický textový variant.
  3. Využitie služby na internete pre sprístupnenie CAPTCHA.

Ako si poradiť s pokriveným obrázkom

Používateľ so zrakovým handicapom, používajúci čítač obrazovky, môže výzvu menom CAPTCHA prekonať viacerými spôsobmi.

  1. Najideálnejšie ak je CAPTCHA realizovaná prístupnou formou a priamo čítač obrazovky dokáže interpretovať jej obsah. Takýto prípad nastane, ak je položená otázka v textovej podobe a očakáva sa reakcia vpísaním textu do editačného poľa. Napríklad pri otázke „Aký deň je druhý po strede?“ je odpoveďou „piatok“.
  2. V prípade opisovania rôzne zdeformovaného textu z obrázku je vhodné ak tento má v atribúte „alt“ (alternatívny popis) uvedený text z obrázka. Napríklad formou „Obrázok obsahuje text a5dtH. Takýto alternatívny text dokáže čítač prečítať.
  3. V prípade opisovania rôzne zdeformovaného textu má obrázok zvukovú alternatívu. Prítomnosť zvukovej alternatívy sa jasne označí a uvádza sa hneď za obrázkom. Používateľ s čítačom si dokáže takýto zvuk sám prehrať.
  4. V prípade formy, kedy je potrebné správne identifikovať obrázok zo skupiny obrázkov, je vhodné uvádzať alternatívny popis jednotlivých obrázkov. Alternatívne popisy dokáže čítač prečítať a tak sa CAPTCHA dá úspešne absolvovať.
  5. Ak je potrebné opísať text a nie je prítomný alternatívny popis ani zvuková podoba, tak použijeme webovú službu Webvisum alebo CaptchaHelp.cz.
  6. Vo všetkých ostatných prípadoch, keď je potrebná reakcia od používateľa, sa obrátime na vidiacu osobu.

Webvisum

Webvisum je internetová služba ponúkajúca nevidiacim používateľom sprístupnenie obsahu obrázkového Captcha s textovým obsahom. Pre použitie je potrebné si inštalovať doplnok do prehliadača Mozilla Firefox a zaregistrovať sa na stránke webvisum.com.

Pri výskyte CAPTCHA na stránke si používateľ z kontextového menu pre obrázok CAPTCHA zvolí funkciu pre sprístupnenie CAPTCHA. Výsledok rozpoznania sa mu oznámi a uloží sa do schránky operačného systému. Po prechode na editačné pole, kde sa má text opísať, je možné tento text vložiť.

Veľkým plus je odozva do niekoľkých sekúnd.

CaptchaHelp

CapchaHelp je služba ponúkajúca rozpoznanie obsahu CAPTCHA obrázkov pre handicapovaných používateľov. Službu nájdete na adrese www.captchahelp.cz. Pre jej použitie je potrebná registrácia a inštalácia doplnkov pre prehliadače Chrome a Chromium. Pre iné platformy sa podľa informácií na webstránke pracuje na rozšírení funkcionality.

Pre rozpoznanie obsahu CAPTCHA sa postupuje tak, že sa v okne prehliadača zobrazí tá časť stránky, ktorá obsahuje obrázok a následne sa použije inštalovaný doplnok. Tento odošle operátorovi screenshot a na novej karte, ktorá sa otvorí pri zaslaní odpovede od operátora, sa zobrazí výsledok rozpoznania. Screenshot je možné odoslať aj elektronickou poštou.

Nevýhodou služby je jej dostupnosť iba pre prehliadače, ktoré nie sú najlepšie prístupné s čítačmi obrazovky a takisto aj čas odozvy do 30 minút.

 

Zdroje

  1. Rozčuľuje vás CAPTCHA?
  2. V novej Google captcha stačí kliknúť na jeden obrázok
  3. CAPTCHA, aneb lze odlišit člověka a robota přístupným způsobem?
  4. Captcha – jak znechutit roboty a neodradit uživatele
  5. CAPTCHA: Jak se stát otrokem podivného obrázku
  6. CAPTCHA: negatíva a spôsoby prelomenia
  7. Potřebujete obejít CAPTCHA? Zaplaťte si armádu Indů
  8. CaptchaHelp.cz

Okomentujte ako prví

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *