Stlačte "Enter" na preskočenie k obsahu

Gemini ako správca systému Android: Ovládanie zariadenia a aplikácií

Nasledujúci text nadväzuje na predstavenie modelu Google Gemini a jeho funkcie Live, pričom sa zameriava na integráciu tohto modelu priamo do operačného systému Android. Gemini v tomto kontexte nepredstavuje len izolovaný „chatbot v aplikácii“, ale produkt spoločnosti Google hlboko previazaný so systémom, ktorý postupne nahrádza štandardného Google Asistenta. Toto prepojenie prináša rozšírené možnosti bezdotykového ovládania mobilných zariadení.

Konfigurácia prepojenia so zariadením

Pre umožnenie vykonávania zmien v nastaveniach telefónu alebo ovládanie multimédií je nevyhnutné udeliť modelu príslušné povolenia, nakoľko v predvolenom nastavení nemá prístup k osobným údajom ani k aplikáciám tretích strán.

Postup konfigurácie je nasledovný:

  1. V aplikácii Gemini je potrebné prejsť do Nastavení (cez profilovú ikonu).
  2. Následne je nutné vyhľadať položku Rozšírenia (prípadne Pripojené aplikácie).
  3. V tejto sekcii sa nachádza zoznam služieb, ktoré je možné s Gemini prepojiť aktiváciou prepínačov:
    • Google Workspace: Umožňuje interakciu s Gmailom, Kalendárom a Dokumentmi.
    • YouTube a YouTube Music: Slúži na vyhľadávanie a prehrávanie obsahu.
    • Mapy Google: Pre navigáciu a lokalizačné služby.
    • Iné aplikácie: Podpora aplikácií ako Spotify, Samsung Notes či Samsung Reminder.

Dôležité upozornenie: Pre ovládanie hardvéru a základných funkcií telefónu (Budík, Časovač, Bluetooth, Baterka, Tichý režim) je kľúčové povoliť kategóriu Utility (Nástroje).

Poznámka: Model ovláda výhradne povolené aplikácie. Sprístupnenie týchto funkcií však viaže so zdieľaním citlivých údajov (napr. e-maily, poloha) so spoločnosťou Google, preto sa odporúča udeľovať oprávnenia s rozvahou.

Mechanizmus ovládania zariadenia

Po úspešnej konfigurácii je možné pristúpiť k ovládaniu. Je dôležité poznamenať, že príkazy na ovládanie zariadenia a aplikácií momentálne nie sú podporované v konverzačnom režime Gemini Live.

Pre zadávanie príkazov sú k dispozícii dve metódy:

  1. Textový vstup: Zadanie požiadavky do editačného poľa chatu.
  2. Štandardný hlasový vstup: Použitie tlačidla mikrofónu (zvyčajne v pravom dolnom rohu).

Poznámka pre používateľov čítača Corvus:

  • Pre správne fungovanie funkcie hlasového vstupu je nevyhnutné v nastaveniach Corvusu deaktivovať voľbu pre výstup prístupnosti. Toto nastavenie sa vykoná týmto postupom: Ponuka – Nastavenia – Zvuk – Pri reči používať výstup pre prístupnosť a túto možnosť je potrebné nastaviť na Vypnuté. Ak zostane táto voľba aktívna, Gemini nebude reagovať.

Spracovanie požiadaviek

Po zadaní príkazu model požiadavku spracuje. V histórii konverzácie sa následne zobrazí nielen text požiadavky, ale aj widget s riešením. Tento widget predstavuje náhľadové okno aplikácie priamo v rozhraní chatu, čo používateľovi umožňuje skontrolovať alebo upraviť výsledok bez nutnosti otvárania cieľovej aplikácie.

  • Príklad funkčnosti: Pri požiadavke „Zajtra ráno vstávam o 6:30 do práce, nastav mi budík,“ model potvrdí akciu textom (prípadne hlasom) a v čete zobrazí vizuálne potvrdenie z aplikácie Hodiny.
  • Multimédiá: Pri príkaze „Prehraj mi moju obľúbenú hudbu cez aplikáciu YouTube Music,“ Gemini otvorí aplikáciu na pozadí a v čete zobrazí prehrávač. História tak slúži ako kontrolný mechanizmus správnosti pochopenia zadania.

Prínos pre asistenčné technológie

Pre používateľov so zrakovým znevýhodnením predstavuje tento spôsob interakcie významné zefektívnenie. Kým štandardné nastavenie budíka cez čítač obrazovky vyžaduje množstvo gest a navigáciu v rozhraní, použitie Gemini redukuje tento proces na jednu vetu. Eliminuje sa tak nutnosť orientácie v zložitých vizuálnych rozhraniach aplikácií tretích strán, čo urýchľuje prácu so smartfónom.

Rozšírené možnosti využitia

Okrem základných systémových úkonov je možné model využiť na:

  • Zhrnutie e-mailov: Vyhľadanie a sumarizácia obsahu správ od konkrétneho kontaktu.
  • Organizáciu času: Pridávanie udalostí do kalendára.
  • Správu poznámok: Vytváranie záznamov v aplikáciách ako Samsung Notes.

Limity technológie a poznatky z testovania

Napriek pokročilým schopnostiam porozumieť prirodzenej ľudskej reči (čím odpadá nutnosť učenia sa presných povelov) ostáva funkčnosť na úrovni vylepšeného Google Asistenta. Model dokáže spúšťať aplikácie a vykonávať základné úkony, no plnohodnotnú dotykovú interakciu zatiaľ nenahrádza.

Je potrebné brať do úvahy, že LLM modely sú náchylné na chyby. Pri zhoršenej artikulácii nemusí byť hlasové ovládanie spoľahlivé a pri úlohách vyžadujúcich zhrnutie obsahu (napr. SMS) môže dochádzať k halucináciám (vymýšľaniu informácií).

Pri testovaní s asistenčnou technológiou Corvus boli identifikované špecifické problémy:

  1. Výber hlasu: Na niektorých zariadeniach sa vyskytol problém s prístupnosťou prvku pre výber hlasu asistenta, kde čítač tlačidlo identifikoval, ale nedokázal ho aktivovať.
  2. Kompatibilita aplikácií: Gemini momentálne nepodporuje interakciu so vstavanými aplikáciami sady Corvus. Spoľahlivá funkčnosť bola overená pri natívnych aplikáciách spoločností Google a Samsung.

Okomentujte ako prví

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *

Táto stránka používa Akismet na obmedzenie spamu. Zistite, ako sa spracovávajú údaje o vašich komentároch.