Galaxy Tab blog: Google Goggles, a képdetektor

A Google Goggles a keresőóriás egyik, a Beta Labs égisze alól elérhető szoftvere, melynek segítségével fényképek alapján kereshetünk. Ez azt jelenti, hogy ha például az Eiffel torony előtt állunk, és nem tudjuk, hogy igazából mi is ez a fémtorony, akkor egyszerűen lefotózhatjuk azt, majd a programmal megetetve megtudhatjuk, hogy éppen Párizs legfőbb nevezetességénél sétálunk. A szöveges információkat egyéb keresési találatokkal is kiegészíti, sőt a GPS-koordinátákat is tudtunkra adja a program. A szoftver nem csak épületeket, hanem könyveket, névjegykártyákat, műtárgyakat, borokat, logókat és szöveget is képes azonosítani; ráadásul mindegyik találatot speciális információkkal és lehetőségekkel egészít ki; szövegnél például a fordítási funkciót is felajánlja.

Kezdjük a sort a nevezetes épületekkel! Magyarországon egyelőre Budapesten és Esztergomban próbáltam ki a programot, az esztergomi bazilikával és a Parlamenttel például könnyedén elboldogult a program, de a szintén esztergomi vízivárosi templom és a Mária-Valéria híd már megfeküdte a gyomrát. A könyvfelismerés viszonylag könnyen ment, bár a Jordán-Recski-Szeszlér féle Rendszeroptimalizálás című iromány megemésztése nem sikerült a programnak, ugyanakkor Palahniuk Choke című regényét elsőre felismerte. Az említett két kiadvány egy-egy oldalát is lefényképeztem a szövegfelismerést demonstrálandó, mindkettőt helyesen dolgozta fel a Goggles. Szövegeknél érdemes figyelni a megfelelő kontrasztra, hasonló színű betűk és háttér esetén már nem száz százalékos a működés.

Fura módon a logók felismerése ment a legnehezebben, ráadásul nemcsak magyarországi márkák ábráival próbálkoztam; elég meglepő, hogy a Samsung feliratot például egyáltalán nem vette be a gyomra, a Lenovóval viszont elsőre boldogult. A műtárgyakkal nem volt gond: a Nemzeti Múzeumba ugyan nem mentem be a táblagépet szorongatva, de a kipróbált Monet képet (A napfelkelte impressziója) és Michelangelo Dávid szobrát elsőre felismerte.

A fotók készítésekor oda kell figyelni, hogy lehetőleg minél kevesebb egyéb zaj legyen a képen a felismerendő objektum mellett; erre való a felületről elérhető kivágás funkció. A megfelelő fókuszálás is kulcsfontosságú, ezt segíti a programba épített funkció, melynek segítségével érintéssel határozhatjuk meg a fókuszpontot. Lehetőség van régebben elkészített fotók és egyéb képek analizálására is, ezt egyszerűen a Load Picture menüponton keresztül tehetjük meg. A képeket a jobb oldali sáv közepére helyezett exponáló gomb segítségével rögzíthetjük, az alsó virtuális billentyűvel pedig a vakut kapcsolgathatjuk ki és be.


Nagyon jópofa programmal van dolgunk, amely bár a magyarországi tartalmak felismerését nem viszi túlzásba, egy külföldi (jellemzően nyugati irányú) nyaraláson nagyon jól jöhet. Az alkalmazást folyamatosan hegesztik a Google-nál, jelenleg a növényfelismerésen dolgoznak; az alábbi hivatalos videó a program használatát mutatja be.

dr. Kind

Azóta történt

Előzmények