Galaxy Tab blog: Google Goggles, a képdetektor

Írta: dr. Kind
Forrás: PROHARDVER!
2011-05-05 15:27

A Google Goggles a keresőóriás egyik, a Beta Labs égisze alól elérhető szoftvere, melynek segítségével fényképek alapján kereshetünk. Ez azt jelenti, hogy ha például az Eiffel torony előtt állunk, és nem tudjuk, hogy igazából mi is ez a fémtorony, akkor egyszerűen lefotózhatjuk azt, majd a programmal megetetve megtudhatjuk, hogy éppen Párizs legfőbb nevezetességénél sétálunk. A szöveges információkat egyéb keresési találatokkal is kiegészíti, sőt a GPS-koordinátákat is tudtunkra adja a program. A szoftver nem csak épületeket, hanem könyveket, névjegykártyákat, műtárgyakat, borokat, logókat és szöveget is képes azonosítani; ráadásul mindegyik találatot speciális információkkal és lehetőségekkel egészít ki; szövegnél például a fordítási funkciót is felajánlja.

Kezdjük a sort a nevezetes épületekkel! Magyarországon egyelőre Budapesten és Esztergomban próbáltam ki a programot, az esztergomi bazilikával és a Parlamenttel például könnyedén elboldogult a program, de a szintén esztergomi vízivárosi templom és a Mária-Valéria híd már megfeküdte a gyomrát. A könyvfelismerés viszonylag könnyen ment, bár a Jordán-Recski-Szeszlér féle Rendszeroptimalizálás című iromány megemésztése nem sikerült a programnak, ugyanakkor Palahniuk Choke című regényét elsőre felismerte. Az említett két kiadvány egy-egy oldalát is lefényképeztem a szövegfelismerést demonstrálandó, mindkettőt helyesen dolgozta fel a Goggles. Szövegeknél érdemes figyelni a megfelelő kontrasztra, hasonló színű betűk és háttér esetén már nem száz százalékos a működés.

Fura módon a logók felismerése ment a legnehezebben, ráadásul nemcsak magyarországi márkák ábráival próbálkoztam; elég meglepő, hogy a Samsung feliratot például egyáltalán nem vette be a gyomra, a Lenovóval viszont elsőre boldogult. A műtárgyakkal nem volt gond: a Nemzeti Múzeumba ugyan nem mentem be a táblagépet szorongatva, de a kipróbált Monet képet (A napfelkelte impressziója) és Michelangelo Dávid szobrát elsőre felismerte.

A fotók készítésekor oda kell figyelni, hogy lehetőleg minél kevesebb egyéb zaj legyen a képen a felismerendő objektum mellett; erre való a felületről elérhető kivágás funkció. A megfelelő fókuszálás is kulcsfontosságú, ezt segíti a programba épített funkció, melynek segítségével érintéssel határozhatjuk meg a fókuszpontot. Lehetőség van régebben elkészített fotók és egyéb képek analizálására is, ezt egyszerűen a Load Picture menüponton keresztül tehetjük meg. A képeket a jobb oldali sáv közepére helyezett exponáló gomb segítségével rögzíthetjük, az alsó virtuális billentyűvel pedig a vakut kapcsolgathatjuk ki és be.

Nagyon jópofa programmal van dolgunk, amely bár a magyarországi tartalmak felismerését nem viszi túlzásba, egy külföldi (jellemzően nyugati irányú) nyaraláson nagyon jól jöhet. Az alkalmazást folyamatosan hegesztik a Google-nál, jelenleg a növényfelismerésen dolgoznak; az alábbi hivatalos videó a program használatát mutatja be.

dr. Kind

Hozzászólások (6)

Kapcsolódó cégek:
Samsung Galaxy Tab

Azóta történt

Galaxy Tab blog: mit hoz az Android 3.1?

Megjelent az első Honeycomb frissítés, lássuk, mit újítottak!

Blogbejegyzés 2011-05-20 16

Előzmények

Galaxy Tab blog: kezelés és testreszabás a 10.1-esen

Avagy itt az új Galaxy Tab 10.1V-ről szóló videósorozatunk első része.

Blogbejegyzés 2011-04-20 6

Percről percre

A marketingen segít spórolni az AI

it A Klarna is használ már AI-t, ők a marketingköltségeken spórolnak így évi 10 millió dollárt.

Biztonsági tanácsot és újabb áttörést ígér az OpenAI

it Nem csak biztonsági tanácsot állított fel az OpenAI, de egy új, áttörést ígérő AI-modell tréningezését is elindította.

Középpontba kerültek a hibrid autók, alig fogyaszt a BYD újdonsága

it 2,9 literes fogyasztást és több mint 2100 kilométeres hatótávot ígérnek a BYD új hibrid technológiájához, de a Toyota (és a Subaru, Mazda) is a hibrid motorokra koncentrál épp.

Állásajánlatok

Full Stack Developer Diákmunka

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Diákmunka junior fejlesztő

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Galaxy Tab blog: Google Goggles, a képdetektor

Azóta történt

Galaxy Tab blog: mit hoz az Android 3.1?

Előzmények

Galaxy Tab blog: kezelés és testreszabás a 10.1-esen

Percről percre

A marketingen segít spórolni az AI

Biztonsági tanácsot és újabb áttörést ígér az OpenAI

Középpontba kerültek a hibrid autók, alig fogyaszt a BYD újdonsága

Állásajánlatok

Full Stack Developer Diákmunka

Diákmunka junior fejlesztő

Tényleg három színben érkezett a Nothing Phone (2a)

2024 - Alig egy nap múlva jön a Sony új State of Play előadása

F1 24 - Íme a végső gépigény

Mozgásban a Conscript

5G-vel és hőkamerával strapálja magát az Ulefone

Premier előzetesen a Star Wars: Hunters

Poco M6 Plus néven újrázhat a Redmi Note 13R