Článek
"Z obrázku vyextrahujeme určité vlastnosti, jako je barevné spektrum, textura nebo rozložení tvarů. Na základě takto analyzovaných vlastností pak program určí pro každý obrázek bod ve vícedimenzionálním prostoru a porovnává jeho vzdálenost s ostatními. Čím blíže jsou tyto body, tím podobnější si budou i k nim přiřazené obrázky," řekl Zezula.
Novou technologii lze využít kromě hledání multimédií na internetu také v biologii pro hledání podobných DNA sekvencí, v oblasti biometrických měření pro porovnávání otisků prstů nebo rozpoznávání obličejů či ve zpracování geografických dat. Program je možné použít také pro čištění dat, například při vyhledávání přebytečných kopií nebo odhalování plagiátů.
Součástí ocenění od IBM je dar v podobě osmi moderních výkonných serverů, díky nimž je demonstrační verze zpřístupněna široké veřejnosti na adrese http://mufin.fi.muni.cz/imgsearch/.
Porovnání 50 miliónů obrázků za půl vteřiny
Program dokáže srovnat obsah předlohy s více než 50 milióny obrázků v databázi zřejmě největšího internetového webu pro sdílení fotografií na světě Flickr za méně než půl vteřiny. "Do měsíce bychom měli naši databázi rozšířit na 100 miliónů a v blízké budoucnosti až na miliardu fotografií. Ve vývoji je také systém srovnávání video souborů a zvuků," řekl Zezula.
Na vývoji technologie pracuje tým mladých univerzitních vědců pod vedením Zezuly od roku 2004. Ke klíčovému posunu dospěli informatici v posledních dvou letech, kdy začali spolupracovat se společností IBM, která jim umožnila pracovat v jednom z osmi výzkumných center IBM na světě v izraelské Haifě.
Vyhledávání podle obsahu má podle Zezuly velkou budoucnost. "Odborníci odhadují, že jen v minulém roce se na světě nafotilo přes 100 miliard fotografií. I když se velká část smaže, je téměř nemožné opatřit všechny fotografie umístěné na internetu klíčovými slovy nebo popisky. Textové vyhledávání s těmito obrázky pak neumí příliš pracovat," dodal Zezula.