Dizertační práce
Podobnostní vyhledávání ve velkých datech
Složitost vyhledávacích systémů nové generace vychází z požadavku organizovat masivní a stále rostoucí objemy heterogenních dat a metadat spolu s potřebou poskytovat distribuovanou správu převážně založenou na podobnostním vyhledávání. Problém začíná získáváním slabě strukturovaných nebo zcela nestrukturovaných dat, jako jsou obrázky a video, pro které jsou nutně potřeba inovativní techniky pro extrakci a klasifikaci informací, aby se zvýšila jejich vyhledatelnost. Nalezitelnost objektu a vlastní proces vyhledávání v zásadě považujeme za dva zásadní a synergické aspekty vyhledávání. Oba představují výzvy v oblasti efektivity, které vyžadují inovativní teorie a technologie, a musí být studovány společně, aby se sblížily s kvalitativně novými vyhledávacími nástroji budoucnosti. Téma disertační práce má povahu základního výzkumu, protože se zabývá teoretickými limity vyhledávání podle podobnosti v kontextu problému velkých dat. Cílem práce je hledání a vývoj škálovatelných řešení.