Dizertační práce
Rychlé a robustní kanály pro analýzu dat
Analýza dat se obvykle provádí složením řady diskrétních nástrojů a knihoven do datově-analytických kanálů. Ty jsou jádrem datových věd, které dnes zažívají strmý růst počtu výpočetních metod a objemu analyzovaných dat. Díky tomu vznikají problémy se škálovatelností těchto kanálů a důvěryhodností jejich výsledků.
Obsahem této disertační práce je výzkum škálovatelnosti (přizpůsobivosti se rostoucí velikosti dat a výpočetním potřebám) a důvěryhodnosti (usnadňují auditování výsledku) datově-analytických kanálů. Výzkum bude probíhat ve dvou rovinách. První se zaměří na možnosti rozšíření programovacího jazyka R umožňující transparentní vertikální a horizontální škálování. Druhá rovina bude výzkum kombinací technik statické a dynamické analýzy programů k získání informací o typech a závažnosti programovacích chyb, které se vyskytují v kódech datově-analytických kanálů a následně návrh algoritmů pro jejich detekci a možné automatické odstranění.