Dizertační práce
Věda provozních dat: Strojového učení nad velkým množství dat z provozu infrastruktury systémů
Infrastruktury systémů, které dnes zahrnují operační systémy, síťové komunikační prvky, webové servery, prvky pro vyvažování zátěže, aplikační servery, atd. produkují během provozu systémů obrovské množství provozních dat. Výzkum v oblasti datových věd využívající provozní data má za cíl vylepšit metody strojového učení k lepšímu rozpoznání různých vzorů chování systémů, korelací a podobností mezi daty za účelem vylepšit správu systémů ale i jejich změny v návrhu nebo analýzu důvodů vzniku incidentů. Tyto úkoly zahrnují predikci chování a simulaci systémů při vzniku plánovaných i neplánovaných událostí jako jsou např. výpadky spojení, chyby serverů nebo nárůst pracovní zátěže systémů. Tento výzkum vylepší metody učení známé jako “supervised” a “unsupervised” learning přizpůsobené pro podmínky provozu systémů a bude zahrnovat širokou škálu metod pro klasifikaci, clusterování nebo regresi.