Ing. Magda Friedjungová, Ph.D.

Závěrečné práce

Bakalářské práce

Webová aplikace pro monitoring datového skladu ČVUT

Autor
Ondřej Pleticha
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Robert Kotlář
Anotace
V této bakalářské práci se zabývám problematikou ovládání ETL procesů v datovém skladu. Cílem práce je analýza, návrh a implementace serveru, který tyto procesy bude přehledně ovládat a monitorovat. Zároveň umožní uživateli změnu konfigurace a přehled v reálném čase. Kromě spouštění nahrávání Datového skladu ČVUT aplikace umožňuje spouštět vlastní nahraná ETL. Řešení je vyhotoveno jako webová aplikace v jazyce Python s frameworkem Flask.

Spolupráce studentů různé úrovně znalostí

Autor
Radomír Žemlička
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
V bakalářské práci se zabývám vytvářením vyvážených skupin studentů pro účely skupinové výuky na základě jejich výsledků v individuálních lekcích. Práce obsahuje přehled současných řešení pro vytváření skupin studentů společně a zároveň popis různých metod pro shlukování dat. Součástí práce je také analýza dostupných dat, implementace některých metod a jejich porovnání. Zvolil jsem konkrétně metody K-means, DBSCAN, Hopfield network a kombinaci Self-organizing map a aglomerativního hierarchického shlukování. V rámci práce jsem vytvořil knihovnu pro automatickou tvorbu skupin studentů, kterou je možné zabudovat do e-learningových systémů, které mají požadovanou strukturu dat.

Framework pro tvorbu diagnostického znalostního systému

Autor
Richard Werner
Rok
2018
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Zdeněk Balák
Anotace
Tato práce řeší návrh a implementaci frameworku pro tvorbu znalostních diagnostických systémů. Pro framework je použit Java projekt s knihovnami JavaFX pro GUI. Vytvořené řešení poskytuje rozhraní pro znalostní systém, ve kterém lze jednotlivé moduly vytvořit nezávisle na sobě. Je tak zajištěno správné fungování systému s předem nespecifikovanou implementací. Pro většinu modulů jsou vypracovány ukázkové implementace, které je možné v systému využít, nebo se jimi inspirovat ve vlastní tvorbě. Účelem této práce je zkvalitnění výuky studentům bakalářského předmětu Znalostní systémy na FIT ČVUT a zjednodušení průběhu výuky samotným vyučujícím.

Automatické kolorování obrázků

Autor
Justína Kušpálová
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Anotace
Množstvo rôznych metód bolo navrhnutých na ofarbovanie obrázkov. V mojej bakalárskej práci implementujem automatické kolorizovanie obrázkov pomocou generatívnych kontradiktórnych sietí - GANov. Ukázali sľubné výsledky pri generovaní rôznych dát, vrátane obrázkov. Používam dve modfikácie GANov - DCGAN a CycleGAN. Tieto dve metódy porovnávam a vyhodnocujem pomocou najpoužívanješích metrík, vhodných pre tento problém. V záverečne jčasti práce sú zobrazené aj ukážkové obrázky, vygenerované jednotlivými modelmi.

Rozšíření dat pomocí generativních adversariálních sítí

Autor
Iveta Šárfyová
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Většina dat z reálného světa není rovnoměrně rozdělena do odpovídajících tříd, ale je nevyvážená, což může mít velký vliv na kvalitu predikce klasifikačních modelů. Obecný přístup k řešení tohoto problému je modifikace původních datových sad tak, abychom dosáhli vyváženosti jednotlivých tříd. Tato práce se zaobírá vyvážením obrazových dat za pomoci generativních adversariálních sítí. Primární důraz je kladen na generování obrazových dat náležících do tříd s nedostatečným počtem reprezentantů, což je proces známý jako class balancing. Práce se zabývá analýzou a porovnáním různých technik používaných pro rozšíření dat, jako jsou geometrické metody nebo modely založené na principu neuronových sítí. Vyhodnocení je provedeno pomocí klasifikačních modelů, natrénovaných na původních, nevyvážených i uměle vyvážených datových sadách. Dosažené výsledky naznačují, jak schopnost jednotlivých metod rozšířit datové sady klesá se zvětšující mírou nevyvážení a rozmanitostí těchto sad.

Dokreslování obrázků pomocí generativních adversariálních sítí

Autor
Tomáš Halama
Rok
2020
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Obnovení poškozených oblastí v obrazových datech je aktuální a náročný problém, jehož obtížnost roste se závažností a velikostí daného poškození. V posledních pár letech lze pozorovat značný pokrok při řešení tohoto problému za pomoci hlubokých neuronových sítí. Tato práce se zabývá ověřením a srovnáním různých přístupů k doplňování obrazových dat. Jelikož generativní adversariální sítě jsou jednou z nejslibnějších architektur, byl v této práci zpracován přehled aktuálních metod a dvě z nich byly reimplementovány pro účely dokreslování. Naše implementace neuronových sítí jsou srovnány s jinými metodami za pomoci klasifikačních modelů. Prezentované výsledky vypovídají o vlivu typu a rozsahu poškození na schopnost jednotlivých metod provést úspěšné dokreslení.

Klasifikace kvality vozovky

Autor
Martin Lank
Rok
2021
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Automatické vyhodnocování kvality vozovky může být užitečné jak správním orgánům, tak i těm účastníkům silničního provozu, kteří vyhledávají vozovky s kvalitním povrchem pro co největší potěšení z jízdy. Tato práce se zabývá návrhem modelu, který klasifikuje obrázky silnic do pěti kvalitativních kategorií na základě jejich celkového vzhledu. V práci prezentujeme nový ručně anotovaný dataset, obsahující fotografie ze služby Google Street View. Anotace datasetu byla navržena pro motorkáře, ale může být použita i pro jiné účastníky silničního provozu. Experimentovali jsme jak s předučenými konvolučními neuronovými sítěmi, jako jsou MobileNet či DenseNet, tak s vlastními architekturami konvolučních neuronových sítí. Dále jsme vyzkoušeli různé techniky předzpracování dat, např. odstraňování stínů či kontrastně-limitní adaptabilní histogramovou ekvalizací (CLAHE). Námi navrhovaný klasifikační model využívá CLAHE a na testovací sadě dosahuje 71% přesnosti. Vizuální kontrola ukázala, že navrhovaný model je i s touto přesností využitelný za účelem, pro který byl navržen.

Predikce výsledků zápasů v MMA

Autor
Kryštof Dostál
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Mgr. Ladislava Smítková Janků, Ph.D.
Anotace
Cílem této bakalářské práce je vytvoření modelu, který predikuje vítěze profesionálních MMA zápasů. Predikce jsou založeny na statistikách z předchozích zápasů. Provedená rešerše zkoumá dostupné datové zdroje. K statistikám z předchozích zápasů jsou připojeny predikce sázkových kanceláří v podobě historických kurzů. Také byl proveden průzkum již existujících prací s podobnou tématikou. Na základě rešerše bylo vybráno několik klasifikačních modelů, které se následně natrénovaly na předzpracovaných datech a jejich predikce byly vzájemně porovnány, a to i s predikcemi sázkových kanceláří. Výsledky nejlepších modelů se jeví jako příznivé.

Predikce výkonů studentů

Autor
Anna Kapitánová
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Dombek, Ph.D.
Anotace
Dlouhodobým jevem českých vysokých technických škol je nízká úspěšnost studentů v dokončení studia. Školy se proto snaží poskytnout včasnou pomoc studentům, kteří mají problémy se studiem. K rozpoznání takových studentů může posloužit datová analýza a vytěžování znalostí ve vzdělávání. Tato práce se zabývá komplexní analýzou dat týkajících se studentů Fakulty informačních technologií Českého vysokého učení v Praze a záznamů jejich studijních výsledků. Použitá data z let 2009 až 2021 jsou získána z datového skladu ČVUT. Na předzpracovaných datech jsou vytvořeny prediktivní modely za pomocí metod strojového učení. Úkolem vytvořených modelů je získání předpovědi úspěšného dokončení studia na fakultě, rovněž předpověď průchodnosti studentů mezi jednotlivými semestry a také predikce výsledných známek studentů z vybraných fakultních předmětů. Současně je výstupem práce automatizace procesu predikování a diskuse použitelnosti výsledků v budoucích letech.

Modelování témat české poezie

Autor
Anna Tesaříková
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato bakalářská práce zkoumá současné metody pro modelování témat s důrazem na jejich využití v modelování témat poezie. Metody jsou aplikovány na Korpus českého verše. Tento korpus obsahuje 1 305 básnických sbírek z 19. a počátku 20. století, které jsou lemmatizované a foneticky, morfologicky, metricky a stroficky anotované. Práce vyhodnocuje výsledky jednotlivých metod a vzájemně je porovnává.

Návrh a implementace klientské části a rolí systému Reports

Autor
Adam Makara
Rok
2022
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Pavel Karol
Anotace
Táto bakalárska práca sa zaoberá návrhom a implementáciou užívateľských rolí so zameraním na prístup k jednotlivým dátovým zostavám na základe pridelených rolí v rámci ČVUT. Praktická časť práce sa zaoberá analýzou reportovacej aplikácie Reports, ďalej zoznámi čitateľa s architektúrou dátového skladu ČVUT, ktorý poskytuje dáta pre aplikáciu a taktiež ho oboznámi s užívateľskými rolami na univerzite. Praktická časť na základe analýzy rozširuje funkcionalitu aplikácie o prácu s rolami získanými zo systému Usermap na základe ktorých sú užívateľom po prihlásení automaticky pridelené skupiny v závislosti na ich aktuálnych biznis rolách. Pomocou skupín, ktoré majú priradené, môžu užívatelia pristupovať k určitým reportom a tým vidia len tie grafy, na ktoré majú oprávnenie. Pre reprezentáciu skupín a rolí je využitá databáza, s ktorou aplikácia komunikuje a pomocou nej možno jednotlivé role a skupiny prepojiť tak, aby sa užívatelia s určitými rolami automaticky pridávali do prepojených skupín. Riešenie zahŕňa možnosť sprístupniť daný report aj konkrétnym užívateľom, ktorých ručne priraďuje administrátor. Prínosom práce je systém rolí umožňujúci nastavenie prístupu k jednotlivým reportom v rámci aplikácie a rozšírenie ich grafickej reprezentácie.

Detekce úsměvu pro fakultní dávkovač bonbónů

Autor
Jan Orava
Rok
2023
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Jakub Novák
Anotace
Tato práce se zabývá vylepšením fakultního bonbónovače. Jsou popsány a použity různé metody pro detekci obličeje a úsměvu ve videu. Mezi zkoumané metody patří například konvoluční neuronové sítě, algoritmus Viola-Jones nebo HOG. Metody jsou porovnány na veřejně dostupných datasetech. Jako nejvhodnější metoda pro detekci obličeje byla zvolena neuronová síť z knihovny Mediapipe, která dosahuje lepší přesnosti i rychlosti než metoda v původní implementaci. Pro detekci úsměvu byla zvolena metoda HOG, která předčila konvoluční neuronovu síť původního řešení. Výsledné metody byly nasazeny na produkční prostředí bonbónovače a je možné je využít.

Vizualizace extrakce témat Korpusu českého verše

Autor
Jonáš Sirko
Rok
2024
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Tato bakalářská práce se zabývá procesem vizualizace shlukovacích metod s důrazem na aplikaci v oblasti zpracování přirozeného jazyka, které jsou použity pro řešení nesupervizované úlohy shlukování za účelem extrakce témat a motivů z korpusu českého verše. V práci jsou představeny jak shlukovací metody samotné, tak možné způsoby jejich vizualizací. Tyto metody jsou dále aplikovány na vektorizovaný korpus českého verše a s pomocí vizualizací porovnány.

Vizualizace chování algoritmů strojového učení po doplnění chybějících dat

Autor
Naďa Fučelová
Rok
2024
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Dátové sady tvoria neoddeliteľnú súčasť strojového učenia, zohrávajú kľúčovú rolu pri trénovaní modelov a v konečnom dôsledku formujú ich predikcie. V reálnych dátových sadách však často niektoré hodnoty chýbajú, čo môže spôsobovať širokú škálu problémov od zníženej presnosti až po neschopnosť niektoré algoritmy vôbec použiť. Táto práca sa zaoberá skúmaním metód dopĺňania chýbajúcich hodnôt v tabulárnych dátových sadách a ich vplyvu na vybrané algoritmy strojového učenia. Výsledkom je webová aplikácia, ktorá má za cieľ uľahčiť pochopenie tejto problematiky. Aplikácia umožňuje na používateľom nahranú dátovú sadu aplikovať vybrané metódy a následne pozorovať ich vplyv na zvolený algoritmus strojového učenia prostredníctvom vizualizácií. Práca ďalej obsahuje niekoľko praktických ukážok použitia aplikácie na známych dátových sadách sprevádzaných diskusiou dosiahnutých výsledkov.

Crosphere

Autor
Daniel Ježek
Rok
2024
Typ
Bakalářská práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Dombek, Ph.D.
Anotace
Tato bakalářská práce se zabývá možnostmi vytvoření herního agenta na bázi strojového učení pro vlastní deterministickou deskovou hru pro dva hráče s názvem Crosphere. Byly implementovány tři typy herního agenta založené na algoritmu Monte Carlo Tree Search v kombinaci s náhodnými simulacemi, heuristikou a konvoluční neuronovou sítí. Druhý ze zmíněných modelů má nejlepší výsledky, je schopný porazit začátečnického lidského protivníka. Byla také vytvořena mobilní aplikace pro Android, ve které uživatel může hru hrát proti hernímu agentovi.

Diplomové práce

Doporučovací systém pro výběr volitelných předmětů

Autor
Ondřej Nový
Rok
2017
Typ
Diplomová práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Cílem práce bylo vytvořit doporučovací systém volitelných předmětů pro studenty Fakulty informačních technologií ČVUT. Bylo vyzkoušeno více metod doporučování, konkrétně kolaborativní filtrování založené na matici a kolaborativní filtrování založené na dopředné neuronové síti. K uživatelskému testování byla vybrána jednodušší metoda založená na matici, jelikož dokázala lépe odhadnout budoucí známku studenta, což autor považoval za důležitý aspekt toho, aby studenti doporučení důvěřovali. Výsledný doporučovací systém je možné dále vylepšovat, tato práce obsahuje detailní analýzu problematiky i dostatečně obecně předzpracovaná vstupní data, a veškerou další práci v této oblasti výrazně usnadňuje.

Návrh datových vrstev pro datový sklad ČVUT

Autor
Jakub Krejčí
Rok
2017
Typ
Diplomová práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
doc. Ing. Robert Pergl, Ph.D.
Anotace
Tato diplomová práce se zabývá návrhem a implementací datových vrstev datového skladu ČVUT, který vznikl rámci rozvojových projektů (DÚ č. 20 a č. 46). V práci je popsána teorie z oblasti business intelligence, datových skladů, architektur datových skladů a databázových jmenných konvencí. V implementační části je popsán návrh databázové jmenné konvence pro datový sklad a architektura datového skladu ČVUT. V rámci práce byla provedena implementace jednotlivých datových vrstev a tvorba datového modelu centrální databáze. Tato implementace byla otestována vizualizací datového tržiště pomocí nástroje Pentaho BI Server.

Analýza chování studentů v systému MARAST

Autor
Jan Nováček
Rok
2018
Typ
Diplomová práce
Vedoucí
Ing. Magda Friedjungová
Oponenti
Ing. Tomáš Kalvoda, Ph.D.
Anotace
Práce se zabývá implementací komponenty výukového systému MARAST za účelem analýzy dat z kvízů. Práce obsahuje seznámení se s doménou a dodaným exportem dat, který je dále podroben manuální analýze. Během analýzy byly použity metody matematické statistiky a vytěžování znalostí z dat, včetně metod strojového učení bez učitele jako je shlukování a detekce anomálií. Další část obsahuje vývoj analytické komponenty. Vývoj se sestává z analýzy, návrhu a implementace samotné komponenty, která byla vytvořena jako webová aplikace. Výsledkem práce je funkční komponenta pro analýzu dat z kvízů systému MARAST, která je otestována, zdokumentována a nasazena.

Studijní podpora pro vizualizaci dat

Autor
Alžbeta Gogoláková
Rok
2022
Typ
Diplomová práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Karel Klouda, Ph.D.
Anotace
Na Fakulte informačných technológií ČVUT v Prahe sa bude vyučovať nový predmet s názvom Vizualizácia dát. Táto práca popisuje proces tvorby samostatných prác a študijných materiálov spomínaného predmetu na základe rešerše výuky podobných predmetov na iných univerzitách a analýzy metód vizualizácie dát.

Binary Data Balancing Methods

Autor
Michaela Kučerová
Rok
2024
Typ
Diplomová práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
Spousta tabulkových datasetů reálného světa je nevyvážená, což má negativní dopad na kvalitu výstupů modelů, jež používají tato nevyvážená data. Existuje řada přístupů, jak se s tímto problémem vypořádat, přičemž jedním z nich je balancování datasetu. Tato magisterská práce obsahuje přehled existujících balančních metod, jako je například SMOTE, pro nevyvážené datasety problému binární klasifikace. V práci jsou nastíněny tradiční metody i techniky založené na generativních metodách. Kromě toho je představena nová metoda vzorkování nazvaná LIT-GAN. Tato metoda kombinuje techniku interpolace s generativními modely. Vybraných deset metod vzorkování a tato nová metoda LIT-GAN jsou experimentálně porovnány pomocí klasifikace na často používaných datasetech se šesti evaluačními metrikami.

Explainability in deep learning-based medical image analysis

Autor
Martin Lank
Rok
2024
Typ
Diplomová práce
Vedoucí
Ing. Magda Friedjungová, Ph.D.
Oponenti
Ing. Daniel Vašata, Ph.D.
Anotace
V této práci aplikujeme metody vysvětlitelnosti Grad-CAM++, LayerCAM a SmoothGrad na konvoluční neuronovou síť založenou na EfficicientNetV2 a doučenou na mikroskopických histologických snímcích. Tato neuronová síť predikuje průměrnou difuzivitu (MD) a frakční anizotropii (FA), původně získanou technikou difuzního tenzorového zobrazování (DTI). Cílem této práce je odhalit, které histologické vlastnosti mají vliv na zvýšení MD a FA. Naše síť dosahuje více než 98.5 % R2 na trénovací, validační i testovací množině, čímž o desítky procentních bodů překonává síť navrženou v předešlé práci. Aplikované metody vysvětlitelnosti na mikroskopické snímky se ukázaly být méně užitečné, než jsme předpokládali. Sice naznačují určitý vliv buněčných jader, nicméně detaily tohoto vztahu zůstávají i nadále nejasné.