Safe and Reliable Reinforcement Learning Through Constraints and Learnt Models
Školitel: Petr Novotný
Instituce: Masaryk University, Faculty of Informatics
Obor: Fundamentals of Computer Science
O projektu
Tento projekt se zaměřuje na Reinforcement Learning (RL), metodu pro trénink autonomních agentů, jako jsou auta a roboti. Přestože RL našlo úspěšné uplatnění v oblastech, jako je robotika a finance, spolehlivost trénovaných agentů zůstává klíčovým problémem. Projekt má tři hlavní cíle: zdokonalit způsoby, jakými lze problémy modelovat jako úlohy RL, formálně ověřovat dlouhodobé „záměry“ agentů a vyvinout nové monitorovací techniky pro odhalování odchylek od těchto záměrů za běhu programu.
Proč dělám vědu?
Vždycky jsem rád řešil matematické problémy a učil se novým věcem a věda nabízí nespočet příležitostí k obojímu. Na rozdíl od komerční sféry, kde je výběr problému často podmíněn potenciálem zisku, věda poskytuje svobodu zkoumat problémy jen ze zvědavosti.
Proč mám rád/a Brno
Osobně si myslím, že Brno má spoustu skvělých komunit, ať už jde o sporty, hudební sešlosti, deskové hry, vědu nebo kulturu. Je to totiž dost velké město na to, aby se v něm děly zajímavé věci, ale zároveň dost malé na to, aby se v něm člověk neztratil a lidé se navzájem znali.