Martin Kurečka

Safe and Reliable Reinforcement Learning Through Constraints and Learnt Models

Školitel: Petr Novotný

Instituce: Masaryk University, Faculty of Informatics

Obor: Fundamentals of Computer Science

O projektu

Tento projekt se zaměřuje na Reinforcement Learning (RL), metodu pro trénink autonomních agentů, jako jsou auta a roboti. Přestože RL našlo úspěšné uplatnění v oblastech, jako je robotika a finance, spolehlivost trénovaných agentů zůstává klíčovým problémem. Projekt má tři hlavní cíle: zdokonalit způsoby, jakými lze problémy modelovat jako úlohy RL, formálně ověřovat dlouhodobé „záměry“ agentů a vyvinout nové monitorovací techniky pro odhalování odchylek od těchto záměrů za běhu programu.

Proč dělám vědu?

Vždycky jsem rád řešil matematické problémy a učil se novým věcem a věda nabízí nespočet příležitostí k obojímu. Na rozdíl od komerční sféry, kde je výběr problému často podmíněn potenciálem zisku, věda poskytuje svobodu zkoumat problémy jen ze zvědavosti.

Proč mám rád/a Brno

Osobně si myslím, že Brno má spoustu skvělých komunit, ať už jde o sporty, hudební sešlosti, deskové hry, vědu nebo kulturu. Je to totiž dost velké město na to, aby se v něm děly zajímavé věci, ale zároveň dost malé na to, aby se v něm člověk neztratil a lidé se navzájem znali.