Promotie UvA: Gebruik van Reinforcement Learning in systemen

Universiteit van Amsterdam

UvA Agenda

Titel Continuous State Space Q-Learning for Control of Nonlinear Systems

Datum woensdag 21-02-2001
Tijd 12:00 uur

Promovendus S.H.G. ten Hagen

Promotor prof.dr. ir. F.C.A. Groen.

Het gedrag van systemen kan door een zogeheten regelaar veranderd worden. Een systeem kan door de acties van de regelaar bijvoorbeeld zo economisch mogelijk of zo veilig mogelijk functioneren. De promovendus onderzocht systemen waarbij gebruik gemaakt wordt van Reinforcement Learning (RL). Bij reinforcement ontvangt de regelaar een bepaalde waarde voor elke toestand (reinforcement) en neemt daarop actie. Het probleem bij een dergelijk leerproces is dat het systeem instabiel kan worden. Dit komt omdat er voor leergedrag een gerandomiseerd proces, 'exploratie' genaamd, moet worden toegevoegd aan het proces. Een bijkomend probleem is dat het gebruik van RL erg tijdrovend is. Om met deze problemen om te gaan introduceert de promovendus een aanpak met een speciale vorm van RL, gebaseerd op het modelleren van de kostenfunctie. Een optimale feedback vraagt om de nodige exploratie. De kwaliteit van de feedback is hierbij een functie van de hoeveelheid exploratie en de hoeveelheid ruis. Voor verbetering van de kwaliteit is het vereist dat er meer wordt geëxploreerd dan er ruis is in het systeem. RL kan praktisch worden toegepast.

Locatie

Aula van de UvA, Singel 411 (hoek Spui) te Amsterdam. De parkeermogelijkheden in de naaste omgeving zijn zeer beperkt. Vanaf het Centraal Station is de Aula te bereiken met tramlijnen 1, 2 en 5, halte Spui.

Toegang

Vrij

Bron: UvA Agenda

woensdag 21 februari 2001