El aprendizaje por refuerzo es una técnica de aprendizaje automático que busca el que un agente aprenda a realizar una tarea de forma óptima en base a los estímulos y refuerzos obtenidos al realizar una serie de acciones durante el proceso de entrenamiento. Así una aplicación inteligente puede desarrollar unas habilidades muy importantes para ganar un juego, observando en muchas jugadas del mismo lo que ocurre cuando se ejecutan determinadas acciones y las recompensas obtenidas. El objetivo de este trabajo es desarrollar una plataforma que permita plantear diferentes escenarios (juegos y problemas reales) con diferentes entornos aprendizaje y diferentes técnicas para evaluar las mismas. Para el desarrollo del trabajo se utilizará Python y los recursos disponibles sobre aprendizaje por refuerzo y otras técnicas de aprendizaje automático.
Jaime Fúster de la Fuente