5. Otro autobús mágico
Que hacer
Desarrolla el problema de otro autobús mágico que nos los pirateamos de otro lugar (luego pongo las referencias, así como la solución).
En este ejercicio tendras que plantear y entender un problema de MDPs, plantear las ecuaciones para el calculo de la función de valor-estado para resolver el problema por programación dinámica y demostrar que tienes las nociones para aplicar correctamente el algoritmo de Q-learning.
Espero se diviertan.