Errecalde, Marcelo Luis

Exploración dirigida por el objetivo en aprendizaje por refuerzp basado en modelo para ambientes no estacionarios

DIF-M3778