Errecalde, Marcelo Luis Exploración dirigida por el objetivo en aprendizaje por refuerzp basado en modelo para ambientes no estacionarios Standard No.: DIF-M3778