Glosario Esencial de Conceptos en Aprendizaje por Refuerzo y Redes Neuronales
Enviado por Chuletator online y clasificado en Informática y Telecomunicaciones
Escrito el en
español con un tamaño de 9,35 KB
Conceptos Fundamentales del Aprendizaje por Refuerzo
Estado (s)
Es la representación de la situación actual del agente dentro del entorno. En entornos completamente observables, este estado contiene toda la información relevante que el agente necesita para tomar decisiones.
Acción (a)
Es la decisión que el agente puede tomar desde un estado dado. Las acciones pueden ser discretas (selección entre opciones finitas) o continuas (valores numéricos dentro de un rango).
Política (pi)
Es la estrategia que sigue el agente para seleccionar acciones. Puede ser determinista si siempre devuelve una acción concreta para un estado dado, o estocástica si devuelve una probabilidad para cada posible acción en ese estado.
Función de valor V(s)
Indica cuánto
catalán con un tamaño de 1,11 MB