http://robburke.net/mle/greatExpectations/GreatExpectations.pdfsuper articleexcellent compte rendu d'un agent autonome.boucle perception-actionsystème motivationnel, drive, drive multiplicatorprésentation actionTuple : contexte, action, durée, récompense (intrinsèque + perçue)apprentissage => nv tuple en modifiant contexte d'un tuple existantapprentissage sur la récompense insuffisant car impossible de savoir pourquoi c'est bien=> prévision : predictor qui relit des conditions (evt) à un résultat (evt).Surprise : evt non prédit => tentative nouveau predictor (dernier evt).Nouveau drive : curiosité qui pousse à explorer plutôt qu'exploiter => nouvelles actions, intéraction avec de nouveaux objets, vérification predictor avec faible chance de réussite...Un actionTuple est en fait un predictor (la récompense devient une prédiction de récompense)cpt social : predictor sur les actions des autres...
CITATION STYLE
Burke, R. (2004). Great Expectations: Prediction in Entertainment Applications (pp. 245–269). https://doi.org/10.1007/978-3-662-08373-4_11
Mendeley helps you to discover research relevant for your work.