Questo articolo ha due obiettivi. Il primo è discutere i punti di forza e di debolezza dei modelli di apprendimento per rinforzo (Sutton e Barto, 1998), ed in particolare del modello attore-critico, per lo studio del comportamento animale. Il secondo è mostrare tali punti di forza "in azione" riassumendo i principali risultati ottenuti con una specifica applicazione del modello attore-critico alla modellizzazione di alcuni comportamenti di navigazione spaziale osservati nei pulcini (per maggiori dettagli si veda Mannella e Baldassarre, in stampa). Il primo obiettivo è particolarmente importante in quanto, nonostante le notevoli potenzialità dei modelli di apprendimento per rinforzo, la comunità di vita artificiale tende ad usare poco questi modelli, ad esempio rispetto ai modelli basati sugli algoritmi genetici, l'apprendimento supervisionato e l'apprendimento non supervisionato (si veda ad esempio il tipo di modelli utilizzati nell'ultimo Workshop Italiano di Vita Artificiale, Baldassarre et al., 2005, e nell'ultima conferenza internazionale di Artificial Life, Pollak et al., 2004). Dapprima l'articolo presenterà gli esperimenti sui pulcini reali riprodotti e studiati con il modello qui presentato e le interpretazioni teoriche dei risultati fornite dagli autori degli stessi (sez. 2). Poi illustrerà il modello (sez. 3) ed i risultati ottenuti con esso (sez. 4). In seguito elencherà i punti di forza dei modelli di apprendimento per rinforzo, tra cui la notevole plausibilità biologica della versione attore-critico (sez. 5). Infine presenterà un'analisi delle debolezze di tali modelli e delle ragioni tecniche e storiche della loro scarsa diffusione nella comunità di vita artificiale (sez. 6).

Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini

Mannella Francesco;Baldassarre Gianluca
2006

Abstract

Questo articolo ha due obiettivi. Il primo è discutere i punti di forza e di debolezza dei modelli di apprendimento per rinforzo (Sutton e Barto, 1998), ed in particolare del modello attore-critico, per lo studio del comportamento animale. Il secondo è mostrare tali punti di forza "in azione" riassumendo i principali risultati ottenuti con una specifica applicazione del modello attore-critico alla modellizzazione di alcuni comportamenti di navigazione spaziale osservati nei pulcini (per maggiori dettagli si veda Mannella e Baldassarre, in stampa). Il primo obiettivo è particolarmente importante in quanto, nonostante le notevoli potenzialità dei modelli di apprendimento per rinforzo, la comunità di vita artificiale tende ad usare poco questi modelli, ad esempio rispetto ai modelli basati sugli algoritmi genetici, l'apprendimento supervisionato e l'apprendimento non supervisionato (si veda ad esempio il tipo di modelli utilizzati nell'ultimo Workshop Italiano di Vita Artificiale, Baldassarre et al., 2005, e nell'ultima conferenza internazionale di Artificial Life, Pollak et al., 2004). Dapprima l'articolo presenterà gli esperimenti sui pulcini reali riprodotti e studiati con il modello qui presentato e le interpretazioni teoriche dei risultati fornite dagli autori degli stessi (sez. 2). Poi illustrerà il modello (sez. 3) ed i risultati ottenuti con esso (sez. 4). In seguito elencherà i punti di forza dei modelli di apprendimento per rinforzo, tra cui la notevole plausibilità biologica della versione attore-critico (sez. 5). Infine presenterà un'analisi delle debolezze di tali modelli e delle ragioni tecniche e storiche della loro scarsa diffusione nella comunità di vita artificiale (sez. 6).
2006
Istituto di Scienze e Tecnologie della Cognizione - ISTC
Apprendimento per rinforzo
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/311333
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact