L'apprendimento per rinforzo è una tecnica che consiste nell'insegnare un determinato comportamento attraverso un sistema di ricompense. Una mossa desiderabile, virtuosa, porta a un premio; una mossa sbagliata, non congrua all'obiettivo, a una punizione.
Questa tecnica è comunemente usata nel
machine learning, e ora un team di Alphabet (il nome dato ora al gruppo aziendale di Google) l'ha sfruttata per insegnare a un'intelligenza artificiale della DeepMind a camminare - anzi, correre - in un percorso di parkour. I risultati del test e i buffi video dimostrativi
sono stati pubblicati lo scorso luglio (vedi video in apertura), ma nelle ultime ore sono tornati popolari su Twitter.
Nessun commento:
Posta un commento