(no subject)
Dec. 11th, 2017 12:50 pmПрикольна стаття про те, як нейромережа розвинула у собі таку якість, як цікавість, і навчилася грати у Маріо
---
Нейросеть самостоятельно научилась играть в Супер Марио при помощи своего любопытства. Как же моделируется любопытство? Это похоже на обучение с подкреплением, только наоборот. При обучении с подкреплением система получает плюшки за правильные действия, и по попе за неправильные. А тут наоборот — чем хуже система предсказывает результат своего действия, тем чаще старается его совершать. И это внутреннее подкрепление, а не внешнее — система сама себе начисляет плюшки.
---
Нежива залізяка додумалася до того, що робити помилки - це корисно для розумової діяльності. А ми продовжуємо карати дітей за помилки у школі.
Оригінал на Хабрі (плюс ще дві статті).
---
Нейросеть самостоятельно научилась играть в Супер Марио при помощи своего любопытства. Как же моделируется любопытство? Это похоже на обучение с подкреплением, только наоборот. При обучении с подкреплением система получает плюшки за правильные действия, и по попе за неправильные. А тут наоборот — чем хуже система предсказывает результат своего действия, тем чаще старается его совершать. И это внутреннее подкрепление, а не внешнее — система сама себе начисляет плюшки.
---
Нежива залізяка додумалася до того, що робити помилки - це корисно для розумової діяльності. А ми продовжуємо карати дітей за помилки у школі.
Оригінал на Хабрі (плюс ще дві статті).