marynochka: (Default)
[personal profile] marynochka
Прикольна стаття про те, як нейромережа розвинула у собі таку якість, як цікавість, і навчилася грати у Маріо

---
Нейросеть самостоятельно научилась играть в Супер Марио при помощи своего любопытства. Как же моделируется любопытство? Это похоже на обучение с подкреплением, только наоборот. При обучении с подкреплением система получает плюшки за правильные действия, и по попе за неправильные. А тут наоборот — чем хуже система предсказывает результат своего действия, тем чаще старается его совершать. И это внутреннее подкрепление, а не внешнее — система сама себе начисляет плюшки.
---

Нежива залізяка додумалася до того, що робити помилки - це корисно для розумової діяльності. А ми продовжуємо карати дітей за помилки у школі.

Оригінал на Хабрі (плюс ще дві статті).

Profile

marynochka: (Default)
marynochka

August 2025

S M T W T F S
     12
3456789
10111213141516
17181920212223
242526272829 30
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 6th, 2026 07:29 pm
Powered by Dreamwidth Studios