marynochka

Прикольна стаття про те, як нейромережа розвинула у собі таку якість, як цікавість, і навчилася грати у Маріо

---
Нейросеть самостоятельно научилась играть в Супер Марио при помощи своего любопытства. Как же моделируется любопытство? Это похоже на обучение с подкреплением, только наоборот. При обучении с подкреплением система получает плюшки за правильные действия, и по попе за неправильные. А тут наоборот — чем хуже система предсказывает результат своего действия, тем чаще старается его совершать. И это внутреннее подкрепление, а не внешнее — система сама себе начисляет плюшки.
---

Нежива залізяка додумалася до того, що робити помилки - це корисно для розумової діяльності. А ми продовжуємо карати дітей за помилки у школі.

Оригінал на Хабрі (плюс ще дві статті).

S	M	T	W	T	F	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

(no subject)

(no subject)

Profile

August 2025

Most Popular Tags

Style Credit

Expand Cut Tags