Наслов предавања:  Учење појачавањем

Предавач: Вукашин Станојевић

Апстракт: Учење појачавањем (енгл. Реинфорцемент леарнинг) један је од главних приступа у машинском учењу, а своје примене налази најчешће у роботици, аутономној вожњи, видео играма. Овај тип машинског учења настоји да постигне оно што се у психологији назива инструменталним учењем, илити, како обучити агента да извршава одређени задатак на основу случајних покушаја и грешака, при чему сваки покушај као последицу има одређену казну или награду. Обучени агент, попут добро дресираног љубимца, понашаће се на начин који му доноси највећу награду избегавајући акције које доводе до казне. На предавању ћете научити основне појмове и теорију иза овог типа машинског учења, као и основни алгоритам „учења Q функције“ који ћемо применити на обучавање агената за самостално делање у простим видео играма са малим бројем потеза и стања.