🧐 Что: методику, которую используют для обучения собак командам «стоять» и «сидеть», применяют и к роботам, чтобы научить их новым трюкам — например складывать пирамидки из кубиков. Метод позитивного подкрепления позволил роботу за несколько дней выучить то, на что раньше уходил месяц.
🤔 А как: разработали систему вознаграждения, которая работает для робота так же, как для собаки: правильное действие даёт баллы, а неправильное — ничего.
👨🔬 Кто: инженеры Университета Джонса Хопкинса.
Источник: Tech Xplore