Проблема в обучении нейросетей — это проверка результата. Сейчас это делают с помощью генеративно-состязательного метода — одна нейросеть решает задачу, а вторая оценивает результаты, пытаясь найти правильный среди ложных.
В Microsoft придумали новый способ подкрепления — если нейросеть справляется с задачей, программист, отвечающий за ее работу, улыбается. Для теста машину попросили выполнить классическое упражнение — найти выход из запутанного лабиринта. Когда человек улыбался, нейросеть понимала, что двигается в правильном направлении.
В компании не исключают, что тренировка улыбкой перекочует в умный дом. И мы будем управлять помощниками с помощью эмоций, а они будут нас понимать.
Источник: VentureBeat