Портал функционирует при финансовой поддержке Федерального агентства по печати и массовым коммуникациям.

Нейросеть и толпа

Искусственный разум видит настроение толпы

Компьютерные алгоритмы способны по фото распознать эмоции человека, и даже не одного человека, а целой группы людей. Но вот с группой людей обычно возникают проблемы: чтобы точно определить настроение толпы, на изображениях должны быть крупные планы лиц в хорошем разрешении. Но у обычной камеры на улице или в супермаркете разрешение низкое, да и расположена она обычно достаточно высоко.

Исследователи из НИУ ВШЭ описывают в International Conference on Analysis of Images, Social Networks and Texts алгоритм, который по точности распознавания – 75,5% – сопоставим с другими существующими программами. Но при этом он занимает в памяти видеосистемы всего 5 Мб и справляется с задачей всего за одну сотую секунды, и может обрабатывать видеоданные даже низкого качества. Алгоритм работает в несколько этапов. Вначале за фото берётся нейросеть MTCNN, которую традиционно используют для работы с небольшими изображениями лиц. Далее подключается нейросеть-классификатор изображений, предварительно обученная распознавать эмоции на лицах в очень маленьком разрешении – не больше аватара в социальных сетях. Итоговый результат получается на основе усреднённых данных по всем распознанным лицам.

Новая разработка можно применять в самых разных ситуациях. С ее помощью можно зафиксировать изменения настроений толпы на концерте, футбольном матче или митинге, что позволит вовремя предотвратить развитие конфликта. Интегрированный в системы видеонаблюдения супермаркета, алгоритм будет определять эмоциональную реакцию посетителей на различные промо-акции. А в связке с видеокамерой, снимающей публичное выступление, – оценивать эмоциональный отклик зрителей.

Статьи по теме