Нейросеть узнаёт растения России

Нейросетевая платформа iNaturalist распознаёт по фото более трети видов российских растений.

Бывает, что нам на глаза попадется какое-то красивое растение, и нам бывает жаль, что мы не знаем, как оно называется: спросить не у кого, а рвать его и нести домой, чтобы потом искать среди специальных ботанических фотографий, не хочется. Тут очень кстати пришлись бы нейросети, способные определять растения по фото. Собственно, международная платформа iNaturalist и есть такой проект – недавно команда iNaturalist представила очередную модель автоматического распознавания живых организмов по фотографиям с использованием нейронных сетей. Модель включает 38 тыс. видов, что в полтора раза больше, чем в прошлом году. В неё включены 2 680 видов флоры нашей страны, найденные участниками проекта МГУ «Флора России».

Любая нейросеть должна сначала обучиться на каком-то материале – в данном случае на фотографиях растений, грибов и животных. Для включения в обучающий набор данных у конкретного вида растения, гриба или животного должно быть более сотни фотонаблюдений в базе, причём половина наблюдений должна быть верифицирована вручную. Из 7407 видов, отмеченных в проекте «Флора России», 36% видов растений надёжно узнаются нейросетевыми алгоритмами. Однако дело не в том, что остальные виды не поддаются нейросети, а в том, что на эти 36% приходится 94,5% всех загруженных пользователями фотографий.

География распознавания тоже пока неравномерна. Модель охватывает свыше 99% наблюдений из регионов Средней России, 97% из Свердловской области и 93% из Алтайского края. В то же время горы и другие территории с большим биоразнообразием пока хуже знакомы искусственному интеллекту. Так, в Краснодарском крае и Крыму нейронная сеть может распознать около 83% изображений, в Горном Алтае – 76%, а в Дагестане – только 61%. В богатейшей флоре юга Приморского края, которая включает виды тропического происхождения, пока распознается лишь половина фотографий.

«Разработка алгоритмов распознавания биологических видов по фотографиям – это результат работы большой команды под руководством коллег из Силиконовой долины, – говорит ведущий научный сотрудник биологического факультета МГУ, доктор биологических наук Алексей Серегин. – Задача нашей группы заключается в постоянном мониторинге тысяч фотографий, поступающих от российских пользователей платформы, и их надёжном определении. Именно рост числа достоверных находок по редким и эндемичным видам флоры России, в том числе из труднодоступных мест, позволил столь радикально увеличить покрытие системы».

Роль непрофессиональных исследователей в сборе данных о биоразнообразии трудно переоценить: свыше 1,7 млн участников iNaturalist сделали около 73 млн наблюдений по всему миру, в том числе 1,5 млн фотографий растений России. В этой работе принимает участие около 15 тыс. российских пользователей платформы, любой пользователь может присоединиться к сбору данных о биоразнообразии России, а собираемые участниками данные находятся в открытом доступе.

И речь тут не только в том, чтобы каждый любопытствующий мог в любой момент определить какое-нибудь растение – многие университеты России уже используют платформу iNaturalist в учебном процессе, и в целом она может стать большим подспорьем в самых разных исследовательских проектах. Совершенствование нейросетевых алгоритмов поможет учёным систематизировать поток данных о биоразнообразии. Собранные материалы по растениям нашей страны лягут в основу «Атласа флоры России», который создаётся учеными Московского университета по гранту Российского научного фонда.

 

По материалам пресс-службы МГУ.


Портал журнала «Наука и жизнь» использует файлы cookie и рекомендательные технологии. Продолжая пользоваться порталом, вы соглашаетесь с хранением и использованием порталом и партнёрскими сайтами файлов cookie и рекомендательных технологий на вашем устройстве. Подробнее