Портал функционирует при финансовой поддержке Федерального агентства по печати и массовым коммуникациям.

Студенты Школы анализа данных Яндекса представили решение, которое может помочь врачам в ранней диагностике рака легких

Проект Романа Гуревич, Таль Хелец и Ильи Кравец был признан лучшим на конкурсе работ междисциплинарной школы по Машинному обучению и DataScience в Тоскане.

Трое студентов одногодичной программы Яндекса в Израиле –Y-Data, Роман Гуревич, Таль Хелец и Илья Кравец представили проект по ранней диагностике рака легких на школе по Машинному обучению и анализу данных (Advanced Course on Data Science Machine Learning) в Тоскане. Решение команды Y-Data на основе нейросетей и компьютерного зрения заняло первое место на конкурсе работ участников школы.

Слева направо: Роман Гуревич, Илья Кравец и Таль Хелец. Фото: Яндекс.

В течение пяти дней участники школы слушали лекции и работали вместе с такими членами научного сообщества как Руслан Салахутдинов (CarnegieMellon, Apple), ДжошТенебаум и Филип Изола (MIT), Нафтали Тишби (HUJI), а также с лидерами индустрии, например, представителями компании GoogleDeepMind.

Команда презентовала законченное диагностического решение (пайплайн). На основе базы данных с диагнозами пациентов и полученными во время компьютерной томографии снимками оно определяет потенциальные злокачественные опухоли и подсказывает врачам похожие случаи с историями болезни пациентов. Тем самым возрастает скорость и качество постановки диагнозов. 

Рак лёгких – одно из самых распространённых онкологических заболеваний со смертельным исходом. Выживаемость пациентов напрямую зависит от того, насколько рано было выявлена злокачественная опухоль. Однако современная диагностика по-прежнему осуществляется вручную по рентгеновским снимкам и данным томографии, которые просматривают врачи. 

Решение Y-Data основано на данных, полученных во время соревнования по выявлению опухолей LUNA-16. Студенты использовали данные последних публикаций и существенно улучшили архитектуру отвечающих за диагностику нейросетей 2017 года. Одним из интересных решений команды был перевод снимков в эмбеддинги, что повысило точность диагностирования.  

Команда Y-Data провела оценку полученного решения на наборе данныхLIDC-IDRI и пришла к выводу, что система выдает результат, сравнимый с мнением врача-рентгенолога, и поэтому может использоваться для получения «второго мнения» в спорных ситуациях. 

Y-Data - это одногодичная интенсивная программа по анализу данных в Тель-Авиве от создателей Школы анализа данных (ШАД) Яндекса с упором на практику и работу над проектами из индустрии. 

Выпускница Y-Data, магистр математики Таль Хелец так рассказывает о своём опыте учёбы в израильском ШАДе: «Я всегда интересовалась математикой, но мне был необходим практический опыт по работе с данными и решению реальных задач из индустрии. На Y-Data я приобрела теоретические знания в области компьютерных наук и анализа данных, а также завершила два проекта из индустрии».

 Видеопрезентацию проекта можно посмотреть по ссылке.