Портал создан при поддержке Федерального агентства по печати и массовым коммуникациям.

Итоги 24-й конференции по компьютерной лингвистике «Диалог»

Завершилась научная конференция по компьютерной лингвистике «Диалог», организованная при поддержке компании ABBYY. В этом году мероприятие посетили более 250 участников – лингвистов, ученых, инженеров, разработчиков и студентов. Также в рамках «Диалога» прошли соревнования систем автоматического определения многозначности и дискуссионные круглые столы по актуальным проблемам компьютерной лингвистики.

Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации
Наука и жизнь // Иллюстрации

На мероприятии выступили известные ученые из российских и зарубежных университетов и ИТ-компаний. Так, Андрей Кибрик, директор Института языкознания РАН, рассказал о новых подходах в изучении мультимодальной коммуникации – совокупности речевого акта, языка, интонации, мимики и жестов, эмоционального и коммуникативного поведения. Важно, что результаты этих исследований могут применяться для обучения роботов и диалоговых агентов. Игорь Богуславский, профессор Мадридского технологического университета, поделился опытом разработки системы семантического анализа текстов с использованием знаний о мире. Технология была продемонстрирована на примере анализа футбольных репортажей, из которых извлекается информация о значимых моментах матчей. Александр Панченко из Гамбургского университета рассказал о методах содержательной интерпретации скрытых моделей, которые нейронные сети строят в процессе глубокого обучения.

Также интерес у участников вызвали доклады о методах определения смысловой близости текстов, автоматическом создании языковых моделей для различных языков, от русского и английского до японского и бурятского, классификации пользователей социальных сетей по интересам, и др.

Кроме того, в этом году в рамках технологического форума конференции Dialogue Evaluation впервые прошли соревнования по автоматическому снятию лексических неоднозначностей в текстах на русском языке. Эта проблема – одна из самых сложных в компьютерной лингвистике. Участники строили так называемые векторные модели представления значений, использовали для автоматического обучения моделей статьи Wikipedia, различные толковые словари. В нескольких дорожках состязания участвовали 18 команд не только из России, но и, например, из Индии. Все системы выложены в открытом доступе и могут свободно использоваться для дальнейших разработок и оценок эффективности подобных систем.

«Основная цель «Диалога», конференции с почти полувековой историей, – обмен идеями между представителями различных подходов к компьютерному анализу языка, от использования аналитических лингвистических моделей до универсальных методов анализа больших данных. Не случайно в этом году ключевыми темами конференции стали темы на стыке подходов: лингвистическая интерпретация моделей глубокого обучения и пути решения задач, для которых нет «больших» обучающих данных. Обсуждение этих вопросов позволяет максимально эффективно использовать последние достижения в области искусственного интеллекта (ИИ) применительно к задачам анализа естественного языка», – комментирует Владимир Селегей, председатель Оргкомитета «Диалога», директор по лингвистическим исследованиям компании ABBYY.

Материалы конференции опубликованы в ежегоднике «Компьютерная лингвистика и интеллектуальные технологии», который входит в международную систему цитирования Scopus. Ознакомиться с докладами участников можно на сайте конференции, в разделе «Сборник».


Обеспечим библиотеки России научными изданиями!