Хакатон по машинному переводу DeepHack.Babel

18 декабря стартует отборочный тур для участия в хакатоне по машинному переводу DeepHack.Babel. С 29 января по 4 февраля пятидесяти участникам, прошедшим отбор, представится возможность применить свои знания для усовершенствования машинного перевода. Отборочный этап проходит до 8 января, регистрация на сайте хакатона.

Тема хакатона

DeepHack.Babel – уже пятый хакатон серии DeepHack, который организует Лаборатория нейронных систем и глубокого обучения МФТИ. В этом году темой хакатона выбран машинный перевод. Акцент будет сделан на нейронный машинный перевод, набирающий популярность в исследовательском сообществе и уже использующийся в коммерческих продуктах. В отличие от традиционного статистического метода, в его основе лежит использование искусственных нейронных сетей, что позволяет достичь более высокого качества перевода. Нейронный машинный перевод уже используют сервисы перевода таких компаний, как Google, Яндекс и Майкрософт.

 

«Цель хакатона, который пройдет в МФТИ, — разработать методы обучения машинного переводчика без обучающих примеров. Дело в том, что система машинного перевода, как и человек, учится переводить, анализируя примеры правильных переводов с одного языка на другой. Участники же попытаются научить программу переводить, не давая ей таких примеров. Знание о том, как переводятся фразы с одного на другой язык, программа должна получить из двух не связанных между собой текстов. Эта технология позволит расширить возможности машинного перевода, автоматизировать перевод с редких языков, для которых сложно достать параллельные примеры правильных переводов. Кроме того, решение этой задачи может улучшить современные модели машинного перевода и для пар языков с большим объемом данных, используя коллекции моноязычных текстов, которые доступны практически для любого языка».

рассказывает заведующий лабораторией Михаил Бурцев.

Открытые лекции

По традиции DeepHack в рамках хакатона будет работать научная школа. Лекции об исследованиях в области машинного перевода прочитают ведущие мировые специалисты из Booking.com, Unbabel, Yandex, Apple, университета Carnegie Mellon (США), университета Лидса, университета Шеффилда (Великобритания), университета Гумбольдта (Германия), Городского Университета Дублина (Ирландия) и других крупных исследовательских центров. Лекции открыты для свободного посещения после регистрации. Также, будет организована трансляция на YouTube канале DeepHack.

“DeepHack – это, наверное, единственная хакатон-площадка в России такого уровня и с такой историей. У нас была возможность на 7 дней полностью погрузиться в решение задач из самых передовых областей Data Science и AI. Было безумно интересно, сложно и напряженно до последней минуты. Особенно приятно, что мы выиграли, да еще прокачались в области NLP и познакомились со многими интересными людьми. Если получится участвовать в следующий раз, мы обязательно приедем!”

участник предыдущего хакатона Виктор Портнов, руководитель Data Science отдела корпоративного блока Сбербанка.

Организаторы

Хакатон организован лабораторией нейронных систем и глубокого обучения МФТИ в рамках работы над проектом iPavlov. В течение двух с половиной лет исследователи лаборатории в сотрудничестве с крупнейшими научными центрами по машинному обучению будут работать над созданием технологий разговорного искусственного интеллекта. Результаты будут опубликованы в виде библиотеки с открытой лицензией, чтобы любой, кто занимается разработкой диалоговых систем, мог использовать их в своих исследованиях и прикладных решениях.

Генеральными партнерами хакатона выступают Фонд поддержки проектов Национальной технологической инициативы и Сбербанк. Хакатон также поддерживают сообщество Open Data Science, Отраслевой союз НейроНет и Биофармкластер “Северный”.

Поделиться