Войти

«Машинное обучение и анализ данных»: кого готовит программа и что на ней изучают?

31.03.2022

В 2020 году магистратура «Промышленное программирование» изменила свое название на «Машинное обучение и анализ данных». Редакция рассказывает, что будут изучать студенты программы и чем перспективно машинное обучение.

В 2021 году программа «Машинное обучение и анализ данных» ведет набор студентов на 15 бюджетных и 15 платных мест, а также на одно платное место для иностранцев. Подробнее о программе можно узнать на специальной странице. Информация о стоимости обучения находится в разделе для абитуриентов магистратуры.

В чем особенности программы программ «Машинное обучение и анализ данных»?
На программа «Машинное обучение и анализ данных» направлена на абитуриентов, у которых нет глубоких знаний в области математики и информатики. Возможно, они закончили бакалавриат не по направлению компьютерных наук или не получили достаточно сильной подготовки по своей специальности в другом университете. Обновленная программа предлагает им за два года освоить область машинного обучения и анализа данных.

Что должен знать и уметь абитуриент?

Поступить в магистратуру с нулевыми знаниями программирования и высшей математики не получится. «Машинное обучение и анализ данных» предполагает, что у абитуриента есть минимальный уровень подготовки. Руководство программы рекомендует пройти несколько онлайн-курсов перед поступлением чтобы изучить или повторить, например, основы теории вероятности и языка Python.
Однако знания — не единственный критерий отбора абитуриентов.

Алексей Александрович Шпильман, академический руководитель программы «Машинное обучение и анализ данных»:

«За два года студенты программы проходят интенсивный курс в области машинного обучения и анализа данных. При этом магистратура не требует от абитуриента высокого уровня подготовки. Нужно лишь базовое понимание математики и информатики.
Нам (руководству программы) важно, чтобы поступающий был замотивирован и понимал, с чем ему предстоит столкнуться на программе. У нас большое количество пар, и они, в основном, дневные. Магистранту придется интенсивно работать и многое изучать самостоятельно. На собеседовании мы хотим понять, готов ли он к этому. Очень часто мы сталкиваемся с тем, что студенты оказываются не готовы к нагрузке. Больше всего удивляет их количество домашних работ и проектов, которое у нас в разы больше чем то, к чему они привыкли в бакалавриате».

Чем перспективны направления машинного обучения и анализа данных?

Искусственный интеллект — одна из наиболее сильно развивающихся областей науки и техники. А машинное обучение и анализ данных — это как раз практическая часть искусственного интеллекта. То, что работает. Во многих компаниях искусственный интеллект уже применяется и будет применяться еще чаще, и специалистов с каждым годом нужно все больше.
Во многих областях человеческой деятельности, существует непрерывный поток информации. Это большие объемы данных, которые человек не может обработать физически. С этим справляются машины. Они помогают в логистике, продажах, работе с социальными сетями, в биоинформатике и так далее. Компаниям из всех секторов экономики нужны специалисты, которые умеют обращаться с машинами, обрабатывать и анализировать данные с их помощью. Они также востребованы за рубежом.

Как происходит обучение на программе?

На первом году обучения во время осеннего модуля магистранты проходят курсы по алгебре, теории вероятности и математической статистике. Это сделано для того, чтобы повторить материал, который студенты учили в бакалавриате или осваивали самостоятельно. Также мы улучшаем их базовые знания языка Python и учим создавать и грамотно вести IT-проект. Затем студенты проходят базовые курсы по машинному обучению, глубокому обучению, анализу естественного языка и анализу изображений.
На втором году программы начинаются специализированные курсы. Например, студенты учатся работать с алгоритмами и программным обеспечением для обучения беспилотных автомобилей. Они также изучают алгоритмы обучения без учителя, генеративные модели, нейробайесовские методы. В результате за 2 года магистранты постепенно осваивают область машинного обучения и анализа данных — от азов до последних достижений в науке и индустрии.

Как устроена научная и проектная деятельность в магистратуре?

На программе студенты занимаются обязательной проектной деятельностью. Она начинается в весеннем семестре первого года обучения. Проекты предлагают партнерские компании и исследовательские лаборатории, а также преподаватели НИУ ВШЭ — Санкт-Петербург.
Некоторые компании и лаборатории делают тестовые задания для желающих. Магистранту нужно выполнить их, чтобы попасть в команду. Студент может выбрать несколько проектов, пройти все входные тесты, а затем решить, чем именно хочет заниматься. По итогам семестра, нужно презентовать результаты своей работы.
Часто на проектах студенты решают прикладные задачи, с которыми на программу обращаются компании. Например, компания JetBrains приглашала студентов на проект по работе с плагином для улучшения поддержки естественного языка в среде разработки программного обеспечения IntelliJ IDEA. Этот плагин основан на методах машинного обучения и информационного поиска.
Студенты магистратуры защищают свои первые исследовательские или прикладные проекты в конце первого года обучения. Затем на втором году обучения они выполняют еще два проекта: осенью и весной. Это могут быть два разных проекта или один, который студент развивает после осенней защиты и представляет как часть магистерской диссертации. Весной на втором курсе почти все занятия на программе заканчиваются и магистранты могут сосредоточиться на своем научном исследовании.
Летом между первым и вторым курсом студенты могут съездить в летние школы или пройти стажировки в партнерских компаниях программы.

В каких лабораториях и центрах можно работать над проектами?

Проектной деятельностью можно заниматься и в Центре анализа данных и машинного обучения НИУ ВШЭ — Санкт-Петербург. Питерская Вышка создала этот центр в сотрудничестве с исследовательским подразделением JetBrains. Заведует центром Алексей Александрович Шпильман — преподаватель в Питерской Вышке и руководитель лаборатории искусственного интеллекта в JetBrains Research и программ развития ИИ в компании «Газпром нефть». Студенты Питерской Вышки могут проходить стажировки и выполнять проекты в этих лабораториях.
В январе 2021 года магистранты и сотрудники программы заняли третье место в соревновании NeurIPS 2020: Black-Box Optimization Challenge. А в 2019 году команда центра выиграла соревнования на Международной конференции робототехники ICRA 2019 в Монреале. Почитать подробнее о соревнованиях и работе команды можно в интервью со студентом программы «Машинное обучение и анализ данных» Никитой Сазановичем.

Чем могут заниматься выпускники программы?

Специалист может заниматься машинным обучением по заказу. К примеру, медицинская компания просит обучить компьютер, чтобы он определял по рентгеновским снимкам заболевания на ранних стадиях. Машина сделает это точнее, чем человек. В случае с такой задачей, специалист не разрабатывает новые методы обучения, а использует уже существующие. Ему нужно понять, какие из них лучше использовать для решения задачи и адаптировать под заказчика. Подобные задачи могут поступать из разных областей. Специалист должен знать методы оптимизации, исследования операций, математическую статистику и другие направления прикладной математики, которые составляют базу машинного обучения.
Второй вариант деятельности более научный — это работа не над прикладными задачами, а с самими методами машинного обучения. Специалист может изучать методы, заниматься улучшением или созданием алгоритмов обучения. В этом случае, ему нужны очень глубокие знания математики.

Какие вступительные испытания ждут абитуриентов?

Алексей Александрович Шпильман, академический руководитель программы «Машинное обучение и анализ данных»:
«Вступительные экзамены состоят из двух частей. Первая — письменный экзамен. На нем студенту нужно решить некоторые несложные задачки по математике — теории вероятности, линейной алгебре и так далее. В экзамене также есть задания на проверку базовых навыков программирования.
Вторая часть — собеседование. На собеседовании мы пытаемся понять, насколько человек замотивирован учиться, какие у него были проекты, чем он хочет заниматься на программе. Это возможность «вытащить» из абитуриента все его лучшие стороны и разобраться, в чем он силен. Абитуриент также может задать свои вопросы о программе. Мы отвечаем и рассказываем, как устроено обучение.
Человек должен понимать, что программа очень трудозатратная, у него вряд ли получится совмещать учебу и работу. Этот момент мы стараемся компенсировать стипендиями. Абитуриента ждут два трудных, но интересных года. По окончании программы он сможет претендовать на высокие зарплаты от 150 тыс. рублей».

Share:

Read next

Subscribe to StudyInSPb
Newsletter