Новая платформа Национального корпуса русского языка

06.08.2020

В Минобрнауки России подведены итоги конкурса, победители которого получат гранты на реализацию крупных научных проектов. Среди победителей – заявка с участием ВШЭ, предусматривающая разработку компьютерно-лингвистической платформы нового поколения для цифровой документации русского языка. В коллектив проекта вошла Мария Алекснадровна Холодилова — старший преподаватель департамента филологии Питерской Вышки.

На конкурс было подано 367 заявок, 41 из них стала победителями. Гранты предоставляются научным организациям и вузам для господдержки крупных научных или научно-технических проектов по приоритетным направлениям, определяемым президиумом РАН. Предельный размер гранта на финансовый год — 100 млн рублей. Продолжительность проектов — три года с возможным продлением на два года. Сведения о победителях конкурса и о размерах предоставляемых грантов размещены здесь.

В числе победителей конкурса – проект «Компьютерно-лингвистическая платформа нового поколения для цифровой документации русского языка: инфраструктура, ресурсы, научные исследования», представленный консорциумом вузов и научных организаций. Объем финансирования на три года составит 236 млн рублей. Основной исполнитель – Институт проблем передачи информации РАН, в состав консорциума вошли Институт русского языка им. В. В. Виноградова РАН, Институт лингвистических исследований РАН, Воронежский государственный университет и Высшая школа экономики, которую представляли ученые из Школы лингвистики.

Грант выделен на комплексную работу, связанную с обновлением платформы Национального корпуса русского языка — информационно-справочной системы, основанной на собрании русских текстов разных типов и жанров в электронной форме. Корпус предназначен, прежде всего, для обеспечения научных исследований лексики и грамматики языка и уникален тем, что содержит особую дополнительную информацию о свойствах этих текстов — так называемую разметку. В 2004 году, когда Национальный корпус создавался Институтом русского языка и компанией Яндекс, разметка была беспрецедентной даже по сравнению с зарубежными аналогами и с тех пор сохранила свою уникальность.

Более чем за 15 лет существования Национального корпуса его объем значительно вырос, появились новые подкорпусы, новые функции. Теперь для его дальнейшего развития и обеспечения эффективной работы необходимы новые технологические решения («Корпус 2.0»). Примечательно, что в разработке этих решений примут участие ученые из разных отраслей знания (компьютерные науки, лингвистика, филология, история и др.) и из разных регионов – Москвы, Воронежской области, Санкт-Петербурга. В северной столице расположен Институт лингвистических исследований РАН, к проекту также подключатся коллеги из питерского кампуса Вышки. Правильно выстроенная кооперация стала одним из факторов успеха на конкурсе.

Предполагается, что костяк коллектива, участвующего в работе по гранту от ВШЭ, составят профессора Екатерина Рахилина, Валентина Апресян, Ольга Ляшевская, Нина Добрушина, Наталия Слюсарь, Михаил Даниэль, доценты Анастасия Бонч-Осмоловская, Дмитрий Сичинава, Александр Летучий, старший преподаватель Мария Холодилова (Санкт-Петербург). Предстоит, в частности, подготовка статей для научных журналов и защита диссертаций по заявленной тематике.

Share:

Read next

Subscribe to StudyInSPb
Newsletter