9 апреля в институте иностранных языков РГПУ им. А. И. Герцена прошел межвузовский мастер-класс «От токена к сонету: учим RNN и LSTM модели писать стихи с нуля». Участниками события стали студенты-лингвисты Герценовского университета и их коллеги из Белорусского государственного университета иностранных языков (БГУИЯ, Республика Беларусь).
На занятии будущие лингвисты и специалисты в области цифровых технологий погрузились в процесс создания нейросети, способной генерировать художественные тексты. В качестве «учебного материала» выступили сонеты Уильяма Шекспира — золотой фонд английской поэзии. Участники шаг за шагом разобрали полный пайплайн построения генеративной модели: от первичной предобработки текста (токенизации и нормализации данных) до финального обучения двух типов рекуррентных нейросетей — классической RNN и более совершенной LSTM. Особое внимание на мастер-классе уделили практическим различиям между архитектурами RNN и LSTM, а также влиянию параметра «температура» на креативность и связность генерируемых текстов. Студенты на практике убедились, как изменение этого значения превращает модель из консервативного переписчика в подлинного творца. Кульминацией занятия стал запуск обученной модели, которая на глазах у аудитории сочинила несколько строк в духе шекспировского сонета. Полученную модель студенты смогут использовать как основу для собственных исследовательских проектов в области лингвистики, а также легко адаптировать представленный пайплайн под любые текстовые корпуса — будь то поэзия Серебряного века или современная проза.
Мастер-класс стал ярким примером успешного междисциплинарного и международного сотрудничества, объединив классическое филологическое образование с передовыми методами машинного обучения. Мероприятие подготовили студенты второго курса магистерской программы «Цифровая лингвистика», научные волонтеры внутреннего гранта РГПУ им. А. И. Герцена (Проект № 75-ВГ) Кристина Проворова и Глеб Полтавец, руководитель доцент кафедры перевода Ольга Юрьевна Кустова.