• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Equations (ИСПОЛЬЗОВАНИЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ДЛЯ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ)

Руководитель проекта: Сергей Кольцов

Участники проекта: Антон Сурков

В данной работе исследуется возможность применимости больших языковых моделей для целей получения аналитических решений дифференциальных уравнений. В рамках такого подхода дифференциальные уравнения и их решения рассматриваются как символьные последовательности. Соответственно, предсказание таких последовательностей может быть сведено к проблеме применения моделей seq2seq. Представление дифференциальных уравнений и их решений в виде набора символов будет реализовано с помощью ряда Python библиотек, которые позволяют трансформировать формулы в текстовое представление в формате Latex.

Разработка моделей seq2seq для дифференциальных уравнений состоит из двух этапов. На первом этапе рассматриваются рекуррентные модели RNN, LSTM, GRU, которые выступают в качестве базовых моделей. На втором этапе используются большие языковые модели (на базе моделей Transformers) такие как Bert, XLNet, T5, которые дообучаются на полученных символьных представлениях уравнений.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.