• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Equations (ИСПОЛЬЗОВАНИЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ДЛЯ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ)

Руководитель проекта: Сергей Кольцов

Участники проекта: Антон Сурков, Вера Игнатенко, Владимир Захаров

В данной работе исследуется возможность применимости больших языковых моделей для целей получения аналитических решений дифференциальных уравнений. В рамках такого подхода дифференциальные уравнения и их решения рассматриваются как символьные последовательности. Соответственно, предсказание таких последовательностей может быть сведено к проблеме применения моделей seq2seq. Представление дифференциальных уравнений и их решений в виде набора символов будет реализовано с помощью ряда Python библиотек, которые позволяют трансформировать формулы в текстовое представление в формате Latex.

Разработка моделей seq2seq для дифференциальных уравнений состоит из двух этапов. На первом этапе рассматриваются рекуррентные модели RNN, LSTM, GRU, которые выступают в качестве базовых моделей. На втором этапе используются большие языковые модели (на базе моделей Transformers) такие как Bert, XLNet, T5, которые дообучаются на полученных символьных представлениях уравнений.

Публикации по проекту:
Vladimir Zakharov, Anton Surkov, Sergei Koltcov AGDES: a Python package and an approach to generating synthetic data for differential equation solving with LLMs // Procedia Computer Science, 2025, Volume 258, Pages 1169-1178, ISSN 1877-0509 DOI 

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.