Equations (ИСПОЛЬЗОВАНИЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ДЛЯ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ)
Участники проекта: Антон Сурков, Вера Игнатенко, Владимир Захаров
В данной работе исследуется возможность применимости больших языковых моделей для целей получения аналитических решений дифференциальных уравнений. В рамках такого подхода дифференциальные уравнения и их решения рассматриваются как символьные последовательности. Соответственно, предсказание таких последовательностей может быть сведено к проблеме применения моделей seq2seq. Представление дифференциальных уравнений и их решений в виде набора символов будет реализовано с помощью ряда Python библиотек, которые позволяют трансформировать формулы в текстовое представление в формате Latex.
Разработка моделей seq2seq для дифференциальных уравнений состоит из двух этапов. На первом этапе рассматриваются рекуррентные модели RNN, LSTM, GRU, которые выступают в качестве базовых моделей. На втором этапе используются большие языковые модели (на базе моделей Transformers) такие как Bert, XLNet, T5, которые дообучаются на полученных символьных представлениях уравнений.
Публикации по проекту:
Vladimir Zakharov, Anton Surkov, Sergei Koltcov AGDES: a Python package and an approach to generating synthetic data for differential equation solving with LLMs // Procedia Computer Science, 2025, Volume 258, Pages 1169-1178, ISSN 1877-0509 DOI
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.