EthnoHate2 (АВТОМАТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ЭТНИЧЕСКОЙ РЕЧИ НЕНАВИСТИ В ТЕКСТАХ РУССКОЯЗЫЧНЫХ БЛОГОВ)
Участники проекта: Антон Сурков
Данное исследование является идейным и методологическим наследником проекта 2020 года и использует тот же датасет в качестве основного источника данных. Исследование посвящено разработке моделей для автоматического выявления этнического конфликта в неформальных текстах с этнической направленностью.
Задача решается в рамках парадигмы до-обучения (fine-tuning) языковых моделей типа transformer-encoder для классификации. Также исследуется влияние различных аугментаций (в т.ч. генерации альтернативного представления текста большими языковыми моделями - LLM) на качество моделей. ,
В дополнение к этому исследуются возможности применения больших языковых моделей для извлечения релевантной информации из текстов с этнической направленностью, а также автоматической разметки этих текстов без до-обучения.
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.