• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

EthnoHate2 (АВТОМАТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ЭТНИЧЕСКОЙ РЕЧИ НЕНАВИСТИ В ТЕКСТАХ РУССКОЯЗЫЧНЫХ БЛОГОВ)

Руководитель проекта: Олеся Кольцова

Участники проекта: Антон Сурков

Данное исследование является идейным и методологическим наследником проекта 2020 года
и использует тот же датасет в качестве основного источника данных. Исследование посвящено разработке моделей для автоматического выявления этнического конфликта в неформальных текстах с этнической направленностью.

Задача решается в рамках парадигмы до-обучения (fine-tuning) языковых моделей типа transformer-encoder для классификации. Также исследуется влияние различных аугментаций (в т.ч. генерации альтернативного представления текста большими языковыми моделями - LLM) на качество моделей. ,

В дополнение к этому исследуются возможности применения больших языковых моделей для извлечения релевантной информации из текстов с этнической направленностью, а также автоматической разметки этих текстов без до-обучения.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.