• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

PolSentiLex (Разработка общедоступной базы данных и краудсорсингового веб-ресурса для создания инструментов сентимент-анализа) (2014-2015)

Руководитель проекта: Кольцов С.Н.

Участники проекта: Алексеева С.В., Кольцова Е.Ю.

Данный проект поддержан Российским Гуманитарным Научным Фондом в 2014 году. Проект направлен на создание программного обеспечения, тонального словаря и базы данных, дающих возможность в дальнейшем разработать методику автоматического определения «эмоциональной заряженности» пользовательского интернет-контента. В сочетании с автоматическим извлечением тем это позволит социальным исследователям определять общественное мнение из пользовательских текстов – а именно, отношение интернет-активной части населения к разным социально значимым вопросам. В рамках проекта поставлены следующие задачи:

  1. извлечение потенциально тональных слов из имеющихся у Лаборатории интернет-исследований обширных коллекций текстов блогов социально политической-тематики;
  2. разметка получившегося «проекта» словаря добровольцами по технологии краудсорсинга;
  3. создание веб-интерфейса для краудсорсинга, которое затем будет доступно российским исследователям для организации разметки других словарей;
  4. создание размеченной тестовой коллекции и тестирование словаря.

Результатом проекта является краудсорсинговый веб-ресурсе система (http://linis-crowd.org/), а также коллекция готового тонального словаря и тестовые тестовых коллекций в свободном доступе на созданном веб-ресурсе. Таким образом, данный проект решает фундаментальную лингвистическую проблему отсутствия русскоязычного словаря тональной лексики для пользовательских текстов общественно-политической тематики.


Публикации:
- Koltsova, O., Alexeeva, S., Pashakhin, S., Koltsov, S. (2020) PolSentiLex: Sentiment Detection in Socio-political Discussions on Russian Social Media. In: Artificial Intelligence and Natural Language. AINL 2020. Communications in Computer and Information Science Book 1292: Communications in Computer and Information Science, p. 1-17. Springer, Cham. (in print)
- Koltsova, O., Alexeeva, S., & Koltsov, S. (2016). An Opinion Word Lexicon and a Training Dataset for Russian Sentiment Analysis of Social Media. Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue 2016”, 277–287. Download (PDF, 641 Кб) 
- Koltsova, O., & Alexeeva, S. (2015). Linis-crowd.org: A lexical resource for Russian sentiment analysis of social media [Linis-crowd.org: Lexichesk  resurs dl’a analiza tonal’nosti sotsial’no-politicheskix tekstov]. Computational Linguis- Tics and Computantional Ontologies: Proceedings of the XVIII Joint Conference “Internet and Modern Society (IMS-2015)” [Kompyuternaya Lingvistika i Vyichis- Litelnyie Ontologii: Sbornik Nauchnyih Statey. Trudyi XVIII Ob’edinennoy Konferen- Tsii «Internet i Sovremennoe Obschestvo» (IMS-2015)], 25–34. 




 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.