Ученые из университета Карнеги - Меллон, который расположен в Питтсбурге, использовали сервис микроблогов Твиттер для того, чтобы научить компьютер распознавать сарказм. Об этом они рассказали в своей научной работе "Контекстное обнаружение сарказма в Твиттере".
Обнаружить сарказм в тексте с помощью компьютера не всегда легко, поскольку чаще всего шутки приобретают ироничный смысл только в самом контексте.
В своем исследовании ученые учитывали несколько основных факторов, в том числе и ключевые слова. Например, "clearly", "shocked" и "gasp", а также русские аналоги "ага, конечно" и различные хэштеги (#lol и #sarcasm). Они обращали внимание и на местоположение, возраст и пол автора и его связь с другими пользователями, с которыми он общался в своих твитах.В итоге специалистам удалось создать программу, которая определяет сарказм с вероятностью 85%.
Кроме того, они смогли установить, что больше всего склонны к сарказму мужчины с выдуманным именем в профиле.
- Хэштег #sarcasm чаще всего применялся для пояснения мыслей, которые могут быть неправильно поняты неосведомлённой аудиторией, а не реальным сарказмом, - отмечают ученые.
Ученые считают, что их система поможет автоматически модерировать контент, поскольку бывают случаи, когда шутки в соцсетях воспринимают неправильно.