Рейтинг@Mail.ru

Google спонсирует охоту на сетевых троллей

Андрей Елисеев, опубликовано 18 апреля 2012 г.

Рубрика: ПО и сервисы

Помните анекдот о том, как Вовочка пошел в уборную с глобусом, потому что у него было плохое настроение, и хотелось нагадить на весь мир? Некоторые товарищи, которые совсем нам не товарищи, с этой целью выходят в Интернет. А потом на сайтах появляются негативные комментарии и не соответствующие действительности «обзоры» товаров, которые в реальности отличаются высоким качеством. Для некоторых производителей это становится серьезным ударом по репутации, и избавиться от этого поможет разве что Бэтмен. Или фундаментальные научные изыскания.

Тролль

Google объявила о поддержке исследования, проводимого учеными университета Иллинойса в Чикаго. В рамках данного исследования специалисты планируют выработать методику автоматического обнаружения заведомо не соответствующих действительности обзоров и комментариев. Для этого авторы проекта планируют выявлять организованные группы сетевых троллей, после чего система будет самостоятельно их идентифицировать и блокировать для них доступ к определенным ресурсам.

Единой методики для подсчета реального денежного ущерба от подобных комментариев и обзоров пока не существует, однако сам факт такого ущерба очевиден, и его величина зависит от ресурса, на котором опубликован пользовательский материал такого рода. К примеру, негативный отзыв на Amazon.com способен реально повлиять на продажи той или иной компании, однако такое влияние должно быть заслуженным. Подобные действия наносят урон и потребителям, которые, будучи введенными в заблуждение, отказываются приобретать действительно нужный товар.

Первый прототип такого защитного алгоритма получил название GSRank, авторы уверены, что основные его принципы помогут создать эффективную стабильную систему, которая охотится на сетевых троллей. Алгоритм определяет время размещения отзыва и ожидает появления подобных комментариев в течение нескольких дней после публикации первого. Если таковые появляются, значит, действует не тролль-одиночка, а целая группа злоумышленников.

Помимо ориентиров времени, алгоритм анализирует и собственно контент и степень его девиации, то есть отклонения от остальных отзывов с последующей поддержкой организованной группы. Эти группы обычно копируют фрагменты текста от обзора к обзору и пользуются одними и тем же фиксированными фразами. И, наконец, последней на данный момент функцией алгоритма является вычисление объема группы злоумышленников, этот показатель высчитывается относительно большинства «нормальных» отзывов, которые в совокупности образуют единую тематическую тенденцию.