Как тут же было подмечено, этот вывод целиком и полностью основывался на компьютерных симуляциях. Последние представляли собой (в силу необходимости) крайне упрощенные версии реальности и предполагали большое количество допущений, любое из которых могло оказаться ложным. Они — полезные инструменты, способные дать уникальную информацию. Но в конечном счете эти симуляции больше похожи на умозрительные, чем на реальные эксперименты и потому лучше подходят для постановки новых вопросов, а не поиска ответов на уже существующие. Так, если мы хотим узнать, способны ли конкретные люди на стимулирование диффузии идей, информации и, в итоге, воздействия, — и если эти влиятельные люди существуют, какие свойства отличают их от «обычных», — эксперименты нужно проводить в реальном мире. Однако на практике изучать взаимоотношения между индивидуальными влияниями и воздействием в широких масштабах безумно сложно.
Главная загвоздка — в огромных массивах данных, большинство которых очень трудно собрать. Продемонстрировать, что один человек повлиял на другого, — уже проблематично. А если требуется установить их воздействие на более крупные популяции? Необходимо собрать сведения о целых цепочках влияния, в которых один человек влияет на другого, тот — на третьего, и т. д. Очень быстро речь пойдет о тысячах и даже миллионах взаимоотношений. И все это — чтобы отследить распространение одного-единственного фрагмента информации! А ведь в идеале хотелось бы исследовать многие подобные случаи. Для проверки такого вроде бы незамысловатого утверждения — «некоторые люди влиятельнее других, и каким-то образом это важно» — требуется громадный объем данных. Кстати, вот почему так называемые исследования диффузии столь долго окружали различные мифы: когда невозможно ничего доказать, всякий волен предложить любую правдоподобную историю, какая ему нравится. Ведь кто прав — неизвестно.
Впрочем, как и в случае с экспериментами типа «Музыкальной лаборатории», с развитием Интернета ситуация явно начала меняться к лучшему. Сегодня целый ряд новейших исследований диффузии в социальных сетях проводится в масштабе, просто немыслимом каких-то лет 10 назад. Записи в блогах распространяют сообщения и информацию по сетям блогеров. Странички фанатов — по Facebook . Голосовой сервис Instant Messenger — по сети друзей. А участники онлайн-игры Second Life распространяют жесты среди других игроков {134}. Вдохновленные этими исследованиями, мы с коллегами по Yahoo! Джейком Хофманом и Уинтером Мейсоном, а также Эйтеном Бакши, талантливым аспирантом Мичиганского университета, решили поискать лидеров общественного мнения в самой крупной коммуникационной сети, которую только смогли заполучить в свое распоряжение, — в Twitter.
Во многих отношениях Twitter идеально подходит для поиска неформальных лидеров. Во-первых, в отличие от Facebook, например, где люди связываются друг с другом по множеству причин, суть Twitter — в передаче информации «подписчикам», эксплицитно указывающим, что они читают ваши записи. Результирующий «график реципиентов», таким образом, отражает распространение информации по сети друзей и контактов. Во-вторых, эта сеть невероятно многообразна. Основную массу ее пользователей составляют простые люди, чьи подписчики — их настоящие друзья. Но есть здесь пользователи, записи которых читает уйма народа — это общественные деятели (блогеры, журналисты и знаменитости — Эштон Кэтчер, Шакил О’Нил, Опра Уинфри и другие), медиаорганизации (такие как CNN) и даже правительственные и некоммерческие организации (администрация Барака Обамы; Даунинг-стрит, 10 [28] ; Всемирный экономический форум). Подобное разнообразие позволило нам дать качественную оценку влияния обычных людей так же, как Опры, избежав ряда двусмысленностей, отличавших более ранние представления о лидерах общественного мнения.
Наконец, если одни твиты представляют собой новости о повседневной жизни тех, кто их пишет («Пью кофе в Starbucks на Бродвее! Замечательный день!»), то другие — миллионы — относятся либо к иному контенту (новости или смешные видео), либо к понятиям из внешнего мира (книги, фильмы и т. д.), о которых пользователи Twitter хотят выразить свое мнение. А поскольку формат сети ограничивает объем каждого сообщения 140 знаками, люди часто прибегают к «сокращателям ссылок», заменяющим длинный путаный адрес сайта короткой аккуратной записью вроде http://bit.ly/beRKJo. Преимущество этих укороченных URL в том, что они, по сути, приписывают свой уникальный код каждому сегменту контент-эфира на Twitter. Следовательно, когда пользователь делится интересным твитом, мы можем увидеть, от кого он исходил первоначально, и проследить цепочки диффузии по графику подписчиков.
В общей сложности в течение двух месяцев в конце 2009 года нам удалось отследить более 39 млн таких «событий» диффузии, инициированных более чем 1,6 млн пользователей. Для каждого события мы посчитали количество ретвитов обсуждаемого URL: сперва непосредственными подписчиками пользователя-инициатора («сида»), потом их подписчиками, потом подписчиками их подписчиков, и так далее — в итоге проследив весь каскад ретвитов, запущенных одним-единственным первоначальным твитом. Как показано на схеме ниже, одни каскады были широкими и плоскими, другие — узкими и глубокими. Третьи — очень большими, со сложной структурой: некоторое время они оставались маленькими, а затем вдруг начинали резко увеличиваться. Впрочем, большинство каскадов — примерно 98 % — не распространялись вообще.
Каскады на Twitter.
Последнее наблюдение крайне важно. Как мы будем подробно обсуждать в следующей главе, стремясь понять, почему некоторые вещи «распространяются как зараза» — загруженные миллионы раз видео с YouTube или смешные послания, циркулирующие по электронной почте или Facebook, — грубейшей ошибкой будет учитывать лишь те немногие из них, которые действительно стали популярными. В большинстве ситуаций изучать можно только «успехи», ибо никто просто-напросто не дает себе труд отслеживать неудачи. Поэтому последние имеют тенденцию очень быстро исчезать в мусорной корзине истории. В сети Twitter, однако, мы можем проследить каждое событие — маленькое или большое. Это, в свою очередь, позволяет установить, кто именно влиятелен, насколько он влиятельнее обычного человека и возможно ли выявить различия между ними так, чтобы это можно было использовать на практике.
Мы старались сымитировать поведение гипотетического маркетолога — то есть, используя знания о свойствах и прошлом поведении примерно миллиона человек, попытаться предсказать, насколько влиятельным каждый из них окажется в будущем. Основываясь на этих прогнозах, маркетолог мог затем «профинансировать» некую группу людей, чтобы она опубликовала необходимую ему информацию, сгенерировав серию каскадов. Чем точнее он мог предсказать величину каскада, инициированного каждым конкретным человеком, тем эффективнее определялся бюджет для спонсируемых твитов.