Рис. 18. Трагедия изобилия данных. Чем больше у нас переменных, тем больше взаимосвязей «умелый» исследователь может преподнести как важные. Ошибки нарастают быстрее, чем растет информация; эти ошибки нелинейны (выпуклы) в отношении данных.
В медицине различают два типа исследований: (а) исследование по данным наблюдений, в ходе которого ученый смотрит на статистические соотношения в своем компьютере, и (б) метод двойной анонимности, когда информация добывается в ходе реалистического эксперимента, имитирующего реальность.
Первый тип, наблюдение за данными в компьютере, порождает всевозможные результаты, и, как доказал Джон Иоаннидис, по меньшей мере в восьми случаях из десяти они являются ложными. Однако об исследованиях по данным наблюдений пишутся статьи, публикуемые в некоторых научных журналах. К счастью, такие исследования не одобряет Управление по контролю качества пищевых продуктов и лекарственных препаратов – тамошние ученые очень осторожны. Мы с великим активистом Стэном Янгом, разоблачающим ложную статистику, обнаружили в журнале The New England Journal of Medicine посвященное генетике исследование, результаты которого получены статистическим путем – с тем же успехом их могли взять с потолка. Мы написали в журнал письмо, но нам никто не ответил.
На рис. 18 показано, сколь чудовищно велико может быть число потенциальных ложных взаимосвязей. Идея проста. Если я работаю с набором из 200 случайных переменных, совершенно не зависящих друг от друга, почти невозможно не обнаружить высокую корреляцию на уровне, скажем, 30 процентов, однако эта корреляция будет абсолютно ложной. Есть методики, позволяющие контролировать избирательность (скажем, поправка Бонферрони), но даже они не останавливают злоумышленников – как регулирование не останавливает инсайдеров, которые наживаются на системе. Вот почему за двенадцать с чем-то лет с тех пор, как мы расшифровали геном человека, генетики не добились никаких существенных результатов. Я не говорю, что данные не содержат важной информации; беда в том, что искать ее – все равно что искать иголку в стогу сена.
Искажены могут быть даже сами эксперименты: у исследователя имеется стимул отбирать лишь то, что отвечает его задачам, и скрывать неудачи. Ученый может также сформулировать гипотезу по итогам эксперимента, то есть подогнать ее под эксперимент. Впрочем, тут отклонение не столь велико, как в первом случае.
Эффект «одураченных данными» проявляется все шире. Есть отвратительный феномен «изобилия данных», когда ученые отбирают их в промышленных масштабах. Новое время в избытке обеспечивает нас переменными (и дает слишком мало данных по каждой переменной), так что ложные взаимосвязи множатся куда быстрее истинных, ведь шум обладает выпуклой природой, а важная информация – вогнутой.
По сути, данные могут поставлять нам только знание а-ля via negativa — их можно эффективно использовать для развенчания концепций, а не для подтверждения их.
Трагедия в том, что очень трудно получить финансирование, чтобы воспроизвести – и опровергнуть – уже проведенные исследования. Но даже если деньги найдутся, сложно найти тех, кто за это взялся бы: все понимают, что воспроизводя чужие опыты, героем не стать. В итоге мы не можем доверять эмпирическим результатам – кроме отрицательных. Я романтик, и мой идеал – английский священник, ученый-любитель, который обдумывает опыты за чаем. Нынешние профессиональные исследователи соревнуются в «поиске» взаимосвязей. Наука не должна быть соревнованием; в ней не должно быть табели о рангах – как мы видим, подобная система неизбежно рушится. Нужно очистить знание от агентской проблемы.
Ошибки, совершаемые коллективно, а не индивидуально, – это признак организованного знания и лучший аргумент против него. Мы только и слышим доводы типа «все это делают» или «другие делают это именно так». Эта закономерность не тривиальна: люди, которые сами по себе ни за что не сделали бы что-то глупое, совершают глупости, объединяясь в группы. Так ученое сообщество с его институциональной структурой вредит науке.
Крис С., докторант из Массачусетского университета, однажды пришел ко мне и сказал, что разделяет мою идею «жирных хвостов» и скепсис в отношении нынешних методов управления риском, но это не поможет ему продолжить карьеру ученого. «Все учат этим методам, все пишут об этом статьи», – сказал он. Другой студент объяснил мне, что хотел бы работать в престижном университете, где моя концепция неуязвимого управления риском не пригодится, потому что «все пользуются другими учебниками». Один раз администрация университета приглашала меня преподавать стандартные методы управления риском, которые я считаю шарлатанством чистой воды (я отказался). Что я должен делать как профессор – обеспечивать студентов работой, приносящей ущерб обществу, или выполнять свой гражданский долг? Если первое, у бизнес-школ и экономической науки серьезные этические проблемы. Только эта порочная система держит экономическую науку на плаву, невзирая на то, что экономисты несут очевидную чушь – и это научно обоснованная чушь. (В моей статье про Четвертый квадрант – см. обсуждение в Приложении I – я показываю, что их методы управления риском эмпирически неверны и к тому же плохо обоснованы математически, другими словами, это научное надувательство.) Профессоров не наказывают за то, что они учат студентов теориям, которые обрушивают финансовую систему; жульничество никуда не исчезает. Факультетам нужно учить хоть чему-то, чтобы студенты устраивались на работу, даже если это «что-то» – ахинея от начала до конца. В итоге мы не можем выйти из порочного круга, где каждый знает, что теории неверны, но никто не свободен или не обладает смелостью это сказать.
Беда в том, что наука – это последнее место, где можно применять логику «другие тоже так думают». Наука зиждется на доводах, не зависящих от чужого мнения, и если эмпирически или математически доказано, что теория неверна, не имеет никакого значения, сколько «экспертов» с этим не согласятся – сотня или три триллиона. Сам факт упоминания «других» в контексте науки ясно указывает на то, что отдельный ученый – или целый коллектив, состоящий из «других», – слабак. В Приложении II показано, что именно не так в экономической науке – и какими теориями те, кто пока не пострадал от своих ошибок, продолжают пользоваться из желания сохранить работу или получить повышение.
Есть и хорошие новости: я убежден, что один наделенный доблестью человек способен победить коллектив слабаков.
Здесь нам опять же следует искать лекарство в истории. Авторы Священного Писания очень хорошо осознавали проблему рассеивания ответственности – и не зря запретили «следовать за большинством на зло», а также «решать тяжбы, отступая по большинству от правды» [137] .
Я завершу Книгу VII следующей мыслью. Когда кто-то говорит «я этичен», я напрягаюсь. Когда говорят о лекциях по этике, я напрягаюсь еще больше. Все, чего я хочу, – это избавиться от опциональности и уменьшить антихрупкость людей, которые выигрывают за чужой счет. Это простой путь отрицания, via negativa. Остальное сложится само.