В принципе сравнение виртуальной группы пациентов с реальной могло бы и сработать. Однако по мере того как шли испытания, Стракс и Шапиро начали тревожиться: а вдруг есть женщины, у которых рак был диагностирован еще до начала испытаний? Для таких пациенток скринирование было совершенно бесполезно. Чтобы исправить возможную ошибку, Шапиро принялся исключать таких пациенток из обеих групп.
Исключить их из группы, которой делали маммографию, оказалось достаточно просто: перед маммографией радиолог расспрашивал женщину о ее медицинской истории. Однако контрольную группу расспросить было нельзя — именно в силу ее «виртуальности». Поэтому и отсев следовало провести «виртуально». Шапиро попытался сделать это с максимально возможной тщательностью и беспристрастностью, исключив равное количество женщин из контрольной группы. Но кто знает, не выбирал ли он на подсознательном уровне? Возможно, он все же исключил из группы обследуемых женщин больше пациенток с уже диагностированным раком. Разница была невелика — всего четыреста тридцать четыре пациентки из тридцати тысяч — но в статистическом смысле фатальна. Критики утверждали, что большая смертность в контрольной группе обусловлена неадекватным отсевом. Контрольная группа, говорили они, по недосмотру оказалась перегружена женщинами с уже развившимся раком, а значит, и большая смертность в этой группе — всего лишь статистическая ошибка.
Энтузиасты маммографии пришли в уныние. Они признавали, что требуется более объективная оценка, повторное проведение испытаний. Но где такие испытания можно провести? В США двести тысяч женщин уже приняли участие в «Проекте по диагностике и выявлению рака молочной железы», а потому не годились для нового испытания. Вдобавок академические круги насмерть перессорились по поводу интерпретации результатов. Слепо барахтаясь в этих противоречиях, мировое сообщество маммографов ударилось в новую крайность. Вместо того чтобы планировать новые эксперименты с учетом результатов прошлых, они запустили череду параллельных испытаний. За период между 1976 и 1992 годами массивные параллельные маммографические испытания прошли в Европе: в Шотландии (в Эдинбурге) и сразу в нескольких городах Швеции (в Мальме, Стокгольме, Коппарберге, Остерготланде и Гетеборге). В Канаде тем временем провели собственное рандомизированное маммографическое испытание, названное Государственным исследованием скринирования молочной железы. Как нередко бывало в истории онкологии, маммографические испытания превратились в гонку вооружений, где каждая группа ученых стремилась превзойти соперников.
Испытания в Эдинбурге обернулись сущим кошмаром. Начать с того, что сам этот город, разделенный на сотни изолированных и разобщенных врачебных практик, был неподходящим местом для проведения столь масштабного эксперимента. Врачи распределяли женщин в группы скрининга или контроля совершенно произвольно. Или, хуже того, женщины сами выбирали, куда записываться. Протоколы рандомизации пошли насмарку. Даже после начала испытаний женщины внезапно переходили из одной группы в другую, парализуя возможность адекватной интерпретации результатов всего эксперимента в целом.
В Канаде же, напротив, точность проведения испытаний и внимание к деталям были доведены до совершенства. Летом 1980 года там начали широко разрекламированную государственную кампанию по набору тридцати девяти тысяч женщин для прохождения маммографии. Набор осуществлялся через объявления в газетах, рассылки писем и звонки на дом. Для проведения испытаний аккредитовали пятнадцать специализированных центров. Когда женщина приходила в один из них, в регистратуре ей задавали несколько предварительных вопросов и предлагали заполнить анкету, после чего ее осматривал хирург или медсестра, а после осмотра имя заносили в реестр — типичную книгу учета, в голубоватую линеечку, какими пользовались в большинстве клиник. Рандомизация пациенток достигалась чередованием строк в реестре. Если женщина с одной строки попадала в группу скринирования, то следующая — в контрольную, третья снова в скрининговую и так далее.
Обратите внимание: рандомизация пациенток чаще всего происходила после того, как врачи узнавали медицинскую историю женщины и осматривали ее. Такого не предусматривалось и не предписывалось исходным протоколом (подробные описания процедуры были разосланы по всем центрам). Однако это незначительное изменение полностью загубило все испытания. Назначения, проводимые после первичного опроса, проводимого медсестрами, уже не были случайными. Женщины с аномалиями в груди или лимфатических узлах гораздо чаще попадали в группу для маммографии (например, в одной из клиник семнадцать таких пациенток попали в скрининговую группу и только пять — в контрольную). То же самое происходило в отношении женщин с предшествующей историей рака молочной железы и с пациентками, относящимися к «группе риска» на основании предыдущей истории болезни или сведений, представленных страховой компанией (восемь на маммографию, одна в контроль).
Отчего так вышло, никто до сих пор не понял. Назначали ли медсестры женщин из группы риска в скрининговую группу, чтобы подтвердить результаты неточного клинического осмотра — получить второе мнение при помощи рентгеновского снимка? Делалось ли это неосознанно? Стало ли невольным результатом сострадания, попытки помочь женщинам из группы риска, отправив их на маммографию? Пропускали ли сами такие пациентки очередь в приемной, чтобы нарочно попасть в нужную строчку? А если да, то кто их научил — координаторы испытаний, лечащие врачи, рентгенологи, медсестры в приемной?
Команды эпидемиологов, статистиков, радиологов и по крайней мере одна группа зарубежных экспертов с тех пор изучили неразборчивые записи в реестрах вдоль и поперек, ища ответа на эти вопросы и стараясь понять, что же пошло не так. «Подозрение, как и красота, таится в глазах смотрящего», — возражал один из руководителей испытаний. Однако поводов для подозрений нашлось немало. Реестры пестрели помарками и исправлениями: имена меняли на другие, строчки выбеливались и в них поверх вписывались новые пациентки. Показания сотрудников центров подтвердили эти наблюдения. В одном из центров координатор испытаний добавила в скрининговую группу своих подруг (вероятно, надеясь оказать им услугу и спасти их жизни). В другом, по словам кого-то из лаборантов, рандомизацию нарушали, направляя женщин в ту или иную группу. По страницам медицинских журналов летали обвинения и контробвинения. «Один урок случившегося очевиден, — пренебрежительно написал в редакторской статье онколог Норман Бойд, — рандомизацию в клинических испытаниях надо проводить так, чтобы отклонения были совершенно невозможны».
Однако, если оставить в стороне столь блестящее умозаключение, больше ничего очевидного не обнаружилось. Из всего этого тумана на свет явилось исследование, еще более несбалансированное, чем исследование в рамках «Плана страхования здоровья». Стракс и Шапиро ошиблись, избирательно не допуская женщин из группы риска в группу для маммографии. Канадцы же качнулись в другую сторону, избирательно обогатив группу для маммографии такими пациентками. Неудивительно, что результаты их исследования вышли сугубо отрицательными: в скрининговой группе от рака молочной железы умерло больше женщин, чем среди тех, кому никакой маммографии не проводилось.