ДАЙАН ХОЛПЕРН
Профессор психологии Клермонтского колледжа
«Статистически значимая разница» – простая фраза, но крайне важное для науки понятие, которое прочно вошло в лексикон образованных людей. Эти три слова передают базовое научное понимание процессов, случайных событий и статистических законов. Данный термин встречается везде, где обсуждают исследования, – в газетных статьях, рекламе «чудодейственных» диет, научных публикациях, лабораторных работах студентов и т. д. Эта условная абстракция отражает последовательность событий, включающих эксперимент (или другие исследования), определение нулевой и альтернативной гипотез, массив (числовых) данных, статистический анализ и вероятность маловероятного результата. И все это выражено в нескольких словах.
Будет сложно понять результат любых исследований, если вы совсем не понимаете, что означает обнаружение (или необнаружение) «статистически значимой разницы». К сожалению, старая поговорка «полузнание хуже незнания» уместна и здесь. Проблема заключается в том, что слово «значимость» в повседневной речи имеет совершенно другое значение, не то, в каком используется при описании результатов исследований.
Обычно это слово значит, что случилось что‑то важное. Например, если врач говорит, что после операции вы почувствуете себя значительно лучше, вы справедливо заключите, что ваша боль ощутимо уменьшится. Но в выражении «статистически значимая разница» слово «значимая» означает, что результаты вряд ли объясняются случайностью (если нулевая гипотеза верна), при этом сами результаты необязательно должны быть важными. Более того, иногда вывод оказывается ошибочным, поскольку исследователи могут его подтвердить лишь с определенной долей вероятности. «Статистически значимая разница» – основная концепция исследований и статистики, но как хорошо знают все, кто изучал статистику, эту идею нельзя назвать интуитивно понятной.
Хотя термин «статистически значимая разница» несет кластер важных для науки идей, многие ученые мужи были бы рады удалить его из словаря, потому что его часто понимают неправильно. Этот термин подчеркивает связь науки и теории вероятности, но, несмотря на свою популярность (или вследствие нее), он временами подразумевает то, что подразумевать не должен, и это вводит общество в заблуждение. Даже специалисты часто заблуждаются. Возьмем гипотетический пример: в некоем основательном исследовании сравнивали эффективность двух лекарств по отношению к плацебо. Может получиться следующее: препарат «Х» статистически значимо отличается от плацебо, а препарат «У» – нет. И при этом между препаратами «Х» и «У» статистически значимой разницы нет. Такое возможно, если эффективность «Х» статистически значимо отличается от плацебо с вероятностью р<.04, а эффективность «У» статистически значимо отличается от плацебо лишь с вероятностью р<.06, что выше обычных принятых уровней проверки статистически значимой разницы. Если у вас от этих примеров болит голова, то вы относитесь к большинству, которое полагает, что понимает эту критически важную концепцию, лежащую в сердце научного метода, но на самом деле имеет о ней самое поверхностное представление.
Лучшее понимание связанных с этим термином ловушек сделало бы нас намного умнее. Этот термин подразумевает, что а) результаты могут быть неважными и б) выводы, основанные на наличии или отсутствии статистически значимой разницы, могут быть ошибочными. Использование статистически значимой разницы – основа научного метода, который (со всеми своими ограничениями и недопониманиями) намного превосходит любые альтернативные пути познания мира. Добавив этому понятию пару ключевых концепций, можно намного повысить уровень образованности общества.
Эффект обманебо
БЕАТРИС ГОЛОМБ
Доцент медицинского факультета Университета Калифорнии (Сан‑Диего)
Я хочу сказать об «эффекте обманебо» (производное от слов «обманывать» и «плацебо»), то есть о чрезмерно свободном использовании терминов, что затрудняет, а не облегчает понимание вопроса.
В общий лексикон вошли слова и фразы, означающие определенные концепции: бритва Оккама, плацебо, Хоторнский эффект. В принципе такие термины облегчают диалог и делают речь экономнее, так как избавляют от необходимости утомительных описаний принципов и допущений. К сожалению, без необходимости проговаривая условия и допущения, на которые опирается термин, можно неверно оценить, насколько эти условия и допущения в данном случае применимы. И тогда использование термина будет лишь мешать взаимопониманию.
Возьмем, к примеру, «плацебо» и «эффект плацебо». Если разбираться, то, согласно определению, плацебо – это нечто физиологически инертное, что принимающий его человек считает активным. Термин «эффект плацебо» описывает улучшение состояния после приема плацебо – это объясняют эффектом ожидания.
В обыденной речи эффект обманебо, с которым его ассоциируют, присутствует повсеместно. Ключевые предположения, касающиеся плацебо, как правило, оказываются ошибочными.
1. Услышав слово «плацебо», ученые полагают, что речь идет о чем‑то «инертном», при этом не задаются вопросом: а что вообще может быть физиологически инертной субстанцией? Действительно, чем такая субстанция может быть в принципе? До сих пор не описано ничего полностью физиологически инертного.
Не существует каких‑то установленных правил приготовления плацебо, его состав обычно определяется производителем и, как правило, не описывается. В редких случаях состав плацебо оговаривался, и оно давало явный эффект. В двух исследованиях, посвященных препаратам для снижения уровня холестерина, в качестве плацебо использовали кукурузное и оливковое масло. В одном из них отмечалось, что «неожиданно» низкий уровень сердечных приступов в контрольной группе мог затруднить выявление эффективности изучаемого препарата. В другом заметили, что изучаемый препарат «неожиданно» смягчает желудочно‑кишечные симптомы у пациентов со злокачественными новообразованиями. Но у таких пациентов велика вероятность непереносимости лактозы, а плацебо представляло собой лактозу (сахарные пилюли). Когда термин «плацебо» заменили названием реального ингредиента, исчезла необходимость объяснять, как состав контрольного вещества мог повлиять на результаты.
2. Поскольку часто приходится слышать, что плацебо оказывает положительный эффект в самых разных ситуациях (см. п. 3), многие ученые считают, что «эффект плацебо» является широко распространенным и обычным феноменом.
Датские исследователи Асбьорн Хробьяртссон и Пнтер Гётше систематически изучали результаты исследований, в которых сравнивали эффект плацебо и отсутствие всякого воздействия. Они обнаружили, что ничего плацебо не делает. В большинстве случаев никакого «эффекта плацебо» не было. Слабый эффект наблюдался лишь кратковременно при лечении боли и беспокойства. Влияние на боль можно было снять налоксоном (антагонистом опиоидных рецепторов), а значит, в механизмах этого эффекта участвуют эндогенные опиаты.
3. Когда говорят, что плацебо вызывает улучшение, ученые обычно полагают, что причиной является эффект ожидания. Но, как правило, наблюдаемые эффекты оказываются чем‑то абсолютно другим – например, причиной может быть естественный ход болезни или регрессия к средним величинам. Возьмем нормальное колоколообразное распределение. Каков бы ни был желаемый результат (уменьшение боли, артериального давления, уровня холестерина в крови или что‑то еще), для исследования обычно отбирают людей с одного края распределения – например, у кого симптомы выражены сильнее всего. Но эффективность препарата всегда варьирует (вследствие физиологических различий, хода заболевания, погрешностей измерения и т. д.). Кроме того, сильно выраженные симптомы будут в среднем смягчаться – феномен, называемый регрессией к средним величинам. Здесь будет действовать именно он, а не плацебо (что и объясняет результаты датских ученых).
Другая проблема обманебо касается недавнего исследования Теда Капчука из Гарварда. Ученые давали плацебо людям с синдромом раздраженного кишечника.
Другой группе не давали ничего. Плацебо предлагалось в бутылочке с надписью «Плацебо», и исследователи честно говорили, что это плацебо, но очень эффективное. Они хотели усилить эффект ожидания, честно говоря подопытным, что именно те принимают, и старались установить с ними доверительные отношения. Они часто встречались, общались и постоянно повторяли, что плацебо очень мощное. В результате те, кто принимал плацебо, сообщали об улучшении состояния – в отличие от тех, кто не принимал ничего. Ученые объяснили это эффектом плацебо.
Но почему не предположить, что подопытные просто говорили ученым то, что те хотели услышать? Деннис Грэди писал в «Нью‑Йорк таймс»: «В детстве мне каждую неделю делали инъекции от сенной лихорадки, и они совсем не помогали. Но я очень надеялся, что они в конце концов помогут. И врач был так добр, что, когда меня спрашивали, стало ли мне лучше, я всегда говорил «да»…» Желание угодить (возможно, связанное со стремлением получить общественное одобрение) может во многом объяснить то, что приписывают эффекту плацебо, – особенно когда речь идет о субъективном смягчении симптомов. Интересно, допустили бы ученые такую ошибку, если бы не существовало термина «эффект плацебо».
Другое возможное объяснение заключается в специфическом физиологическом воздействии. В исследовании в качестве плацебо использовали микрокристаллическую целлюлозу. Очень радует, что авторы это указали. Но хорошо известно, что растительные волокна (например, псиллиум) облегчают запор и диарею – основные симптомы синдрома раздраженного кишечника; их даже специально назначают пациентам.
Так что вполне возможно, что «плацебо» действительно было эффективно, физиологически облегчая симптомы.
Все это показывает, что термин «плацебо» не подразумевает «инертное» (и таковым не является) и что, если в каком‑либо исследовании плацебо ощутимо облегчает симптомы, не следует сразу предполагать эффект ожидания (возможной причиной является уже само распределение – регрессия к средним величинам).
Таким образом, во многих случаях, включая весьма серьезные, связанные с медицинской практикой, замена конкретных терминов вроде «плацебо» или «эффект плацебо» на ассоциируемые с ними концепции может подавить критическое мышление и как следствие – сказаться на нас всех.
Антропофилия
ЭНДРЮ РЕВКИН
Журналист «Нью‑Йорк таймс», защитник окружающей среды, блогер, автор книги The North Pole Was Here («Здесь был Северный полюс»)
Для поддержания прогресса на планете, которую человек все больше подстраивает под себя, но которая все еще полна сюрпризов, необходима большая доза антропофилии. Я предлагаю обозначать этим термином строгое и беспристрастное самоуважение и заботу о своих интересах в ситуациях, когда люди или общества сталкиваются с необходимостью принимать важные решения в условиях неопределенности и разногласий.
Термин неслучайно напоминает «биофилию» Эдварда Осборна Уилсона – заботу о не связанной с человеком части окружающего мира, которую мы называем природой. Но долгое время без внимания оставалась необходимость осознать роль человека в природе и, что еще важнее, понять нашу внутреннюю природу.
Исторически подход к решению проблем формировался вокруг двух идей: «Горе мне!» и «Нам должно быть стыдно!» (и частенько «Постыдились бы!»).
В чем же проблема?
Горе парализует, а обвинение вызывает желание спорить, и часто не по делу (кто виноват? нефтяная компания BP – или все мы, кто использует углеводороды в наших автомобилях и в отоплении наших домов?). Обсуждения подобных концепций нередко ведут к политическим дебатам, которые кто‑то описал мне в контексте климатических проблем как «бла‑бла‑бла‑бла… БА‑БАХ!». Тот же феномен хорошо заметен в том, как были проигнорированы многочисленные предупреждения относительно атаки 11 сентября, равно как и относительно недавнего финансового кризиса.
Более полное понимание человеческой природы – «и божественной ее стороны, и плотской», как говорит Билл Брайсон, – покажет, какие проблемы мы наверняка будем неправильно решать. Осознание этих тенденций поможет более осмысленно делать выбор – во всяком случае, слегка повысит вероятность того, что в следующий раз мы не так сильно ошибемся. Например, я знаю, что когда вечером зайду на кухню, то скорее потянусь за печеньем, чем за яблоком. Подумав об этом заранее, я имею немного больше шансов избежать соблазна и лишних калорий.
Вот несколько примеров того, где эта концепция еще более применима.
Почему‑то мы упорно не извлекаем уроки из катастроф. Когда в китайской провинции Сычуань произошло сильное землетрясение, десятки тысяч школьников (и их учителя) погибли под развалинами разрушенных школ. Но хотя ясно, что в американском штате Орегон более тысячи школ окажутся в той же опасности в случае тектонической активности в Каскадных горах, финансирование их модернизации идет крайне медленно. Социологи понимают, почему так происходит, несмотря на страшные наглядные примеры и очевидную степень риска. Но разве достаточно просто осознавать нашу привычку жить текущей минутой, чтобы повлиять на принятие политических решений и распределение средств? Если так и случается, то крайне редко.
Социологи также знают, что битвы вокруг проблемы глобального потепления – и на научном, и на политическом уровне – в основном имеют культурологический характер. Как и во многих других спорах (например, о здравоохранении), война ведется между двумя фундаментальными группами общества: теми, кто защищает интересы общества в целом («либералы»), и теми, кто стоит на страже интересов личности против общества («либертарианцы»). В таких ситуациях, как показывает большое количество исследований, информация абсолютно бессмысленна. Каждая группа выбирает лишь те факты, которые подтверждают ее позицию. Случаи, чтобы информация способствовала пересмотру взглядов, крайне редки. Поэтому не стоит ожидать, что на следующем заседании Межправительственной комиссии ООН по вопросам изменения климата вдруг предложат план действий, устраивающий всех.
Если все это осознать, то есть надежда, что новейший подход к решению подобных проблем найдется где‑то посередине, а не в крайностях. Исследования отношения к изменениям климата показывают намного большее согласие в необходимости расширения списка возможных источников энергии.
Физик Мюррей Гелл‑Манн, сталкиваясь с многоплановой проблемой, часто говорит о необходимости взглянуть свежим взглядом на картину в целом. При этом необходимо по возможности честно учитывать специфику биологического вида, производящего инспекцию.
Невозможно найти замену ООН или палате представителей. Но назрела необходимость поискать новые подходы к конструктивному диалогу и решению проблем. И первым шагом должно быть осознание нашей человеческой природы – какой бы она ни была.
Это и есть антропофилия.