Read the book: «Предсказать всё. Как теорема Байеса объясняет наш мир»

Font::

Посвящается столь рано ушедшему Луису Макгилликадди и недавно появившейся на свет Мэй Элисон Дэвидсон

Tom Chivers

Everything Is Predictable

How Bayes' Remarkable Theorem Explains the World

Individuum®

Введение
Теория почти всего

Общее правило в психиатрии – если вы думаете, что открыли теорию, объясняющую всё, диагностируйте себе манию и ложитесь в больницу.
Скотт Александер

Можно ли предсказать будущее? Конечно, можно.

Почти с полной уверенностью можно предсказать, что в ближайшие несколько секунд вы сделаете вдох и выдох. Ваше сердце будет биться со скоростью от одного до трех ударов в секунду. Завтра утром взойдет солнце – в конкретное время, зависящее от географической широты и времени года, но которое можно узнать с высокой долей точности. Все эти события можно уверенно предсказать.

Можно также предсказать, что поезд прибудет на станцию назначения в определенное время, или что ваша подруга вовремя приедет в ресторан, где вы договорились встретиться. В этом, правда, нельзя быть так уж сильно уверенным – все будет зависеть от железнодорожной компании или от подруги.

Можно также предсказать, что население планеты продолжит расти примерно до середины столетия, после чего снова начнет сокращаться. Можно предсказать, что общемировые средние температуры воздуха у поверхности Земли в 2030 году будут выше, чем были в 1930‐м.

Будущее не столь уж туманно. В него можно заглянуть. Что-то в нем легче предсказать, что-то – сложнее: танец планет по Ньютону можно предсказать на тысячи лет вперед, хаос в погоде по Лоренцу – лишь на несколько дней. Сложно, с натяжкой, но можно.

Однако когда люди говорят: «Я могу предсказать будущее», они имеют в виду нечто мистическое, какую-то сверхъестественную или волшебную способность заглянуть за горизонт. На такое мы все-таки не способны. (В этой книжке вы прочтете об ученом, который считает, что способны, а еще – о том, что он, скорее всего, не прав). Да нам это и не нужно. Мы так или иначе всё время предсказываем будущее. Иначе мы не смогли бы существовать. С каждым вдохом мы безотчетно делаем базовый прогноз в духе «воздухом и дальше можно будет дышать». Всякий раз, принимая решение, мы делаем более сложные прогнозы, например, «в магазине на углу, когда я туда зайду, будет альпийский сыр». В основе таких прогнозов нет никакой мистики – только информация, которую мы собрали в прошлом.

Суть всех прогнозов в том, что они неточны. Вселенная может быть детерминирована, а может и не быть; если бы мы обладали совершенным, божественным знанием о положении, движении и качествах всех частиц во Вселенной, мы, наверное, могли бы идеально предсказать всё, вплоть до того, когда на землю упадет всякая малая птица¹. Однако у нас такого знания нет, есть только неполная информация. Мы можем кое-как увидеть какие-то частицы Вселенной с помощью несовершенных органов чувств. Мы можем с максимальной долей вероятности выдвигать предположения о том, как эти частицы движутся: мы знаем, что человекообразные частицы чаще находятся в поисках пропитания и компании; мы знаем, что камнеобразные частицы чаще стремятся к неподвижности. На основе этих сведений мы можем делать путаные, неполноценные прогнозы.

Жизнь – не шахматы, в ней нет полной информации, и поэтому ее нельзя «решить», как какую-то задачу. Она больше похожа на покер: игру, в которой человек пытается принимать оптимальные решения, обладая небольшим объемом данных.

Эта книга – об уравнении, которое позволяет это делать.

«Кто-то мне говорил, – заметил Стивен Хокинг после выхода своей "Краткой истории времени", – что одно математическое уравнение в книге снижает ее продажи вдвое». Поскольку моя книга, собственно, об уравнении, сложно будет обойтись без хотя бы одного².

Это уравнение – теорема Байеса, или правило Байеса. Для уравнений оно в принципе простое и выглядит так:

Открою маленький секрет: я терпеть не могу читать уравнения. То есть я вроде и умею их читать, но для меня это всегда мука. Неудобно выходит: я написал три книги, полностью или частично посвященных математике. Но когда я вижу знак Σ, мозг мой «закипает» и останавливается. Подозреваю, что у многих читателей происходит то же самое, и, наверное, поэтому Хокингу советовали обойтись в книге без уравнений.

Однако уравнения – не тайнопись и не колдовские формулы. Каждый символ (это я сам себе напоминаю) обозначает простое действие, то есть выступает как сокращение.

Итак, теорема Байеса: она позволяет определить вероятность – насколько вероятно то или иное событие с учетом имеющихся у нас данных.

Если точнее, она описывает специфическую форму условной вероятности. Вертикальная черта | – сокращенное обозначение «в случае, если», или «при условии, что». То есть, P(A|B) – это вероятность наступления события A при условии, что событие B уже произошло.

Вот простой пример условной вероятности: допустим, вы хотите узнать вероятность вытащить из колоды карту червей. Вы знаете, что в стандартной колоде из пятидесяти двух карт тринадцать червей, поэтому вероятность P(♡), если угодно, равна 13/52, или 1/4. Или, если воспользоваться обозначением, принятым в теории вероятностей, p=0,25. И вот вы вытаскиваете карту из колоды, но она оказывается трефовой. Какова вероятность теперь? Червей же в колоде по-прежнему тринадцать, но карт осталось пятьдесят одна. Поэтому вероятность получается 13/51, или p≈0,255 (волнистый знак равенства означает «приблизительно равно»). Такова вероятность, что вы вытащите из колоды черви, если до этого вытянули трефы, P(♡|♣).

Или так: какова вероятность, что в определенный день в Лондоне будет идти дождь? Вероятно, около 0,4: в Лондоне примерно 150 дождливых дней в году. Но ты смотришь в окно и видишь темные тяжелые тучи. Какова вероятность теперь? Точно не знаю, но с учетом облачной погоды выше.

Теорема Байеса как раз об этом, только немного шире. В переводе на обычный человеческий язык она будет звучать так: вероятность события A с учетом события B равна вероятности B с учетом A, умноженной на вероятность A саму по себе и деленной на вероятность B саму по себе.

Представим, что в обществе распространяется некая болезнь. Учитывая недавние события, вообразить такое несложно.

Ты хочешь узнать, не подцепил ли ее, поэтому делаешь тест. В инструкции к тесту видишь примечание: «Чувствительность теста равна 99 %, специфичность – 99 %». Это означает, что если ты болеешь, то с вероятностью 99 % тест правильно это покажет, а если нет, то с вероятностью 99 % он правильно покажет, что ты не болеешь. Иными словами, доли «ложноотрицательных» и «ложноположительных» результатов теста составляют по 1 %.

То есть ты делаешь тест и получаешь положительный результат – две полоски. Что это значит? Можно разумно предположить, это значит, что с 99-процентной вероятностью ты болен.

Однако это не так. И причина кроется в теореме Байеса.

Теорема Байеса странная. Это простое уравнение, которое можно записать на одной строке, и состоит оно только из математических действий, посильных для большинства восьмилетних детей – умножения и деления. Вывел теорему один священник-нонконформист³ из города Танбридж-Уэллс, занимавшийся математикой в свободное от служб время. Однако несмотря на простоту, она серьезно влияет на нашу жизнь. Именно она объясняет, почему тест на рак может быть точным на 99 %, даже если у 99 % людей, которым этот тест ставит диагноз «рак», на самом деле рака нет. Именно она объясняет, почему вероятность, что ДНК-экспертиза ошибочно укажет на невиновного подозреваемого, составляет лишь один шанс на 20 миллионов, но при этом вероятность, что осудят не того, все равно немаленькая. Теорема Байеса объясняет, почему научные результаты могут быть «статистически значимыми» и при этом с большой вероятностью быть ошибочными.

Ей также посвящены интереснейшие философские споры. Является ли «вероятность» объективной реальностью? Когда мы говорим, что вероятность того, что на кубике выпадет единица, составляет один к шести, что мы имеем в виду? Является ли вероятность неким фактом о Вселенной, или же она описывает только наши собственные ожидания о поведении мира? И можно ли разовые события описывать в категориях вероятности? Если сказать, что «Манчестер Сити» с вероятностью 90 % выиграет чемпионат в 2025 году, то что это будет значить?

Когда мы принимаем решения о чем-то неопределенном, изменчивом, – а мы делаем это постоянно, – степень удачности таких решений описывает теорема Байеса. Все, кто в меру несовершенных сил пытается манипулировать миром для достижения какой-то цели, например бактерии, ищущие более высоких концентраций глюкозы, гены, пытающиеся передать копии самих себя следующим поколениям, или правительство, стремящееся добиться экономического роста, – если они справляются со своей задачей, значит, они действуют по Байесу.

По сути, прикладная логика Байеса лежит в основе искусственного интеллекта. Он на самом своем базовом уровне пытается делать прогнозы. Простой классификатор изображений, который смотрит на картинки и говорит, что на них изображены кошки или собаки, просто «предсказывает», что сказал бы человек, основываясь на своих обучающих данных и информации, содержащейся на картинке. DALL-E 2, GPT-4, Midjourney и остальные замечательные ИИ-технологии, уже сейчас будоражащие воображение людей, способные вести с тобой беседы и создавать удивительные изображения по простым текстовым описаниям, просто предсказывают, что по промпту сделали бы писатели или художники-люди, основываясь на своих обучающих данных. Работают они на байесовских принципах.

Наши мозги тоже работают на байесовских принципах. Ими можно объяснить, почему человек подвержен оптическим иллюзиям, почему психоделические вещества вызывают галлюцинации, как работают разум и сознание.

Теорема Байеса помогает понять, почему теории заговора так трудно развенчать и почему два человека могут смотреть на одни и те же доказательства, но видеть в них совершенно разное. Почему научные данные меня убеждают в том, что вакцины безопасны и эффективны, а скептиков – нет? Потому что, как следует из теоремы Байеса, реакция людей на новую информацию зависит от убеждений, которых они уже придерживаются. Дело не в том, что антиваксеры или конспирологи – какие-то странные инопланетяне, чей мозг устроен иначе, а в том, что они ведут себя совершенно рационально, просто с учетом своих убеждений, которые у них уже есть. Теорема Байеса объясняет, как это работает.

Видимо, мы имеем дело с теорией почти всего. Практически всего. Как только ты начинаешь смотреть на мир сквозь призму теоремы Байеса, то видишь ее везде. Я намерен сделать так, чтобы и ты, читатель, увидел ее повсюду.

Обычный способ объяснить теорему Байеса – привести пример медицинских анализов, реалистичный пример с правдоподобными цифрами: вы проходите скрининг на рак груди. Вы знаете, что если у женщины рак, то маммограмма правильно выявит его в 80 % случаев (то есть чувствительность теста равна 80 %), а в остальных 20 % – пропустит. Если же рака у нее нет, то маммограмма даст результат «все чисто» в 90 % случаев (ее специфичность равна 90 %), а в 10 % случаев даст результат ложноположительный.

Вы получаете тест. Он положительный. Значит ли это, что с 90-процентной вероятностью у вас рак? Нет. Информации, которую я вам дал, просто недостаточно, чтобы оценить ваши шансы.

Вам нужно знать, насколько вероятным вы считали наличие у вас рака груди до скрининга. Один простой способ это понять – выяснить, какой процент женщин вашего возраста страдает раком груди в определенный момент времени. Допустим, эта доля составляет один процент. Чтобы разобраться на конкретном примере, представим, что скрининг прошли сто тысяч женщин. Из этих ста тысяч у одного процента, то есть у тысячи женщин действительно выявлен рак. Из этой тысячи скрининг поставит правильный диагноз восьмистам женщинам – 80 % – и даст ложноотрицательный результат двумстам. Из 99 тысяч женщин, у которых рака нет, 89 100 женщин получат правильный отрицательный результат, а 9900 – ложноположительный. Если сделать из этих цифр таблицу, получим такую картинку:

То есть теперь ясно. Вы приходите к онкологу и получаете положительную маммограмму. Из 10 700 женщин, получивших положительный результат, у 800 действительно выявлен рак. То есть вероятность того, что у вас действительно рак, если вы получили положительный результат, в этом случае составляет 800/10 700 ≈ 0,07, или около 7 %.

Но это полностью зависит от того, насколько велика вероятность, что у вас изначально мог быть рак. Если бы скрининг проходили пациентки из группы риска, скажем, пожилые женщины со случаями рака в семейном анамнезе, то, возможно, рак был бы выявлен у 10 % этих женщин. Но дальше расчеты меняются кардинально:

Теперь вместо 800 истинно положительных результатов у вас их 8000, а число ложноположительных результатов снизилось до 9000. Таким образом, вероятность того, что у вас рак, равна 8000/17 000 или около 47 %, – гораздо более тревожная оценка. Тест не изменился, изменилась лишь априорная вероятность.

Теорема Байеса подсказывает, до какой степени вам следует изменить свои изначальные представления. Но для этого нужно, чтобы они у вас уже были.

Вернемся к уравнению – если я его чуть выше уже вставил, еще в два раза продажи не уменьшатся:

По результатам расчетов получаем P(A|B): вероятность события A с учетом имеющихся данных B, то есть вероятность, что у вас рак, в случае положительного теста. Только это вас, в сущности, и волнует: «Результат получен, насколько вероятно, что у меня рак?»

Однако показатель чувствительности 80 % дает результат ровно противоположный, а именно P(B|A), то есть вероятность B при условии A; насколько вероятно, что я увижу такой результат, учитывая, что у меня рак груди?

Это может показаться несущественным, но это такая же разница, как между следующими утверждениями: «Есть только один из восьми миллиардов шансов, что отдельно взятый человек – папа Римский» и «Есть только один из восьми миллиардов шансов, что папа Римский – человек».

Чтобы разобраться в том, что мы действительно хотим узнать, нам нужно больше информации. В примере с тестом на рак нам нужно знать, насколько распространен рак груди среди населения. В медицинской терминологии такой показатель называют заболеваемостью или распространенностью заболевания (англ. prevalence), или фоновым уровнем (background rate), а в теореме Байеса – априорной вероятностью (prior probability) или априорным представлением (prior).

Для медицинских обследований априорную вероятность часто относительно легко вычислить или, по крайней мере, просто определить. Если нужно определить риск развития болезни Хантингтона, можно просмотреть диагнозы, зарегистрированные в журналах общей практики, и подсчитать, что этим заболеванием страдают примерно 12,3 человека на сто тысяч.

В других ситуациях это намного сложнее. Если вы хотите узнать, насколько вероятно, что Россия введет войска в Украину, какова априорная вероятность такого события? Сколько раз в год Россия вводила войска в Украину? Как часто одна страна вводит войска в другую страну? Как часто одна страна вводит войска на территорию другой страны, если первая сосредоточила у границы второй танки?

Возьмем другой пример. Насколько вероятно, что моя научная гипотеза верна, учитывая, что я только что провел эксперимент и увидел определенные данные? Допустим, если моя гипотеза ошибочна, я бы ожидал увидеть подобные данные только в одном случае из двадцати. Значит ли это, что я могу сказать, что гипотеза, скорее всего, верна? Нет. Зависит от того, насколько вероятной была моя гипотеза до того, как я начал эксперимент, то есть от того, какова априорная вероятность. Но как же ее определить?

И еще один пример. Какова вероятность, что тот или иной человек виновен в преступлении с учетом данных криминалистической экспертизы? Если у меня есть образцы ДНК, шанс получить которые – один на миллион, значит ли это, что вероятность того, что я ошибся в подозреваемом, составляет один на миллион? Нет. Это зависит от того, насколько вероятно, что ваш подозреваемый изначально был «правильным». Но опять же, как вообще все это можно просчитать?

До этого мы дойдем. (Есть люди, которые на этом зарабатывают.) Главное – начинать с априорной вероятности и пользоваться теоремой Байеса. В противном случае можно забрести бог знает куда.

С теоремой Байеса люди чаще всего впервые сталкиваются в медицине, так что начнем с нее.

Я уже много лет слегка одержим теоремой Байеса. Впервые я прочитал о ней в начале двухтысячных в колонке Бена Голдакра под заголовком «Псевдонаука» («Bad Science») в газете The Guardian. С тех пор теорема увлекала меня всё больше и больше. Я написал три книги, включая эту, и во всех трех она фигурирует. Есть что-то удивительное в том, насколько теорема Байеса контринтуитивна. Что значит, когда 99-процентная точность анализа – не то же самое, что 99-процентная вероятность того, что он окажется верным? Что за бред вообще? Если вникнуть в аргументацию – не очень-то сложную, – все становится понятно, но по крайней мере для меня теорема Байеса и сейчас не теряет определенного жутковатого, потустороннего флера.

За последние четыре года, с начала 2020‐го, когда ковид-19 начал свое «триумфальное шествие» по планете, она стала намного актуальнее. Еще в апреле 2020 года, когда мы сидели на первом карантине, разные люди, например Тони Блэр, призывали ввести «иммунные паспорта» – тесты на антитела, которые позволят определить, переболел человек ковидом или нет. Если переболел, ему можно было бы выходить на улицу. (Это было еще до того, как мы поняли, что можно легко заразиться несколько раз).

В то время тесты на антитела только появились. Один такой тест, только что получивший экстренную регистрацию в США, показал чувствительность и специфичность на уровне примерно 95 %.

Неплохой показатель. Но на апрель 2020 года переболели вирусом, видимо, около 3 % британцев. Это ваша априорная вероятность. Если бы с помощью этого теста вы протестировали миллион человек, можно было бы предположить, что ковидом переболели около 30 тысяч человек. Ваш тест правильно бы выявил 28 500 из них. Но в тестах 970 тысяч человек, не болевших ковидом, он бы дал ложноположительный результат у 48 500 из них.

То есть из 77 тысяч человек, которые получили бы положительный результат, в реальности переболели чуть больше трети. Это ваша апостериорная вероятность. Если бы вы протестировали все 65 миллионов британцев и выдали «иммунные паспорта» всем, кто получил положительный результат, это означало бы, что около трех миллионов человек сказали бы, что им можно идти обниматься с бабушками, чей иммунитет ослаблен, хотя это совсем не так. Вы просто не разобрались бы во всем этом, не имея хоть какого-то представления о байесовских принципах.

В Британии возник еще один скандал, связанный с этими принципами: несколько комментаторов из числа настроенных скептически в отношении самоизоляции людей какое-то смутное представление о теореме Байеса получили. Бывший министр Джон Редвуд прославился, наверное, больше остальных: «Советники правительства должны нам сегодня сказать, как они собираются бороться с ложными результатами тестов, искажающими цифры», – потребовал он.

Дело в том, что один из скептиков неверно истолковал интервью с профессором сэром Дэвидом Шпигелхалтером – жизнерадостным статистиком, который во время пандемии не вылезал из телевизора и радио, терпеливо объясняя точность тестирования или эффективность прививок. Из его слов эти комментаторы извлекли, что когда тестирование дает 1 % ложноположительных результатов, то это не означает, что лишь 1 % всех положительных результатов ложны!.. Все это происходило между первой и второй волнами, когда при малейшем насморке мы делали тестирование при помощи полимеразной цепной реакции – ПЦР-тесты. В то время заболеваемость ковидом среди британцев была довольно низкой – локдаун же снижает число заражений! – но, похоже, она снова начала расти.

Однако ковид-диссиденты посчитали, что явный рост заболеваемости – иллюзия, которую можно объяснить с помощью теоремы Байеса. Примерно 0,1 % людей на тот момент болели ковидом. Если бы вы тестировали людей случайным образом, и ваш тест в 99 % случаев правильно определял бы людей, у которых нет ковида, а людей, у которых ковид есть, – в 90 % случаев, то более 90 % ваших положительных результатов были бы ложными⁴.

Все это абсолютно верно. Однако они не зашли в своих байесовских рассуждениях достаточно далеко. Во-первых, действительно ли априорная вероятность составляла 0,1 %? Конечно, если тестировать население полностью случайным образом. Но мы-то не тестировали их так – мы тестировали людей, у которых были симптомы, или же контактировавших с человеком, заболевание которого было подтверждено. Вероятность, что эти люди больны, была гораздо выше. Насколько выше? Мы не знаем, но даже если только у одного процента из них в действительности был ковид, общая доля ложноположительных результатов упала бы до 50 %. Если 10 % из них действительно болели бы, примерно 90 % положительных результатов были бы правильными.

И, конечно, мы исходим из того, что доля ложноположительных результатов составляет 1 %. Такой показатель кажется совершенно невероятным.

В один момент летом 2020 года, когда ковид, казалось, пошел на убыль, общая доля положительных тестов – и ложных, и правильных – составила 0,05 %, то есть доля ложноположительных результатов не могла объективно превышать этот показатель. Если взять это за основу, то при заболеваемости ковидом на уровне 0,1 % доля неверных положительных результатов упадет примерно до 35 %. Если учесть, что заболеваемость подвергнутой тестированию части населения была выше, как мы аргументировали ранее, получим, что доля неверных положительных результатов среди положительных была еще меньше.

Речь, впрочем, может идти не только о ковиде. Невозможно разобраться ни в одной из форм медицинских анализов, не призвав на помощь Байеса.

Система медицинского обслуживания (NHS) в Англии делает плановый онкоскрининг трех видов – груди, мозга и толстой кишки. Обследование предстательной железы могут пройти мужчины старше пятидесяти лет, если они обратятся самостоятельно, но в плановом порядке оно не проводится.

Почему? Обследование на рак – это же здорово. Все мы знаем, что чем раньше болезнь выявят, тем выше шансы ее победить. Почему тогда не пройти обследование, которое выявит, больны вы раком или нет? Ответ на этот и другие вопросы, заданные в этой книге, – в теореме Байеса.

Скрининг рака предстательной железы проводят с помощью так называемого теста на простатический специфический антиген (ПСА). Он довольно простой. Ты делаешь анализ крови, и если уровень ПСА в крови превышает определенный показатель, – обычно 3 или 4 нанограмма на миллилитр, – тебя направляют на дальнейшее обследование, например, на сканирование или биопсию. Высокий уровень ПСА может быть признаком рака предстательной железы, хотя он же может указывать и на наличие инфекции, воспаления или просто на возраст.

ПСА-скрининг не настолько точен, как тесты, о которых шла речь выше. По данным Национального института здоровья и медицинской помощи (NICE) – консультативного медицинского органа Великобритании, – если проводить скрининг на ПСА с отсечкой 3 нанограмма на миллилитр, это позволит правильно выявить около 32 % пациентов, больных раком (чувствительность) и около 85 % пациентов, у которых нет рака (специфичность).

Примерно 2 % мужчин за пятьдесят страдают раком предстательной железы. Если еще раз протестировать миллион пациентов, примерно 20 тысяч из них действительно окажутся больны. Правильный диагноз будет поставлен примерно 6 400 из них. А из оставшихся 980 тысяч примерно 147 тысячам вы скажете, что им нужно будет пройти дополнительное обследование. Если вы получите положительный результат по этому тесту, и вы мужчина за пятьдесят, вероятность, что у вас действительно рак, составит примерно 4 %.

Стоит ли знать о такой вероятности? Наверное. Но нужно иметь в виду, что надо будет пройти дополнительные обследования, в том числе инвазивные, неприятные, иногда в чем-то рискованные. Плюс, конечно, NHS пришлось бы оплачивать десятки тысяч МРТ-сканирований и биопсий, а это миллионы фунтов. Такие деньги лучше было бы потратить на статины, пересадку почек или зарплату медсестер. Особенность рака предстательной железы заключается в том, что во многих случаях он растет настолько медленно, что мужчины даже не подозревают о том, что он у них может быть; очень часто рак простаты обнаруживают при вскрытии, когда мужчина умер от чего-то другого.

Так что возникает еще одна важная тема. Показатели «чувствительность 32 %, специфичность 85 %» вы получите, если примените отсечку в 3 нанограмма на миллилитр. Но можно увеличить этот показатель до 4 нанограмм. Что тогда?

Тогда показатель специфичности будет выше. Процент пациентов, которым правильно диагностировано отсутствие рака, увеличится с 85 до 91 %. Но тогда пострадает чувствительность. Доля мужчин, у которых есть рак, и при этом правильно диагностированный, снизится с 32 до 21 %. Если еще раз протестировать миллион мужчин, то теперь вы получите меньше ложноположительных результатов – 88 200, но меньше и истинно положительных: всего 4 200 из 20 тысяч. В такой ситуации, если вы получили положительный результат, вероятность, что у вас действительно рак, все равно составит всего лишь около 4,5 %.

Обойти это невозможно. Можно поднять порог, скажем, до 5 нанограмм на миллилитр, и уменьшить число ложноположительных результатов, но только за счет увеличения числа ложноотрицательных. Или можно снизить порог и уменьшить количество ложноотрицательных результатов, но только ценой увеличения количества ложноположительных. Это неизбежная дилемма, высеченная в камне. Единственный возможный обходной маневр здесь – пройти другое, более эффективное обследование. Ситуация аналогична проблеме «статистической значимости» в науке. Об этой проблеме мы еще поговорим.

При раке груди и толстой кишки скрининг довольно точен. Но даже в этом случае он сильно зависит от показателя заболеваемости в популяции. В одном крупном исследовании было показано, что 60 % женщин, которые в течение десяти лет ежегодно делают маммографию, хотя бы один раз получают ложноположительный результат. Их направляют на дополнительные исследования, например на биопсию. Всё это вызывает «тревогу, душевное смятение и беспокойство, связанные с раком молочной железы». Стоит ли оно того? Будет целиком зависеть от фонового уровня заболеваемости в популяции, то есть от априорной вероятности. Рак груди редко встречается у молодых женщин. Если протестировать женщин моложе сорока, то даже довольно чувствительные и специфические тесты дадут очень много ложноположительных результатов. Среди женщин старшего возраста этот метод ценят больше, и в NICE утверждают, что он экономически эффективен, если его делать у женщин старше пятидесяти. Но вы не можете принимать решения, не прибегнув к помощи Байеса.

Будущим родителям тоже не помешает почитать о Байесе. Существует вид дородового скрининга, известный как «неинвазивное пренатальное тестирование» (NIPT), при котором у беременной женщины берут на анализ кровь, которую проверяют на наличие различных хромосомных заболеваний у плода. В Великобритании NHS предлагает его пройти женщинам из категорий высокого риска. Еще его делают в частных клиниках, примерно за 500 фунтов. Продают тест, рекламируя его 99-процентную точность. Но, опять же, точность теста сама по себе ничего вам не скажет о том, насколько вероятна правильность вашего результата. Заболевания, ради выявления которых его проходят, редки; это синдром Дауна, синдром Патау и синдром Эдвардса. Но они при этом крайне серьезны. Ребенок с синдромом Дауна может прожить долгую и счастливую жизнь, но ему скорее всего будет необходим пожизненный уход, в то время как дети с синдромами Патау и Эдвардса обычно умирают в первые месяцы или годы жизни. Очевидно, что для родителей очень важно, точны результаты тестов или нет.

Анализ данных показал, что НИПТ-тестирование населения в целом, а не только беременных из группы высокого риска, часто дает ложноположительные результаты. «Прогностическая ценность положительного результата» (positive predictive value), то есть процентная вероятность того, что данный положительный результат окажется истинно положительным, для синдрома Дауна составила 82 %, для синдрома Патау – 49 %, для синдрома Эдвардса – всего 37 %.

Если ограничиться только группами высокого риска, то эти показатели значительно возрастают: для синдрома Эдвардса прогностическая ценность положительного результата теста достигает 84 %. Иными словами, если проводить тест на будущих матерях методом случайной выборки, то почти два из трех полученных положительных результатов будут ложными. Но если ограничиться только группами повышенного риска, то ложным окажется менее чем один результат из шести.

Это «чистый Байес». Новые данные сами по себе не могут описать всю картину. Нужно знать априорную вероятность. Это не гипотетическая и не научная задача. Если вы ждете ребенка, делаете один из таких тестов и получаете положительный результат, теорема Байеса станет центральным фактором в принятии решения о том, что делать дальше. И, как мы увидим ниже, нельзя рассчитывать, что врачи вам помогут. Они, как и все мы, склонны считать, что тест, точность которого составляет 99 %, верен в 99 % случаев.

Все это касается не только медицины. В юридической сфере есть понятие «заблуждение прокурора», которое буквально означает, что человек в своем мышлении просто не следует заветам Байеса. Представьте, что вы делаете экспертизу ДНК на месте преступления. Вы находите образец на рукоятке орудия убийства, который совпадает с ДНК человека из вашей базы данных. Совпадение ДНК довольно точное: такая точность встречается примерно один раз на три миллиона.

Значит ли это, что вероятность того, что ваш подозреваемый невиновен, составляет всего один на три миллиона? Надеюсь, сейчас вы уже понимаете, что это не так.

1.Отсылка к Евангелию от Матфея, 10:29–31. – Прим. пер..

2.Приятно думать, впрочем, что если бы у меня получилось обойтись без уравнений, то я мог бы продать четыре экземпляра.

3.Нонконформизм – течение в английском протестантизме, отколовшееся по ряду теологических вопросов от позиции Церкви Англии.

4.Вы тестируете миллион человек. Тысяча из них реально больна ковидом. Ваш тест выявил 900 из них. Из остальных 999 000 тест ложно диагностировал болезнь у 9 990. 900 + 9 990 = 10 890. 900 – это примерно 9 % от 10 890.