Среди определенной группы людей вероятность некоторой болезни

Среди определенной группы людей вероятность некоторой болезни thumbnail

Тема 3. СЛЕДСТВИЯ ТЕОРЕМ СЛОЖЕНИЯ И УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ

п.3.1. Формула полной вероятности

Постановка задачи._____________________________

________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Теорема 1.1. (формула полной вероятности). Вероятность события А, которое может наступить лишь при условии появления одного из несовместных событий , , …, , образующих полную группу, равна сумме произведений вероятностей каждого из этих событий на соответствующую условную вероятность события А:

__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Замечание (о гипотезах). Несовместные события , где , в контексте использования формулы полной вероятности называют гипотезами, на что и указывает их запись с помощью буквы Н – от «hypothesis».

Пример.В комиссию по проведению референдума поступили бюллетени с двух участков. С первого участка поступило 1000 бюллетеней, со второго – 3000. Среди бюллетеней первого участка 100 недействительных бюллетеней, среди бюллетеней второго участка 200 недействительных. При подсчете голосов наудачу взят бюллетень. Найти вероятность того, что он является действительным (событие А).

Решение.Пустьсобытие Н1 – бюллетень поступил с 1-го участка, событие Н2 – бюллетень поступил со 2-го участка. Находим вероятности данных гипотез:

Находим условные вероятности «__________________________________________________

_________________________

По формуле полной вероятности окончательно получаем:

п. 3.2. Вероятности гипотез. Формула Байеса

Пусть событие А может наступить при условии появления одного из несовместных событий (гипотез) Н1, Н2, …, Нn, образующих полную группу. Вероятность появления такого события А определяется по формуле полной вероятности:

. (1)

Допустим, что произведено испытание, в результате которого событие А появилось. Как изменились (в связи с тем, что событие А уже наступило) вероятности гипотез? Для ответа на этот вопрос нам потребуется найти условные вероятности .

Найдем сначала условную вероятность . По теореме умножения имеем:

.

Отсюда

.

Подставив сюда Р(А) из равенства (1), получим:

.

Аналогично можно вывести условные вероятности остальных гипотез, то есть условная вероятность любой гипотезы Hi (i = 1, 2, …, n) может быть вычислена, как:

.

Полученные формулы называют формулами Байеса (по имени английского математика). Формулы Байеса позволяют переоценить вероятности гипотез после того, как становится известным результат испытания, в итоге которого появилось событие А. Таким образом, в задачах на формулы Байеса в условии обязательно фигурирует некое произошедшеесобытие.

— априорные (оцененные до испытания) вероятности;
— апостериорные (оцененные после испытания) вероятности.
 

Апостериорные вероятности — вероятности тех же гипотез, пересчитанные в связи «со вновь открывшимися обстоятельствами » – с учётом того факта, что событие А достоверно произошло.

Важность байесовской переоценки вероятностей (гипотез) можно понять на следующем примере.

Задача.Среди определенной группы людей вероятность некоторой болезни 0,02. Тест, позволяющий выявить болезнь, несовершенен. На больном он дает позитивный результат в 98 случаях из 100, и, кроме того, он дает позитивный результат в 4 случаях из

100 на здоровом. Найдите вероятность того, что человек, на котором тест дал положительный результат, действительно болен.

Решение. Введём обозначения следующих событий и гипотез:

Н1 — __________________________________________________________________________ Н2 — __________________________________________________________________________

А — __________________________________________________________________________

______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Читайте также:

Рекомендуемые страницы:

©2015-2020 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-11-01
Нарушение авторских прав и Нарушение персональных данных

Источник

Совсем недавно в издательстве Альпина нон-фикшн при поддержке «Эволюции» вышла книга Эдварда Шейнермана «Путеводитель для влюблённых в математику». Представляем вашему вниманию главу 20 про вероятности в медицине.

ВЕРОЯТНОСТЬ В МЕДИЦИНЕ  

Объявлено медицинское тестирование, диагностирующее наличие или отсутствие некой редкой болезни. Это чрезвычайно надежный тест. Вы принимаете решение пройти его и с ужасом получаете положительный результат. Насколько стоит беспокоиться?

Перевести беспокойство на язык цифр непросто, но в подобных ситуациях нужно сосредоточиться, потому переформулируем вопрос: насколько велика вероятность, что вы действительно подхватили это редкое заболевание?

Для ответа необходимо знать уровень надежности теста, а кроме того, как мы скоро увидим, уровень распространения болезни. Вот эти данные.

Редкая болезнь поразила 0,1% населения. Состояние здоровья одного человека из тысячи вызывает тревогу.

Тест не идеален, как и всякий медицинский тест. Предположим, он дает верную информацию в 98% случаев. Таким образом:

― среди 100 здоровых людей 98 человек получают верный отрицательный результат и 2 человека — неверный положительный;

― среди 100 больных людей 98 человек получают верный положительный результат и 2 человека — неверный отрицательный.

Разумеется, мы хотим пройти еще более надежный тест, но предположим, что это единственный возможный способ диагностировать наличие или отсутствие болезни.

Вопрос: если результаты теста положительные, какова вероятность того, что вы больны?

Читайте также:  Заразительность больного в различные периоды болезни

Ответ выглядит очевидным. Мы указали, что тест дает верные результаты в 98% случаев. Таким образом, вы больны с вероятностью 98%. Верно?

Вообразим город с миллионом жителей. Один из тысячи болен. Другими словами, 1000 жителей больны и 999 000 здоровы.

Все жители проходят медицинское тестирование. Посмотрим, сколько будет положительных результатов, если тест эффективен на 98%.

• Среди тысячи больных жителей положительный результат получит большинство, но не все. Их количество 1000 × 0,98 = 980.

• Среди 999 000 здоровых жителей большинство покинет поликлинику с радостной новостью об отсутствии болезни, но 2% получат ложный результат. Это дает еще 999 000 × 0,02 = 19 980 положительных результатов.

В общей сложности 980 + 19 980 = 20 960 жителей получат положительный результат.

Теперь мы можем правильно ответить на поставленный вопрос: какова вероятность того, что вы больны, если ваш результат тестирования положительный?

Среди двадцати с лишним тысяч людей с положительным результатом всего лишь меньше тысячи действительно больны. Точная вероятность правильности теста в этом случае равна 980 / 20960 = 4,7%.

Вероятность того, что вам стоит беспокоиться, не равна 98%! На самом деле вероятность того, что вы заражены этой редкой болезнью, меньше 5%!

Стало быть, тесту грош цена? Не совсем.

Во-первых, если ваш лечащий врач имеет веские причины предполагать у вас наличие этого редкого заболевания, вы больше не «случайный» пациент. И если у вас действительно прослеживаются определенные симптомы, вероятность того, что вы заражены, уже не одна тысячная, а скажем, одна четвертая*. В этом случае положительный результат тестирования имеет гораздо больший смысл, чем нестрого обоснованные выводы.

Во-вторых, если болезнь действительно опасна, тест, эффективный на 98%, позволяет хорошо просеять большие массы населения на предмет наличия или отсутствия болезни. Пациенты с положительным результатом могут пройти вторую диагностику, дающую еще более точные результаты. Разумеется, отрицательный результат — не повод успокаиваться полностью. Какова вероятность того, что он верен? (Ответ я дам в конце главы.)

Интуиция отказывается принимать тот факт, что тест, надежный на 98%, может быть настолько несовершенным, но вычисления говорят сами за себя. Впрочем, голые цифры могут обманывать нашу интуицию. Попробуем нарисовать картинку.

Заметим: диаграмма не соблюдает пропорции (0,1% больных, эффективность теста 98%).

На чертеже большой прямоугольник изображает все население. Фрагмент прямоугольника слева вверху обозначает группу больных жителей, оставшаяся часть — группу здоровых жителей. Серая полоса сверху — это все жители (из обеих групп) с положительным результатом. Белая область внизу — все жители (опять-таки из обеих групп) с отрицательным результатом

Чертеж иллюстрирует основные детали вышеописанной ситуации:

• болезнь редкая — крохотный фрагмент большого прямоугольника символизирует больную часть населения;

• тест верно диагностирует наличие болезни у подавляющей части больных — почти весь прямоугольник слева вверху закрашен серым;

• тест верно диагностирует отсутствие болезни у подавляющего большинства здоровых людей — огромная область большого прямоугольника остается белой;

• ключевой момент: большая часть серой полосы приходится на здоровых людей, поэтому вы, скорее всего, здоровы, если получили отрицательный результат, но не обязательно больны, если получили положительный.

Условная вероятность**

Мы вычислили вероятность того, что пациент с положительными результатами медицинского тестирования действительно болен. Мы вообразили гипотетический город, где живет миллион человек, и посчитали численность разных категорий населения. Это был способ ad hoc***. В общем случае мы должны руководствоваться языком теории вероятностей, и я завершу главу разъяснениями по этому поводу.

Для события A мы обозначаем P (A) вероятность того, что событие A произойдет, и  — вероятность того, что событие A не произойдет; таким образом, .   

Для событий A и B мы обозначаем P (A / B) вероятность того, что произойдут оба события — и A, и B.

Запись P (A | B) означает вероятность того, что из события A следует событие B; это условная вероятность того, что A влечет за собой B. Формула Байеса*** говорит нам:

Надежность диагноза, вынесенного на основе упомянутого медицинского теста, может быть выражена на языке математики следующим образом. Пусть S означает, что некто заражен редкой болезнью, а T означает положительный результат тестирования. Таким образом:

• болезнь поразила 0,1% населения, откуда следует, что P(S) = 0,001;

• тест дает верную информацию о наличии или отсутствии заболевания в 98% случаев, откуда следует, что P (T|S) = 0,98;

• тест дает верную информацию о том, что человек здоров, в 98% случаев, откуда следует, что . Иначе говоря, тест ошибочен в 2% случаев: .  

Читайте также:  История болезни по аллергологии острая крапивница

Вопрос: какова вероятность того, что пациент с положительным результатом тестирования действительно болен?

Если перевести задачу на язык символов, то мы ищем величину P (S|T). По формуле Байеса эта вероятность равна  Нам нужно узнать P (S / T) и P (T).  

Начнем хоть с P (S / T), хоть с P (T / S). По формуле Байеса

Мы знаем, что P (T|S) = 0,98, а P (S) = 0,001. Следовательно, P (S / T) = P (T / S) = P (T|S) × P (S) = 0,98 × 0,001 = 0,00098.

Теперь вычислим P (T). Нам известно, что P (T|S) = 0,98, а . В то же время . Далее:  

Применим формулу Байеса в последний раз:

Это совпадает с нашими предыдущими вычислениями.

Если у вас есть симптомы

Предположим, шансы быть пораженным болезнью при наличии определенных симптомов равны 25%. Какова вероятность того, что вы и вправду больны, если результат тестирования положительный? Снова вообразим город с миллионом жителей. На сей раз 250 000 больны и 750 000 здоровы.

• Среди 250 000 больных верный положительный результат тестирования получают 250 000 × 0,98 = 245 000 жителей.

• Среди 750 000 здоровых ложный положительный результат тестирования получают 750 000 × 0,02 = 15 000 жителей.

В общей сложности 260 000 получают положительный результат, и среди них 245 000 действительно больны. Таким образом, при положительном результате теста вероятность того, что вы тоже подхватили заразу, увеличивается до 245 / 260 = 94,2%.

Если ваш результат тестирования отрицательный  

Предположим, вы прошли тестирование и получили отрицательный результат. Какова вероятность того, что вы действительно здоровы?

В нашем городе с миллионным населением 1000 человек больны и 999 000 здоровы. Сколько всего будет отрицательных результатов теста?

• Среди 1000 больных 2% получат ложные отрицательные результаты; всего 1000 × 0,02 = 20 человек.

• Среди 999 000 здоровых 98% получат верные отрицательные результаты. Всего 999 000 × 0,98 = 979 020 человек. Вероятность того, что вы здоровы и получили отрицательный результат теста, равна

Фантастические новости! Но помните: и безо всякого теста вероятность быть здоровым 99,9%. Величина добавочной уверенности на основе теста ничтожна.

* Предположим, вы попали в категорию людей, где 25% поражены болезнью. Какова вероятность того, что вы заражены, если результат тестирования положительный?

** Этот раздел предназначен для тех, кто уже изучал теорию вероятностей и хочет освежить свои знания.

*** По особому случаю (лат.). — Прим. пер.

**** Томас Байес (1702–1761) — британский пресвитерианский священник, богослов и математик. — Прим. пер.

Источник

Категория:

  • Медицина
  • Отменить
.
  Вероятности

.
     Эволюция неплохо подготовила нас к оцениванию вероятностей. Мы умеем за доли секунды оценить ситуацию и решить: сыграть или удрать? Сбивать пламя или бежать в безопасное место? Мы также воспитываем в себе понимание того, что новая информация воздействует на вероятности некоторых событий. Например, даже если вы не знаете, интересуется ли классической музыкой ваша новая знакомая, вы, скорее всего, оцените шансы «за» ниже, если обнаружите, что она путает Шумана и Шуберта.
.
   Эти довольно расплывчатые идеи можно выразить математически точно, используя понятие условной вероятности. В качестве математического примера рассмотрим вероятность выпадения чётного числа при бросании игральной кости. Она, конечно же, равна ½. Однако, если известно, что выпало простое число, то эта вероятность падает до 1/3, так как между 1 и 6 только три простых числа – 2, 3 и 5 – и только одно из них – 2 – чётное.
.
    В математике имеется формула, известная под названием формулы Байеса, которая позволяет обращать условные вероятности. Представьте себе бармена, которому по опыту известен процент посетителей, оставляющих чаевые. Допустим, что это в среднем 40%, а для туристов это среднее увеличивается до 80%. Поэтому, информация о том, что кто-то из посетителей – турист, увеличивает шансы на то, что он оставит чаевые. Формула Байеса позволяет сделать и обратный вывод: зная, что оставлены чаевые, можно вычислить вероятность того, что оставивший был именно туристом.
.
    Впрочем, нельзя сказать, что вычисления вероятности получить чаевые – фундаментально важная задача. Однако те же самые методы применимы к гораздо более важным вопросам. Знаменитый пример – эффективность медицинских тестов. Чему равна вероятность, что у меня определённая болезнь, если результат теста оказался положительным? Тех, кто имеет опыт получения положительного результата, можно утешить математически – эта вероятность гораздо меньше, чем подсказывает интуиция. Эволюция запрограммировала на быть слишком пессимистичными в этом случае. Математика развеивает этот миф.
.
   НО это не математический блог, так что подробных изложений того, что из себя представляют вероятности, в т.ч. условные, и сама формула Байеса здесь не будет – поиском в интернете очень легко получить всю информацию на эту тему. Я приведу лишь «выжимку» из теории и покажу, как её можно применить в реальной жизни.
.
    Итак, самые важны моменты для нашего «эксперимента»: если А и В – два возможных исхода случайного эксперимента, то Р(А|В) обозначает вероятность осуществления А, если известно, что произошло событие В. В нашем случае событие А это «я болен», а событие В  — «тест положительный».
.
Иллюстрация: например, пусть из стандартной колоды в 52 листа извлекают наугад карту. Обозначим А событие «валет пик», а В – «карта пик». Тогда вероятность А равна 1/52, поскольку всего есть 52 карты, и с равными вероятностями может быть извлечена любая из них. Однако, если известно, что извлечена карта пик (осуществилось событие В), то вероятность (условная вероятность) валета пик увеличивается до 1/13, поскольку в колоде 13 различных карт пик.
.
   В простейшем случае в формулу Байеса входят два события, А и В. Считается, что известна вероятность Р(В) того, что произойдёт событие В, а также известны условные вероятности Р(А|~В) и Р(В|А). Здесь ~В обозначает событие, дополнительное к В (т.е. событие В не осуществляется), так что если событие В – «карта пик», то ~ В – «карта червей, бубен или треф».
 .
.
Тест на корь
.
   Теперь можно уточнить, о чём говорит наш медицинский пример, в котором речь идёт о диагностике редкой болезни. Не будем вспоминать СПИД или рак, пусть это будет корь. Однажды утром у себя на лице вы обнаруживаете красноватую сыпь и немедленно хотите узнать, не заразились ли вы корью. Врач назначает тест на корь, и его результат оказывается положительным. Больны вы или нет?
.
   Обозначим А событие «тест на корь положителен», а В – событие «у меня корь». Чтобы воспользоваться формулой Байерса, нам нужно знать вероятности Р(В), Р(А|В) и Р(А|~В).
.
    Р(В) – вероятность того, что у меня в принципе может быть корь; среди взрослых это редкая болезнь, и мы можем положить её равной 5%, т.е. Р(В)=0,05.
.
    Условная вероятность Р(А|В)  описывает надёжность теста: чему равна вероятность того, что для больного человека тест даёт положительный результат? Если бы тест был совершенным, эта вероятность была бы равна 1,0 или 100%. Однако таких тестов не существует, и можно только надеяться приблизиться к идеалу. Мы оптимистически положим эту вероятность равной 0,98 (98%).
.
    Р(А|~В) – вероятность  того, что тест даёт положительный результат, несмотря на то, что вы здоровы. Также было бы хорошо, чтобы это значение было равно нулю, но и эта цель недостижима. Реалистично положить вероятность «фальшивого положительного» результата равной  20% —   Р(А|~В)=0,2.
.
   Теперь можно приступать к вычислениям. Мы хотим знать Р(В|А) – вероятность того, что при положительном результате действительно имеется заболевание. Воспользовавшись формулой Байерса , мы получаем результат … 0,205 (!!!)
.
    Вероятность того, что вы действительно больны, составляет отрадные 20%, что действительно поражает. Большинство людей ожидает, что она окажется гораздо больше. Это обусловлено тем, что, оценивая вероятность, мы недооцениваем информацию о том, что сама по себе болезнь встречается очень редко.
.
    Чтобы понять, почему мы ошибаемся, оценивая эти вероятности, можно прибегнуть к геометрической интерпретации этого примера. На рисунке ниже прямоугольник символизирует все возможные интересующие нас исходы. Маленький красный кружок означает событие А – «корь». Кружочек очень маленький, потому что это очень редкая болезнь. Второй круг означает событие В – «тест положителен». Второй круг захватывает большую часть первого, ведь в случае болезни тест почти всегда даёт положительный результат. Доля малого круга вне большого мала, поскольку мы считаем ничтожным число «фальшивых отрицательных» результатов.
.

Читайте также:  Признаки болезни у собаки при укусе клеща

.
    Однако при всех этих условиях доля круга А, захваченного кругом В, невелика: положительный результат не означает, что у вас почти наверняка корь.
.

Источник