Почему с помощью парадокса Симпсона можно утверждать, что курение полезно для здоровья?
С помощью парадокса Симпсона можно доказать, что курение полезно для здоровья. Суть парадокса в том, что крупное группирование данных может значить намного меньше, чем сумма его частей.
В начале 1970-х годов в Великобритании было проведено исследование, целью которого было выяснить, каким образом ряд различных факторов вредит человеческому здоровью. Среди прочих факторов изучалось и воздействие курения. В частности, объектом исследования были женщины и их продолжительность жизни в течение последующих 20-ти лет. Удивительно, но за это время умерло 43% некурящих и только 38% курильщиков. Очевидно, сигареты спасли им жизнь?
Или, возможно, это был парадокс Симпсона. Иногда наблюдаются явные тенденции в отдельных группах данных, которые исчезают, если эти группы объединить в одну. В случае если женщин разбить по возрастам, то каждая отдельная группа покажет, что в целом у курильщиков был более высокий уровень смертности, чем у некурящих.
Тем не менее, молодые женщины курят чаще, чем женщины в возрасте, и, хотя курение увеличивает риск смерти в любом возрасте, молодые курильщики имеют больше шансов прожить «контрольные» 20 лет, чем пожилые некурящие люди.
Если же объединить все группы людей в одну, то, хотя табак и вреден для здоровья, почти никто из испытуемых не курил в течение 40-ка лет своей жизни, поэтому в совокупности может показаться, что табак полезен.
Парадокс Симпсона работает для всех случаев, в которых есть неучтённый третий фактор — иногда это всего лишь количественная разница между группами, в частности, возрастная. Примеры парадокса Симпсона можно найти среди многочисленных медицинских исследований, анализов производительности, а также в случаях дискриминации по половому признаку. Иногда то, что справедливо для целого, не подходит для его частей. Это идеальный статистический способ не позволить людям за деревьями увидеть лес.