«Все айтишники — интроверты»: разби­раемся с помощью статистики, откуда берутся стереотипы
Статистика
2K
Сгенерированное изображение — Лев Переулков / Midjourney

«Все айтишники — интроверты»: разби­раемся с помощью статистики, откуда берутся стереотипы

На примере образования и работы
3
Аватар автора

Николай Валюх

изучил парадоксы

Страница автора

Мир полон стереотипов, и, возможно, некоторые из них возникли из-за не совсем корректной интерпретации статистики.

Мы выбрали три стереотипа, которые влияют на деловые и учебные отношения, и с помощью подсчетов объясняем, откуда берутся те или иные ярлыки.

Парадокс Берксона, или откуда взялся миф «хороший программист — интроверт»

Суть парадокса. Между двумя независимыми параметрами после добавления третьей переменной образуется взаимосвязь.

Ситуация. Допустим, специалист из отдела кадров изучает навыки кандидатов на работу — хард-скиллы  и софт-скиллы  .

Допустим также, что изначально навыки никак не связаны: нет оснований полагать, что у кандидатов с прокачанными хард-скиллами не развиты софт-скиллы. И наоборот, нельзя сказать, что у соискателей с высоким баллом за софт-скиллы обязательно будет низкий балл за хард-скиллы.

На плоскости, где по осям отложены оценки в баллах, кандидаты сформируют случайное облако точек, и взаимосвязи между хард- и софт-скиллами не будет.

Все меняется, когда кадровик начинает отбор: это и есть та самая третья переменная, которая создает взаимосвязь между хард- и софт-скиллами.

Кандидатов с низким баллом одновременно за хард- и софт-скиллы кадровик не рассматривает: такие в компании не нужны. Также в компанию не попадут соискатели с высоким баллом сразу по всем навыкам: у таких специалистов либо высокие зарплатные ожидания, либо есть предложения поинтереснее.

В итоге после отбора кадровика штат сотрудников компании представляет собой сильно смещенную выборку  с выраженной тенденцией: чем лучше прокачаны хард-скиллы у работника, тем хуже развиты его софт-скиллы, и наоборот.

Проблема таких смещенных выборок в том, что выводы на их основе распространяют на генеральную совокупность, то есть на всех кандидатов. Отсюда рождаются мифы о том, что хороший программист не умеет общаться, а коммуникабельный сотрудник не может сложить два числа без калькулятора.

Где еще встречается. Парадокс Берксона встречается не только в рекрутинге, но и других областях, например в образовании. Университеты могут зачислять абитуриентов за какие-то успехи, например в науке или в спорте. В итоге на основе выборки из студентов складывается ложное мнение, что все отличники слабые, а спортсмены глупые.

Парадокс можно встретить даже в дейтинге. Одновременно и красивые, и умные девушки могут отказать среднестатистическому парню в свидании. Сам парень также не станет встречаться с некрасивыми и неумными, на его взгляд, девушками. В итоге на свидания он будет ходить или с красивыми, или с умными, что рождает в голове парня еще один известный миф.

Парадокс Симпсона, или откуда берутся гендерные стереотипы

Суть парадокса. Взаимосвязь между двумя переменными исчезает или меняется на противоположную, если рассматривать набор данных не целиком, а в разрезе по какому-то параметру.

Ситуация. Известный случай, когда этот парадокс ввел в заблуждение, — история Калифорнийского университета, который заподозрили в дискриминации женщин. Разберем этот реальный случай на условных числах.

Предположим, университет был рассчитан на 100 мест. На эти места претендовали 200 человек — 100 мужчин и 100 женщин. Очевидно, что в университет пройдет только половина абитуриентов, или 50%.

Мы ожидаем увидеть такой же процент поступивших для каждого пола: в университет пройдут примерно 50 из 100 мужчин и 50 из 100 женщин. Но среди мужчин поступило 65 человек, или 65%, а среди женщин — 35 человек, или 35%. Университет обвинили в дискриминации, но сделали это несправедливо:

  1. Мужчины и женщины выбирали разные факультеты. Среди мужчин 75 человек отправились на факультет A, 25 человек — на факультет B. У женщин все наоборот: 25 человек пошли на факультет A, 75 человек — на факультет B.
  2. Количество доступных мест на факультетах различалось. На факультете B, куда в основном пошли женщины, их было всего 20, а на факультете A, куда в основном пошли мужчины, — 80.

Если посчитать процент поступивших мужчин и женщин не в целом по университету, а в разрезе по факультетам, то связь между полом и успешным поступлением исчезнет.

На факультет A прошли 60 из 75 мужчин, или 80%. Точно такой же успех на этом факультете у женщин — 20 из 25, или 80%. Тем временем на факультет B поступили 5 из 25 мужчин, или 20%. И точно такой же результат здесь у женщин — 15 из 75, или 20%.

В итоге о дискриминации говорить не приходится: на каждом факультете процент поступивших у мужчин и у женщин одинаковый. Более того, если бы хотя бы один из прошедших мужчин не поступил, то у женщин процент успеха был бы даже выше, чем у мужчин. Это противоречит изначальному впечатлению о подтасовке в пользу мужчин.

Где еще встречается. В социологии, спорте и других разных областях — например, в медицине. Допустим, первую группу пациентов лечили препаратом A, вторую группу — препаратом B. Эффективность лекарства A оказалась выше, чем лекарства B, так как в первой группе процент выздоровлений больше. Если же посчитать эффективность в разбивке по полу, то выяснится: препарат B работает лучше в сравнении с A и для мужчин, и для женщин. Нюанс в том, что в первой группе была выше доля женщин, которые в силу своих особенностей реагировали на лечение лучше мужчин.

Парадокс Роджерса, или как манипулируют средними зарплатами

Суть парадокса. Феномен возникает, когда элемент перемещается из одного множества в другое, после чего среднее арифметическое увеличивается сразу в обоих множествах.

Ситуация. Представим, что в какой-то компании есть два отдела:

  1. В отделе A работает 5 человек с зарплатами 50, 60, 70, 80 и 90 тысяч рублей. В среднем они получают 70 тысяч.
  2. В отделе B работает 3 человека с зарплатами 20, 30, 40 тысяч. Здесь в среднем зарабатывают 30 тысяч.

В какой-то момент руководство компании переводит сотрудника с зарплатой в 50 тысяч из отдела A в отдел B. После перехода снова подсчитали среднюю зарплату и обнаружили, что она выросла сразу во всех отделах: в отделе A с 70 до 75 тысяч, а в отделе B — с 30 до 35 тысяч.

Парадокс Роджерса можно наблюдать каждый раз, когда перемещаемый элемент имеет значение ниже среднего в исходной группе, но выше среднего в другой группе, в которую он попадает.

Где еще встречается. Феномен могут использовать в недобросовестных целях, когда нужно отчитаться о росте показателей. Например, можно вывести микрорайон из административных границ одного района и приписать к другому. Тогда чиновник с чистой совестью отчитается о росте показателя, например качества дорог, сразу во всех районах.

Парадокс назвали в честь голливудского актера Уилла Роджерса. Ему приписывают фразу: «Когда Оки  переехали из Оклахомы в Калифорнию, то повысили средний уровень интеллекта обоих штатов».

Жизнь россиян в цифрах: что едят, сколько работают, куда ездят и на что тратят деньги. Подписывайтесь, чтобы не пропустить самое интересное: @t_stata

Николай ВалюхКакие математические парадоксы часто встречаются в реальной жизни?
    Сообщество