Открыть главное меню

IQR

Межквартильный размах (IQR) — простыми словами

Межквартильный размах, или IQR (от англ. *interquartile range*), — это способ оценить разброс «средней части» данных без учёта крайних значений. Он показывает, как «раскиданы» центральные 50 % наблюдений.

Что такое квартиль и как считается IQR

1. Упорядочьте все данные по возрастанию.

2. Разделите «упорядоченный» ряд на две половины (нижнюю и верхнюю).

3. Первый квартиль (Q1) — это медиана нижней половины данных (то есть значение, которое отделяет нижние 25 % от остальных).

4. Третий квартиль (Q3) — медиана верхней половины данных (то есть точка, отделяющая верхние 25 %).

5. IQR = Q3 − Q1.

Таким образом, IQR показывает протяжённость диапазона, в котором лежат средние 50 % значений.

Преимущество такой меры — устойчивость к выбросам: поскольку она не зависит от самых крайних значений, влияние экстремальных точек меньше.

Как IQR используется для обнаружения выбросов

Для того чтобы понять, какие значения можно считать «аномальными», часто используют так называемые «усы» (fences):

- Нижняя граница = Q1 − 15 × IQR

- Верхняя граница = Q3 + 15 × IQR (не используется на платформе)

Если значение выходит за эти границы (меньше нижней или больше верхней), его можно считать выбросом.

Коэффициент 15 - эмпирически подобран на основе обратной связи

Почему IQR часто предпочтительнее других мер разброса

Мера разброса Чувствительность к выбросам Когда хорошо подходит
Размах (max − min) Очень чувствителен Когда выборка чистая, без выбросов
Стандартное отклонение Средняя чувствительность Когда распределение близко к нормальному
IQR Низкая чувствительность При наличии выбросов или несимметричных распределениях


IQR не требует предположений о форме распределения и даёт «честную» оценку того, как сильно варьируются данные в их средней части.

Сравнительный анализ распределений с помощью IQR

Когда нужно сравнить разные группы данных (например, доходы в разных регионах):

1. Сравните сами значения IQR: в какой группе разброс внутри центральных 50 % больше.

2. Посмотрите отношение IQR к медиане (IQR / медиана) — покажет, насколько «относительный» разброс велик.

3. Посмотрите, как распределено расстояние от медианы до Q1 по сравнению с расстоянием от медианы до Q3 ((Q3 − Q2)/(Q2 − Q1)) — это даёт представление об асимметрии.


Так вы можете судить не только о «разбросе», но и о том, как распределение «сдвинуто» в ту или иную сторону.

Когда и где IQR полезен на практике

IQR широко применяется в разных областях:

- При очистке данных — чтобы обнаруживать и исключать выбросы.

- В финансах — оценка волатильности активов и обнаружение необычных сделок.

- В контроле качества — отслеживать стабильность процессов.

- В маркетинге — анализ восприятия клиентов, вариативность поведения.

- В медицине, спорте, логистике — для анализа биологических показателей, результатов и времени доставки.