Открыть главное меню

IQR: различия между версиями

Строка 33: Строка 33:
  
 
==Почему IQR часто предпочтительнее других мер разброса==
 
==Почему IQR часто предпочтительнее других мер разброса==
 +
{| class="wikitable"
 +
|+
 +
!Мера разброса
 +
!Чувствительность к выбросам
 +
!Когда хорошо подходит
 +
|-
 +
|Размах (max − min)
 +
|Очень чувствителен
 +
|Когда выборка чистая, без выбросов
 +
|-
 +
|Стандартное отклонение
 +
|Средняя чувствительность
 +
|Когда распределение близко к нормальному
 +
|-
 +
|IQR
 +
|Низкая чувствительность
 +
|При наличии выбросов или несимметричных распределениях
 +
|}
  
  

Версия 10:33, 8 октября 2025

Межквартильный размах (IQR) — простыми словами

Межквартильный размах, или IQR (от англ. *interquartile range*), — это способ оценить разброс «средней части» данных без учёта крайних значений. Он показывает, как «раскиданы» центральные 50 % наблюдений.

Что такое квартиль и как считается IQR

1. Упорядочьте все данные по возрастанию.

2. Разделите «упорядоченный» ряд на две половины (нижнюю и верхнюю).

3. Первый квартиль (Q1) — это медиана нижней половины данных (то есть значение, которое отделяет нижние 25 % от остальных).

4. Третий квартиль (Q3) — медиана верхней половины данных (то есть точка, отделяющая верхние 25 %).

5. IQR = Q3 − Q1.

Таким образом, IQR показывает протяжённость диапазона, в котором лежат средние 50 % значений.

Преимущество такой меры — устойчивость к выбросам: поскольку она не зависит от самых крайних значений, влияние экстремальных точек меньше.

Как IQR используется для обнаружения выбросов

Для того чтобы понять, какие значения можно считать «аномальными», часто используют так называемые «усы» (fences):

- Нижняя граница = Q1 − 1,5 × IQR

- Верхняя граница = Q3 + 1,5 × IQR

Если значение выходит за эти границы (меньше нижней или больше верхней), его можно считать выбросом.

Коэффициент 1,5 — широко принятый стандарт. В зависимости от задачи его могут менять (например, 2,0 или 3,0), чтобы делать более строгий или мягкий фильтр.

Почему IQR часто предпочтительнее других мер разброса

Мера разброса Чувствительность к выбросам Когда хорошо подходит
Размах (max − min) Очень чувствителен Когда выборка чистая, без выбросов
Стандартное отклонение Средняя чувствительность Когда распределение близко к нормальному
IQR Низкая чувствительность При наличии выбросов или несимметричных распределениях


IQR не требует предположений о форме распределения и даёт «честную» оценку того, как сильно варьируются данные в их средней части.

Сравнительный анализ распределений с помощью IQR

Когда нужно сравнить разные группы данных (например, доходы в разных регионах):

1. Сравните сами значения IQR: в какой группе разброс внутри центральных 50 % больше.

2. Посмотрите отношение IQR к медиане (IQR / медиана) — покажет, насколько «относительный» разброс велик.

3. Посмотрите, как распределено расстояние от медианы до Q1 по сравнению с расстоянием от медианы до Q3 ((Q3 − Q2)/(Q2 − Q1)) — это даёт представление об асимметрии.


Так вы можете судить не только о «разбросе», но и о том, как распределение «сдвинуто» в ту или иную сторону.

Когда и где IQR полезен на практике

IQR широко применяется в разных областях:

- При очистке данных — чтобы обнаруживать и исключать выбросы.

- В финансах — оценка волатильности активов и обнаружение необычных сделок.

- В контроле качества — отслеживать стабильность процессов.

- В маркетинге — анализ восприятия клиентов, вариативность поведения.

- В медицине, спорте, логистике — для анализа биологических показателей, результатов и времени доставки.