ДИСПЕРСИЯ ОБЪЯСНЕННАЯ

ДИСПЕРСИЯ ОБЪЯСНЕННАЯ (доля объясненной дисперсии) — универсальная мера качества (объясняющей способности) причинных статистических моделей, применяется, главным образом, в анализе дисперсионном (см.) и анализе регрессионном (см.). В некоторых случаях используется также в качестве меры связи (см. Корреляционное отношение). Интерпретируется как доля дисперсии зависимой переменной y, объясненная изменениями независимой переменной x.

Основная идея разделения дисперсии зависимой переменной y на Д.О. и дисперсию ошибки состоит в предположении, что полная вариация зависимой переменной у определяется двумя группами факторов: учтенными факторами, зафиксированными в виде независимых переменных, и неучтенными факторами, представленными «ошибками модели» εi = yi — ŷi, где εi — ошибка модели для объекта с номером i; yi — измеренное значение переменной у для объекта с номером i; ŷi — значение переменной у для объекта с номером i, предсказанное по модели. Заметим, что традиционно речь идет о доле Д.О., хотя вместо дисперсии используется сумма квадратов (см.).

Согласно этой концепции, полная (общая) сумма квадратов может быть разложена на сумму квадратов объясненную и сумму квадратов ошибки SSошибки = ∑ εi² = ∑ (yi — ŷi)² :

SSобщая = SSобъясненная + SSошибки .

>Если разделить обе части этого выражения на величину SSобщая , то доля Д.О. может быть представлена следующим образом:

SSобъясненная / SSобщая = 1 — SSошибки / SSобщая = 1 — ∑ (yi — ŷi)² / ∑ (yi — y)² .

Вычисление доли Д.О. для разных моделей различается способами получения предсказанного значения ŷi. С этим связаны и различия в названиях составляющих общей суммы квадратов. Для регрессионных моделей предсказанное значение вычисляется по уравнению регрессии: ŷi = f(xi), поэтому SSобъясненная называется для них SSрегрессии . В частности, для уравнения регрессии линейной парной (см.) доля Д.О. (коэффициент детерминации — см.) равна квадрату коэффициента линейной корреляции Пирсона r²; для регрессии линейной множественной (см.) — квадрату коэффициента корреляции множественной R².

В анализе дисперсионном (см.) и корреляционном отношении ŷi определяется как среднее арифметическое (см.) переменной у для той группы объектов, в которую входит объект с номером i. Поэтому SSошибки в этих методах носит название SSвнутригрупповая, а SSобъясненная — название SSмежгрупповая.

О.В. Терещенко