DUMMY-КОДИРОВАНИЕ

DUMMY-КОДИРОВАНИЕ — техника, позволяющая представлять номинальную переменную (см.) в виде набора дихотомических переменных. Используется при необходимости включать номинальные переменные в многомерные статистические модели.

Пусть номинальная переменная х имеет k значений. Одно из них объявляется референтным (для простоты изложения, пусть это будет значение xk). Для каждого из оставшихся значений x1, x2,…, xk-1 создается новая дихотомическая dummy-переменная по следующему правилу: если x = i, то xi = 1. Во всех остальных случаях xi = 0. Связь между исходной переменной х и набором соответствующих ей dummy-переменных можно представить в виде таблицы (k = 5):

Dummy-переменные

Значения переменной x

1

2

3

4

5

x1

1

0

0

0

0

x2

0

1

0

0

0

x3

0

0

1

0

0

x4

0

0

0

1

0

Таким образом, совокупность k — 1 dummy-переменных полностью представляет исходную номинальную переменную.

>При включении dummy-переменных в регрессионное уравнение (см. Анализ регрессионный) полученные для них коэффициенты интерпретируются по отношению к референтному значению исходной переменной x = k : коэффициент bi для dummy-переменной xi показывает, насколько изменится предсказанное значение зависимой переменной при x = i по сравнению с предсказанным значением при x = k.

О.В. Терещенко