Статистические методы, используемые в маркетинговых исследованиях - стр. 6
2.3 Регрессия логистическая. Регрессия мультиномиальная логистическая
Регрессия логистическая
Под регрессией логистической или логит-регрессией понимают статистическую модель, используемую, чтобы предсказывать вероятности возникновения какого-то события посредством логистической функции. Эта регрессия относится к классу моделей бинарного выбора, в которых зависимая переменная является дихотомической (бинарной).
Зависимой переменной могут приниматься только значения в количестве двух и означать, к примеру, принадлежность к конкретной группе (скажем, к группе надежных клиентов либо ненадежных клиентов), совершаемое действие (покупка либо непокупка товара),ответы «да» либо «нет» (рекламный ролик нравится либо не нравится).
Построение обыкновенной регрессионной модели линейного типа с зависимыми бинарными переменными не допускается ввиду того, что если это построение будет иметь место, предсказанные значения зависимой переменной интерпретировать окажется практически невозможно.
Измерения значений факторов в моделях бинарного выбора – только количественные. В эти модели допускается включение категориальных переменных (выступающих в качестве факторов). В данных моделях обеспечивается построение регрессионной модели зависимости с принятием во внимание вероятности, что результативной дихотомической переменной будет принято значение 0 или 1, если значение факторов – заданное.
Для того чтобы смоделировать вероятность зависимой дихотомической переменной, нужно произвести подбор специальной монотонно возрастающей функции, значения которой могут варьироваться лишь от 0 до 1.
В моделях бинарного выбора в качестве специальной функции может быть выбрана функция: 1) логистическая; 2) стандартного нормального распределения.
Если модель бинарного выбора построена на базе логистической функции, то она рассматривается как логистическая регрессия или логит-модель. Если модель бинарного выбора построена на базе функции, стандартного нормального распределения, то ее рассматривают как пробит-модель.
Посредством логистической регрессии осуществляется прогнозирование вероятности отклика для зависимой переменной от переменных независимых, которые включены в модель. Прогнозные значения вероятности можно использовать для разделения наблюдений на две группы.
При построении модели регрессии логистической можно осуществить отдельный анализ – анализ Receiver Operator Characteristic (ROC-кривых). Посредством данного анализа можно осуществить выбор оптимального порогового значения вероятности для классификации. ROC-кривую используют, чтобы представить результаты бинарной классификации и оценки уровня ее эффективности.