Айтрекинг в психологической науке и практике - стр. 55
Обучение модели заключается в настройке ее параметров таким образом, чтобы получаемые предсказания значений целевой переменной отличались от реальных измеренных значений как можно меньше в терминах используемой меры ошибки. Освещение тех или иных алгоритмов обучения предсказательных моделей, равно как и подходов к оценке ее обобщающей (предсказательной) способности (напр., методика скользящего контроля), подробности методов распознавания образов и такого научного направления, как машинное обучение, можно уточнить, например, в соответствующих изданиях (Воронцов, 2007; Лепский, Броневич, 2009; Alpaydin, 2010).
Обученная модель в случае высокой степени ее предсказательной способности может успешно использоваться для предсказания значений целевых переменных: как дискретных категорий испытуемых (таких как, напр., индикатор правильности выполненного задания теста способностей, пол испытуемого, уровень навыка чтения), так и соответствующих им непрерывных случайных величин (таких, напр., как возраст, итоговый балл по тесту).
Интерпретация модели. Обученная и надежная модель представления закономерностей часто может быть легко интерпретирована путем определения входных переменных, учитываемых при принятии решения в первую очередь (или с большим весом). Например, такие модели, как деревья решений, обобщенная линейная модель или дискриминантная модель, не только способны решать задачу предсказания значения целевой переменной, но и позволяют трактовать прогноз в терминах предметной области путем анализа структуры модели и ее идентифицированных параметров.
В случае деревьев решений объяснение может строиться путем выписывания последовательности условий, проверенных для данного испытуемого на пути от корня дерева до листа. Эти условия образуют конъюнкцию, т. е. легко интерпретируемое логическое правило (Воронцов, 2007). Пример дерева, построенного с использованием выборки значений интерпретированных выше главных компонент SR-матриц и предсказывающего успешность выполнения задания теста Равена, приведен на рисунке 5.
Рис. 5. Дерево классификации, позволяющее правильно (в 70 % случаев) предсказывать результат выполнения задания («Выполнил верно» – «Pass» и «Выполнил неверно» – «NotPass») по величинам главных компонент «Horis» («He использовать горизонтальные переходы и использовать вертикальные») и «Vertic» («Использовать вертикальные переходы в правой нижней части матрицы Равена»)
В целом данное дерево можно интерпретировать следующим образом: если испытуемый придерживается определенных стратегий глазодвигательной активности, то скорее всего задания теста Равена будут пройдены успешно. Однако, если испытуемый зацикливается при рассмотрении элементов матрицы задания по углам, т. е. в верхней левой либо в нижней правой частях, то, вероятно, он не может установить зависимость между элементами матрицы задания и само задание пройдено не будет.