Методы оценки критериев качества тестов

Классическая теория тестов опирается на теорию корреляции, главными параметрами которой являются надежность и валидность. Основы классических тестов составляет идея их параллельности. Параллельными называются тесты, в которых истинные и ошибочные компоненты равны на одной и той же выборке испытуемых. Они имеют одни и те же элементы содержания, одну и ту же трудность заданий.
Надежность — устойчивость результатов теста, получаемых при его применении. Существуют следующие методы оценивания надежности:
1. Параллельное тестирование в двух группах.
2. Ретестовая надежность (повторное тестирование).
3. Расщепление теста (тест расщепляют на две части по четным и нечетным номерам заданий). Чем выше корреляция между двумя частями, тем выше надежность. Существуют тесты на выявление знаний.

Валидность — пригодность теста, т.е. способность качественно измерять то, для чего он создан по замыслу авторов. Оценка валидности производится по результатам тестирования и результатам экзамена и профессиональной деятельности, которые должны иметь высокий уровень корреляции.
Раньше данные тестирования подвергались статистической обработке, а сегодня конечный результат достигается с помощью математического структурного анализа. Теория математического структурного анализа основывается на том, что человеческие знания имеют некоторую латентную переменную. Идея переменной (параметра) и легла в основу тестирования. Главное предположение матструктурного анализа состоит в том, что между результатами теста и измеряемыми параметрами есть функциональная зависимость, позволяющая с помощью анализа и оценки этих параметров создавать представление о знании Человека.
Недостатки традиционного тестирования.
• зависимость оценки знаний от уровня трудности заданий;
• зависимость оценки трудности задания от уровня подготовленности студентов;
• один инструмент оценки не может оценивать разное знание студентов.