ДОСТОВЕРНОСТЬ РЕЗУЛЬТАТОВ ЕКСПЕРЕМЕНТА

Как уже отмечалось, основным свойством педагогических процессов, явлений является их вероятностный характер (при данных условиях они могут произойти, реализоваться, но могут и не произойти). Для таких явлений существенную роль играет понятие вероятности.
Вероятность (Р) означает степень возможности осуществления данного события, явления, результата. Вероятность невозможного события равна нулю, достоверного — единице (100%). Вероятность любого события лежит в пределах

    Если в эксперименте получен какой-то количественный результат (X), то возникает вопрос: какова вероятность того, что этот результат будет получен в повторном эксперименте при тех же условиях.
    Математическая статистика отвечает на этот вопрос так: вероятность точного повторения результата приближается к нулю.
    Но, если задать некоторую область значений результата (так называемый доверительный интервал

Х_ДОВ), то можно говорить об определенной вероятности того, что результат повторного эксперимента будет находиться в пределах этой области.
Достоверностью (надежностью, значимостью) Р среднего результата серии педагогических измерений будем называть вероятность того, что среднее значение измеряемого параметра при повторном эксперименте попадает в данный доверительный интервал.
Итак, результат серии педагогических измерений должен быть выражен средним арифметическим с указанием доверительного интервала и достоверности._ДОВ(с достоверностью=Р) (5)

В этой формуле заключается статистический смысл принципа воспроизводимости педагогического эксперимента: если повторить (или дублировать) эксперимент, то его результат будет с определенной вероятностью находиться в пределах доверительного интервала .
В строгом научном эксперименте принято добиваться не менее, чем 95%-ной достоверности, хотя в ряде случаев (например, в разведывательном эксперименте) оправдан и 50%-ный уровень.
Определение доверительного интервала. Между числом измерений, величиной доверительного интервала и достоверностью существует определенная зависимость. Для малых по объему выборок (что чаще всего и имеет место в педагогическом эксперименте) эта зависимость исследована английским математиком Стьюдентом (Госсетом) и отображена в таблице 1.

Таблица 1. Коэффициент Стьюдента

n/p	0,8	0,9	0,95	0,98	0,99
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ?	3,08 1,89 1,64 1,53 1,48 1,44 1,42 1,40 1,38 1,37 l,363 1,36 1,35 1,35 1,34 1,34 1.33 1,33 1,33 1,38 1,32 1,32 1,32 1,32 1,32 1,32 1,31 1,31 1,31 1,30 1,30 1,29 1,28	6,31 2,92 2,35 2,13 2,02 1,94 1,90 1.86 1,83 1,81 1,80 1,78 1,77 1,76 1,75 1,75 1,74 1,73 1,73 1,73 1,72 1,72 1,71 1,71 1,71 1,71 1,70 1,70 1,69 1,68 1,67 1.66 1,65	12,71 4,30 3.18 2,77 2,57 2,45 2,36 2,31 2,26 2.23 2,20 2,18 2,16 2,14 2,13 2,12 2,11 2,10 2,09 2,09 2,08 2,07 2,07 2.06 2,06 2,06 2,05 2,05 2,05 2,02 2,00 1,98 1,96	31,8 6,96 4,54 3,75 3,36 3.14 3,00 2,90 2,82 2,76 2,72 2,68 2,65 2,62 2,60 2,58 2,57 2,55 2,54 2,53 2,52 2,51 2,50 2,49 2,49 2,48 2,47 2,47 2,46 2,42 2,39 2,36 2,33	63,7 9,92 5,84 4,60 4,03 4,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95, 2,92 2,90 2,88 2,86 2,85 2,83 2,82 2,81 2,80 2,79 2,78 2,77 2,76 2,76 2,70 2,66 2,62 2,58

    Для определения доверительного интервала по методу Стьюдента-Госсета:
    а) по формуле [1] рассчитывают среднее арифметическое значение параметра — ;
    б) по формуле [4] рассчитывают среднюю квадратичную ошибку среднего —
    в) задаются необходимой величиной достоверности Р;
    г) по известному числу расчетных данных (количеству объектов) и требуемой достоверности входят в таблицу 1 и определяют коэффициент Стьюдента — ;
    д) доверительный интервал определится так

(с достоверностью=Р)

Результат экспериментальной серии n изменений в методике Стьюдента выражается так

    Пример. Рассчитать результат (средней балл и доверительный интервал) срезовой контрольной работы в экспериментальном классе. Всего учащихся — 30 человек, из них получили оценки: “5” — 6 человек; “4” — 10; “3” — 12; “2” — 2 человека.
    Расчет
    а) Средний балл Х =

б) Средняя квадратичная ошибка среднего

Image32.gif (1371 bytes)

в—г) Задаемся 95%. достоверностью и по таблице 1 находим

д) Вычисляем доверительный интервал;

Результат контрольной работы

Значит, результат аналогичной повторной контрольной работы в этом классе будет с 95% вероятностью лежать в этой области (от 3,5 балла до 3,9 балла).

    Достоверность сравнения. Средние значения параметров педагогического процесса, полученные в результате срезовых измерений в различных группах (экспериментальной и контрольной) могут быть близкими, но никогда не бывают одинаковыми ( и ). Вывод же о справедливости гипотезы может быть сделан на основании заключения либо о различии, либо о сходстве результатов.
    Для того, чтобы определить, является ли разность между и существенной (статистически достоверной) выполняются следующие операции:
    а) для обеих групп объектов задается одинаковый уровень достоверности (к примеру Р=0,9);
    б) вычисляются средние арифметические значения для групп и ;
    в) вычисляются средние квадратичные ошибки средних значений ;
    г) по таблице для каждой группы определяется коэффициент Стьюдента ;
    д) определяются доверительные интервалы;

е) вычисляется разность -;
Если окажется, что

то разница между показателями должна считаться существенной с достоверностью Р == 0,9.
Если окажется, что

то должно считаться существенным сходство между результатами обеих групп.
Если окажется, что

то следует

    При этом экспериментатор должен помнить, что cущecтвoвание значимой разницы или сходства количественных показателей без поддержки другими аргументами нельзя брать в основу выводов (особенно в сомнительных случаях).
    Правомерность применения статистик. Статистические показатели, получаемые на основе номинальных и порядковых измерений, предоставляют экспериментатору богатый аналитический материал, однако их следует использовать весьма осторожно и обязательно вместе с материалом, полученным из других источников. Статистические характеристики предназначены прежде всего для обработки измерений, выраженных в интервальной шкале. Операции же с номинальными и порядковыми показателями осуществляются условно (с определенной степенью огрубления) и допустимы лишь в рамках межгруппового сравнения.
    В частности, в педагогической литературе существует различное мнение о возможности применения методов математической статистики к данным школьной пятибалльной системы оценок. То обстоятельство, что эти отметки - всего лишь ранговые величины, которые следует считать субъективной порядков оценкой, а не точным интервальным измерением, делает несостоятельными в применении к ним методы параметрического статистического анализа.
    Примечание. Если говорить о субъективизме, то в других, считающихся гораздо более объективными, методах измерения психолого-педагогических характеристик (к примеру, подсчет количества ошибок, действий, реакций, времен, сил и т. п.) субъективный фактор присутствует не в меньшей степени, чем в балльной оценке.
    Рекомендация. В практике нестрогого экспериментирования целесообразно данные статистического анализа использовать для выработки решений и выводов наряду с разнообразными качественными характеристиками педагогического процесса и другими материалами.

: Категорія: Скарбничка

Категорії

ДОСТОВЕРНОСТЬ РЕЗУЛЬТАТОВ ЕКСПЕРЕМЕНТА