Методи математичної статистики в дослідженні проблем педагогіки і психології

Статистичні методи застосовуються при обробці матеріалів психолого-педагогічних досліджень для того, щоб вилучити з отриманих кількісних даних якнайбільше корисної інформації. 

Математична статистика являє собою велику і складну систему знань. Не можна розраховувати на те, що кожен педагог чи психолог повністю опанує цими знаннями. Але основним комплексом простих статистичних методів оволодіти не складно. В даному розділі не будуть наводитись складні теоретичні викладки, а тільки практичні рекомендації по використанню найпростіших методів статистичної обробки психолого-педагогічних досліджень.

Доречне застосування цих методів дозволить досліднику, провівши початкову обробку, одержати загальну картину того, що дають кількісні результати його досліджень, оперативно проконтролювати хід досліджень. 

Але, з самого початку зауважимо, що надмірне захоплення статистикою може навіть зашкодити, якщо аналіз і встановлення причинно-наслідкових зв'язків замінюється набором цифр, складних формул і посилань на різні математичні таблиці.

Математична статистика – не самоціль, а засіб наукового дослідження. Вона не пояснює явищ і не встановлює їх причин, а кількісно описує масові (не одиничні) явища і встановлює емпіричні закономірності.

Не до всіх видів отриманих даних можна застосувати певні статистичні процедури.

В статистичних розрахунках завжди є певна міра умовності, припущення.

Статистичні методи розкривають зв'язки між досліджуваними явищами. Однак необхідно знати, що якою б високою не була імовірність таких зв'язків, вони не дають права досліднику визнати їх причинно-наслідковими відносинами. Статистика змушена приймати до аналізу дані, на які впливає безліч причин. Статистика, наприклад, стверджує, що існує значимий зв'язок між руховою швидкістю і грою в теніс. Але звідси ще не випливає, начебто рухова швидкість і є причина успішної гри. Не можна, принаймні в деяких випадках, виключити і того, що сама рухова швидкість з'явилася наслідком успішної гри.

Щоб підтвердити чи відкинути існування причинно-наслідкових зв'язків і відношень, досліднику доводиться продумувати цілі серії експериментів. 

Знання математичної статистики не може замінити знання сутності питання, яке вивчається.

Дуже важливим у статистиці є поняття сукупності. Генеральна сукупність, чи просто сукупність, – це множина, всі елементи якої володіють якимись загальними ознаками. Так, усі підлітки-шестикласники 12 років (від 11,5 до 12,5) утворять сукупність. Діти того ж віку, але які не навчаються в школі, чи навчаються, але не в шостих класах, не підлягають включенню в цю сукупність.

У ході конкретизації проблем свого дослідження педагогу неминуче доведеться позначити границі досліджуваної ним сукупності. Чи варто включати в досліджувану сукупність дітей того ж віку, але навчаються в коледжах, гімназіях, ліцеях і інших подібних навчальних закладах? У відповіді на цей і на інші такі ж питання може допомогти статистика.

У переважній більшості випадків дослідник не в змозі охопити у вивченні всю сукупність. Доводиться, хоча це і зв'язано з деякою втратою інформації, взяти для вивчення лише частину сукупності, її називають вибірковою сукупністю, або вибіркою. Завдання дослідника полягає в тому, щоб підібрати таку вибірку, що репрезентувала б генеральну сукупність; іншими словами, ознаки елементів сукупності повинні бути представлені у вибірці. Важливо, щоб у вибірці були збережені істотні, з погляду даного дослідження, ознаки сукупності.

Тобто вибіркою називається частина генеральної сукупності, визначена за певними правилами, яка підлягає безпосередньому вивченню.

Важливим завданням статистики є перенесення результатів, отриманих при вивченні вибіркової сукупності з певною мірою припущення на генеральну сукупність. Цей процес називається генералізацією.

Людина в своїй пізнавальній і практичній діяльності завжди здійснює оцінку різних об'єктів, предметів чи явищ. Оцінка – це судження про певний феномен, виражене у кількісній чи якісній формі. Якісні оцінки досліджуваних явищ – характеристика якостей об'єктів без їх співвіднесення з числовим рядом. Кількісні оцінки – результат вимірювання, тобто приписування чисел об’єктам у відповідності з певними правилами.

Вимірювання – це пізнавальна процедура, пов’язана з визначенням числового значення деякої величини за допомогою одиниці вимірювання. Вимірювання ґрунтується на порівнянні однакових властивостей об’єктів. 

Іншими словами, вимірювання являє собою процедуру порівняння досліджуваної величини з однойменною, прийнятою за еталон, зразок.

Необхідно враховувати, що проблема вимірювання в педагогіці ускладнюється тим, що багато змінних педагогічного процесу безпосередньо не можна спостерігати й вимірювати (наприклад, ступінь складності навчального матеріалу, процес переходу знань учнів у їхнє переконання, ефективність дидактичного, методичного чи виховного впливу тощо). В цих умовах застосовують методи побічного вимірювання, тобто безпосередньо спостерігають і вимірюють не ті величини, що вивчають, а інші – які можна спостерігати (індикатори) і які відомим способом пов'язані з досліджуваними змінними величинами.

Так, рівень сформованості навички можна вимірювати за часом, затрачуваним на розв'язування задачі і кількістю допущених помилок.

У дослідженнях отримання кількісних характеристик ґрунтується на застосуванні різного роду шкал. Загалом, шкала являє собою числову систему, в якій співвідношення між якостями об’єктів виражаються якостями числового ряду.

Застосування тих чи інших статистичних методів визначається тим, до якої вимірювальної шкали відноситься отриманий матеріал. Розрізняють чотири типи вимірювальних шкал: шкалу найменувань (чи номінативну, номінальну), шкалу порядку (ординарну), шкалу інтервалів і шкалу відношень.

Знаючи типові особливості кожної шкали, неважко встановити, до якої зі шкал варто віднести матеріал.

Шкала найменувань (номінальна). До цієї шкали відносяться матеріали, у яких досліджувані об'єкти відрізняються один від одного за їх якістю. У номінальній шкалі різним об'єктам приписуються певні числові чи літерні значення в залежності від назв об'єкту. При цьому здійснюється реєстрація і підрахунок об'єктів з даною ознакою (так вимірюється, наприклад, наявність інтересу до певного виду діяльності: 1 – математика, 2 – фізика, 3 – література, 4 – біологія, 5 – техніка, 6 – спорт тощо);

Віднесені до шкали найменувань об'єкти можна розміщати в будь-якій послідовності в залежності від мети дослідження.

З такою шкалою проводити деякі математичні операції некоректно. Визначати можна - процентні відношення та знаходити таку міру центральної тенденції як мода. Мода - це значення змінної, яке найчастіше зустрічається у сукупності (вибірці).

2. Порядкова (ординальна) шкала використовується у тому випадку, коли певна ознака може проявлятись в більшій або меншій мірі, але важко сказати наскільки. Тобто одиниця вимірювання не є величиною постійною. За цією шкалою можна здійснити упорядкування об'єктів за величиною певної ознаки (так вимірюються, наприклад, знання учнів, кваліфікація учителів тощо);

Якщо в шкалі найменувань розміщення досліджуваних об'єктів практично не грає ніякої ролі, то в шкалі порядку – це видно з її назви – саме на цю послідовність переключається вся увага. До цієї шкали такі дослідницькі матеріали, в яких розглядаються об'єкти, що належать до одному чи декільком класам, але відрізняються при порівнянні одного з іншим: менше, нижче і т.п.


Найпростіше показати типові особливості шкали порядку, якщо звернутися до підсумків будь-яких спортивних змагань. Припустимо, що шахіст Д. зайняв у змаганнях перше місце. Виявляється, він набрав 12 очок. Шахіст Е. зайняв друге місце з 10-ма очками. Третє місце зайняв Ж. з 8 очками, четверте – З. з 5-ма очками і т.д.

Відзначимо, що в інших змаганнях розклад абсолютних досягнень може бути іншим: чемпіон, який займає перше місце може усього на пів-очка випереджати найближчих учасників. Важливо, що він набрав найбільшу кількість очок. Тільки від цього залежить його порядкове місце.

Типовим прикладом порядкової шкали є шкільна оцінка. 

1_2__3__4__5__6___7__8___9_10_11____12

Різниця між “12” і “11” не така ж сама, як між “4” і “3”. Крім того, у різних учителів підходи до оцінки дещо різні. Можна сказати, що у цьому випадку одиниця вимірювання не постійна.

Для порядкової шкали виконуються операції знаходження мір центральної тенденції: моди і медіани.

Медіана – це значення, яка ділить навпіл упорядковану множину змінних.

Наприклад, необхідно знайти медіану оцінок контрольної роботи з математики.

Оцінки 2 4 2 5 3 5 4 4 3 4 3

Для того, щоб знайти медіану треба спочатку упорядкувати отримані значення і знайти те значення, яке знаходиться посередині.

2 2 3 3 3 4 4 4 4 5 5 Ме = 4

Якщо кількість значень змінної парна, то медіана дорівнює півсумі двох значень, що розташовані посередині ряду. Наприклад: 1 2 2 3 3 3 4 4 4 4 5 5

Середина ряду знаходиться між 3 і 4, тому Ме = 3,5

Окремим випадком порядкової шкали є рангова шкала, яка передбачає приписування об'єктам певних числових значень (рангів) на основі їх упорядкування за ступенем прояву певної ознаки.

Причому необхідно дотримуватись таких вимог: кількість рангів повинна дорівнювати кількості об'єктів; однаковим об’єктам (тим, які неможливо диференціювати) приписуються однакові ранги.

Наприклад, необхідно проранжирувати 10 учнів класу за їх культурою поведінки (табл.1). Перший ранг приписується учневі з найкращою поведінкою, в нашому випадку це Петренко. Дещо гірша поведінка ніж у Петренка у школяра Сидорова, йому приписується другий ранг. Двоє учнів Карпенко і Геращенко мають гіршу поведінку, ніж Сидоров, але розрізнити їх між собою ми не можемо, вони займають 3-4 місця тому їм приписуються однакові ранги що дорівнюють півсумі їхніх рангів (3+4)/2=3,5. Наступний за рівнем культури поведінки – учень Дмитренко. Йому приписується 5-й ранг (адже 4-й уже зайнятий). Наступні за поведінкою три учні, яких ми не можемо диференціювати: Савченко, Горбенко, Савчук. Вони займають 6-8 місця. Кожному з них приписується (6+7+8)/3=7 ранг. На дев’ятому місці за культурою поведінки знаходиться Воробйов. На останньому – Кулик. Таким чином виконано процедуру ранжирування.

Таблиця 1

Ранжирування учнів

Прізвище учня

Ранг 

1. 

Петренко

1

2. 

Сидоров

2

3. 

Карпенко

3,5

4. 

Геращенко

3,5

5. 

Дмитренко

5

6. 

Савченко

7

7. 

Горбенко

7

8. 

Савчук

7

9. 

Воробйов

9

10. 

Кулик

10

Інтеpвальна – шкала, в якій одиниця вимінювання стала. Нею передбачається зіставлення величини досліджуваної ознаки з певним стандартним інтервалом, який приймають за одиницю міри (так вимірюють, наприклад, швидкість читання учнем тексту).

Цією шкалою виміряється вага (1 кг), довжина (1м), кількість помилок, кількість виконаних завдань і т.д.)

Крім того може застосовуватись шкала відношень (раціональна), якою передбачається співвіднесення величини ознаки з інтервалом можливих її значень. Така шкала має певне нульове значення.

Для такої шкали визначаються всі основні міри центральної тенденції: мода, медіана і середнє арифметичне (математичне очікування).

X- середнє арифметичне. Воно дорівнює сумі всіх значень, поділеній на кількість значень (n).


Підрахунок середнього арифметичного досить простий. Але є свої особливості в його практичному застосуванні. Наведемо такий приклад.

А

Б

n1 = 10

n2 = 20

1 = 4

2 = 8

1,2 - ?

Відразу ж виникає бажання додати середні арифметичні і поділити на два, що значна кількість людей і робить. Але це невірно.



Про параметричні і непараметричні методи статистики. Приступаючи до статистичної обробки своїх досліджень, необхідно вирішити, які методи більш підходять по особливостям даному матеріалу – параметричні чи непараметричні. Розходження між ними легко пояснити.

Наприклад, необхідно здійснити вимірювання рухової швидкості учнів з допомогою елементарної методики: підрахувати кількість крапок, які проставляє учень на папері за проміжок часу, що дорівнює одній хвилині. З кожним учнем проводиться 5 дослідів. Потрібно записати всі зроблені виміри – у даному випадку це буде число крапок, поставлених кожним випробуваним, – потім потрібно обчислити для кожного випробуваного середнє арифметичне за результатами дослідів. Далі варто розташувати всі ці дані в їхній послідовності, наприклад, починаючи з найменших до найбільшого. Для полегшення наочності цих даних їх звичайно поєднують у групи; у цьому випадку можна об'єднати по 5–9 вимірів у групі. Узагалі ж при такім об'єднанні бажано, якщо загальне число випадків не більш ста, щоб загальне число груп було близько дванадцяти. Вийшла така таблиця.

У досвідах брали участь 50 випробуваних. Обчислено середню арифметичну кожного випробуваного. Отриманий ряд упорядкований і всі індивідуальні результати представлені в послідовності від меншого до більшого:

85 – 93 – 93 – 99 – 101 – 105 – 109 – 110 – 111 – 115 –

115 – 116 – 116 – 117 – 117 – 117 – 118 – 119 – 121 – 121 –

122 – 124 – 124 – 124 – 124 – 125 – 125 – 125 – 127 – 127 –

127 – 127 – 127 – 128 – 130 – 131 – 132 – 132 – 133 – 134 –

134 – 135 – 138 – 138 – 140 – 143 – 144 – 146 – 150 – 158

Для подальшої обробки зручніше ці первинні дані з'єднати в групи, тоді чіткіше виступає властивий даному ряду розподіл величин і їхній чисельностей. Почасти спрощується й обчислення середнього арифметичного і середнього квадратичного відхилення. 

При виборі групового інтервалу варто взяти до уваги такі умовності. Якщо ряд не дуже великий, наприклад містить до 100 елементів, то і число груп не повинне бути дуже великим, наприклад, порядку 10–12. Бажано, щоб при групуванні початкова величина – при дотриманні послідовності від меншої величини до більшого – була менше найменшої величини ряду, а найбільша – більше найбільшої величини досліджуваного ряду. Якщо ряд, як у даному випадку, починається з 85, групування потрібно почати з меншої величини, а оскільки ряд завершується числом 158, то і групування повинне завершуватися більшою величиною. У ряді, що нами вивчається, з урахуванням висловлених умов можна вибрати груповий інтервал у 9 одиниць і зробити розбивку ряду на групи, почавши з 83. Тоді остання група буде завершуватися величиною, що перевищує значення останньої величини ряду (тобто 158). Число груп буде дорівнює 9 (табл. 2).

Обчислення середнього арифметичного і середнього квадратичного відхилення.

Таблиця 2

Групи

Середні значення

Підсумки рознесення

F×x

x – x

(х -x)2

f× (x -х)2

83–91 

87 

87 

36 

1296 

1296 

92–100

96 

288 

27 

729 

2187 

101–109

105 

315 

18 

324 

972 

110–118

114 

10 

1140 

81 

810 

119–127

123 

16 

1968 

128–136

132 

1188 

81 

729 

137–145

141 

705 

18 

324 

1620 

146–154

150 

300 

27 

729 

1458 

155–163

159 

159 

36 

1296 

1296 



n = 50

Σf × x= 6150 



Σf × (x -х)2= 10368

1-й стовпець – групи, отримані після розбивки досліджуваного ряду.

2-й стовпець – середні значення кожної групи; цей стовпець показує, у якому діапазоні варіюють величини досліджуваного ряду, тобто х.

3-й стовпець показує результати “ручної” рознесення величин чи ряду іксів: кожна величина занесена у відповідну її значенню групу у виді риски.

4-й стовпець – це підсумок підрахунку результатів рознесення.

5-й стовпець показує, скільки разів зустрічалася кожна величина ряду – це добуток величин другого стовпця на величини 4-го стовпця по рядках. Підсумки 4-го і 5-го стовпців дають суми, необхідні для обчислення середнього арифметичних.

6-й стовпець показує різниця середнього арифметичного і значення x по кожній групі.

7-й стовпець – квадрат цих різниць.

8-й стовпець показує, скільки разів зустрічався кожен квадрат різниці; підсумовування величин цього стовпця дає підсумок, необхідний для обчислення середнього квадратичного відхилення.

У заголовках 5-го і 8-го стовпців указується, наскільки часто зустрічається та чи інша величина. Частота позначається буквою f (від англійського слова frequency).

Включення букви f, що означає, наскільки часто зустрічалася та чи інша величина, нічого не змінює у формулах середнього арифметичного і середнього квадратного відхилення.

Далі потрібно установити, скільки разів у дослідах зустрілися числові значення, що відповідають кожній групі. Зробивши це, потрібно для кожної групи записати її чисельність. Отримані в такій таблиці дані звуться розподілу численності. Рекомендується представити цей розподіл у виді діаграми – полігона розподілу. Контури цього полігона допоможуть вирішити питання про статистичні методи обробки. Нерідко вони нагадують контури дзвону, з найвищою точкою в центрі полігона з симетричними гілками, що відходять у ту й іншу сторону. Такий контур відповідає кривій нормального розподілу. Це поняття було введено в математичну статистику К.Ф. Гаусом (1777–1855), тому криву іменують також кривю Гауса. Для побудови кривої Гауса (чи кривої нормального розподілу) теоретично потрібно дуже велику кількість випадків. Практично ж доводиться задовольнятися тим фактичним матеріалом, що накопичений у дослідженні. Якщо дані, якими оперує дослідник, при їхньому уважному розгляді чи після переносу їх на діаграму, лише в незначному ступені розходяться з кривою нормального розподілу, то це надає право досліднику застосовувати в статистичній обробці параметричні методи, вихідні положення яких ґрунтуються на нормальній кривій розподілу Гауса. Нормальний розподіл називають параметричним тому, що для побудови й аналізу кривої Гауса досить мати всього два параметри: середнє арифметичне, значення якого повинно відповідати висоті перпендикуляра, відновленого в центрі кривої, і так називане середнє квадратичне, чи стандартне, відхилення – величини, що характеризує розмах коливань даної кривої; про способи обчислення тієї й іншої величини буде далі розказано.

Параметричні методи мають багато переваг, але їх застосування правомірне тільки тоді, коли оброблювані дані мають розподіл, що лише несуттєво відрізняється від гаусового.

При неможливості застосувати параметричні методи, слід звернутися до непараметричних. Ці методи успішно розроблялися в останні 3–4 десятиліття, і їхня розробка була викликана насамперед потребами ряду наук, зокрема, психології. Вони показали свою високу ефективність. Разом з тим вони не вимагають складної обчислювальної роботи.

Сучасному досліднику в галузі педагогіки і психології потрібно виходити з того, що існує велика кількість даних, які або взагалі що не піддаються аналізу за допомогою кривої нормального розподілу, або не задовольняють основним передумовам, необхідним для її використання

Крім показників центральної тенденції, широко застосовуються міри розсіяння – показники, які хаpактеpизують ступінь однорідності вибірок.

Наприклад, учні двох класів (А і Б) виконували завдання з математики. Фіксувалась кількість правильно виконаних завдань (табл. 3).

Таблиця 3

Клас

Кількість виконаних завдань

Сума

С.а.

max

min

h


"А"

2

4

1

5

5

1

0

6

2

4

30

3

6

0

6


"Б"

2

4

3

3

3

3

4

4

2

2

30

3

4

2

2


Якщо брати до уваги середнє арифметичне, то два класи абсолютно не різняться між собою. Але навіть на перший погляд зрозуміло, що в класі "Б" учні за знаннями однорідніші, ніж у класі "А".

Тому для більш повної характеристики досліджуваних масових явищ необхідно ввести крім мір центральної тенденції, які вказують на найбільш типові значення змінної, ще й показники, які характеризують ступінь однорідності значень змінної – показники розсіяння.

Найпростішим показником розсіяння є h - розмах варіації, який дорівнює різниці між максимальним і мінімальним значеннями змінної.

h = Х мах - Х міn 

де h – розмах ваpіації; Х мах – максимальне значення змінної;

Х міn – мінімальне значення змінної.

Для нашого прикладу h=6-0=6; h=4-2=2 

Цей показник незручний тим, що на нього впливають випадкові екстремальні значення змінної. Стандартне відхилення (с.в.) - (сигма)


xi – окреме значення змінної;

n – кількість значень.

Чим більша величина стандартного відхилення, тим різнорідніша глупа.

Стандартне відхилення в гpупі, де всі значення однакові дорівнює 0.

Наступним етапом є порівняння двох сукупностей (вибірок). У педагогічних дослідженнях дуже часто треба довести наявність чи відсутність істотної різниці між двома вибірками, наприклад, між експериментальним і контрольним класом (чи групою). Для цього існують спеціальні статистичні критерії.

Пеpший показник – F-кpитеpій (критерій Фішера) – пpизначений для поpівняння гpуп за показником pозсіяним.


Отриманий при підрахунку показник Fемп. порівнюється з табличним значенням для даної кількості об'єктів. Якщо Fемп. ≥ Fтабл., то сукупності (гpупи) суттєво pізняться за показниками pозсіяними. Якщо навпаки, то гpупи подібні. Fтабл. визначається за спеціальними статистичними таблицями.

Часто користуються t-критерієм (критерієм Стьюдента), який не потребує складних математичних обчислень і, що дуже важливо, придатний для малих вибірок (які склада­ються не менш ніж з 30 вимірювань). За допомогою t-критерію встановлюють рівень статистичної значущості різниці між двома вибірками, кожна з яких представлена середнім ариф­метичним.

t - кpитеpій (кpитеpій Стьюдента)


де х1 – середнє значення змінної першої сукупності

х2 – середнє значення змінної другої сукупності

Якщо tемп. більше за tтабл., то групи суттєво різняться за середніми арифметичними.

Дальшим розвитком техніки критерію є метод дисперсійного аналізу, який дає можливість організувати комплексний багатофакторний педагогічний експеримент і оцінити статистичну значущість впливу досліджуваних факторів і їх комбінацій на показник, який вивчається. Основна ідея методу полягає в порівнянні дисперсій, тобто квадратів середніх квадратичних відхилень, які відповідають впливові різних факторів. Застосування дисперсійного аналізу при вмілому плануванні експерименту дає змогу одержати значні кількості інформації при великій економії експериментального часу.

Зупинимось на основних обов'язкових етапах математичного дослідження педагогічних явищ. Насамперед слід дістати випадкову вибірку. Конкретне педагогічне дослідження завжди проводиться на обмеженому колі явищ, які й називають вибіркою. Щоб встановити, наприклад, як впли­ває розгляд проблемних ситуацій чи дидактична гра на якість засвоєння навчального матеріалу, проводять спостереження або експерименти в обмеженій кількості шкіл і класів з обмеженою кількістю учнів.

Однак одержані висновки часто бажано поширити на більшу сукупність. Для цього вибірка (в даному випадку – група школярів) не повинна бути дібраною з тих чи інших міркувань за певною ознакою: за якістю викладання, попередньою успішністю, за оточенням школи тощо.

Далі знаходять величини, які характеризують вибірку. Такими величинами звичайно беруть:

- величину, яка найчастіше зустрічається – моду;

- центральну величину за місцем, яке вона посідає в ряду вимірювань – медіану;

- середню арифметичну.

Однак цих величин не досить для характеристики вибірки, оскільки вони не показують, наскільки далекими одне від одного є окремі вимірювання. За міру розсіювання вибірки звичайно беруть середнє квадратичне (або стандартне) відхилення.