Статистика — наука, яка вивчає методи кількісного охоплення і дослідження масових, зокрема суспільних, явищ і процесів. Збирання інформації про них сягає найдавніших часів. Вона мала спершу наскрізь практичний характер; з XIX ст. статистика поступово здобуває солідну наукову основу, коли почалося впорядкування і вдосконалення статистичних методів. З них розвинулися дві основні: описова (дескриптивна) — збирання інформації, перевірка її якості, її інтерпретація, зображення статистичного матеріалу; та індуктивна — застосуваннятеорії ймовірності, закону великих чисел. Статистика поділяється за своїм змістом на демографічну, економічну, фінансову, соціальну, санітарну, судову, біологічну, технічну тощо;математична статистика вивчає математичні методи систематизації, обробки й використання статистичних даних для наукових і практичних висновків

Основні поняття (категорії) статистики

Статистична сукупність — це маса однорідних в певному відношенні елементів, які мають єдину якісну основу, але різняться між собою певними ознаками і підлягають певномузакону розподілу. Статистична сукупність — це певна множина елементів, поєднана умовами існування і розвитку.

Однорідна сукупність — якщо одна чи декілька ознак, що вивчаються, є загальними для всіх одиниць. Різнорідна сукупність об'єднує явища різного типу.

Одиниця сукупності — це первинний елемент статистичної сукупності, який є носієм ознак, що підлягають реєстрації і є основою обліку.

Ознака — властивість окремої одиниці сукупності.

Якісні ознаки (атрибутивні ознаки) виражаються в вигляді понять, визначень, які характеризують їхню суть, стан або якість. Наприклад, сорт продукції, професія, сімейний статус.

Кількісні ознаки виражають окремі значення якісних ознак у числовому виразі.

Дискретні — ознаки, виражені окремими цілими числами, без проміжних значень.

Неперервні — ознаки, що можуть набувати будь-яких значень у певних чисел.

Прямі — характеризують об'єкт дослідження безпосередньо (вік осіб, кількість присутніх в аудиторії).

Непрямі — ознаки, що не належать безпосередньо досліджуваному об'єкту (чи сукупності), а які належать іншій сукупності, що входить в дану.

Багатоваріантні — перш за все характеризуються рангами (шкалою рангів) від більшого до меншого (напр. дуже низький, низький, середній, високий, дуже високий).

Альтернативні — взаємовиключаючі значення: так-ні, позитивне-негативне.

Інтервальні — це ознаки, які характеризують результат процесів.

Моментні — характеризують об'єкт в певний момент часу.

Окремі значення кількісних ознак називаються варіантами.

Первинні варіанти характеризують одиницю сукупності в цілому: абсолютні значення, виміряні, розраховані.

Вторинні варіанти (похідні, розрахункові) — дані, що неможливо перевірити, оскільки вони взяті з певних джерел.

Адитивність — підсумовувати, складати.

Статистичні показники — це числа в сукупності з набором ознак, що характеризують обставини, до яких вони відносяться, що, де, коли, і яким чином підлягають вимірюванню. Статистичний показник — це кількісна характеристика соціально-економічних явищ і процесів в умовах якісної визначеності.

Статистичні дані — це сукупність показників, отриманих внаслідок статистичного спостереження або обробки даних.

Статистична закономірність — це закономірність, в якій необхідність пов'язана в кожному окремому явищі з випадковістю, і лише в сукупності явищ виявляє себе як закон.

Система статистичних показників — це сукупність статистичних показників, які відображають взаємозв'язки, які об'єктивно існують між явищами.

Вибірка

Вибірка — це множина об'єктів, подій, зразків або сукупність вимірів, за допомогою визначеної процедури вибраних з статистичної популяції або генеральної сукупності для участі в дослідженні. Зазвичай, розміри популяції дуже великі, що робить прийняття до уваги всіх членів популяції непрактичним або неможливим. Вибірка представляє собою множину або сукупність певного обсягу, члени якої збираються і статистичні характеристики обчислюється таким чином, що в результаті можна зробити висновки або екстраполяцію із вибірки на всю популяцію або генеральну сукупність.

Обcяг вибірки — число випадків, включених у вибіркову сукупність. Із статистичних міркувань рекомендується, щоб число випадків становило не менше 30—35.

Залежні і незалежні вибірки

При порівнянні двох (і більш) вибірок важливим параметром є їх залежність. Якщо можна ознаки), такі вибірки встановити гомоморфну пару (тобто, коли одному випадку з вибірки X відповідає один і лише один називаються залежними. Приклади залежних вибірок:

  • • пари близнят
  • • два вимірювання якої-небудь ознаки до і після експериментальної дії
  • • чоловіки і дружини
  • • тощо
  • У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад:
  • • чоловіки і жінки
  • • психологи і математики.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна.

РЕПРЕЗЕНТАТИВНИЙ (рос. репрезентативный, англ. representative, нім. repr?sentativ) – представницький, характерний, типовий для чого-небудь. Напр., репрезентативна вибірка – cукупність випадкових чисел, в якій визначається множина елементів вибірки, що характеризує генеральну сукупність.

Якщо вибірка являє собою числову змінну, наприклад зріст або вік людей, тоді репрезентативність такої вибірки визначають залежно її наповненості і добротності.

Приклад нерепрезентативної вибірки

У США одним з найвідоміших історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів в 1936 році. Журнал «Літрері Дайджест», що успішно прогнозував події декількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм підписчикам, людям, вибраним по телефонним книгах всієї країни, і людям з реєстраційних списків автомобілів. У 25 % бюлетенів (майже 2,5 мільйона) голосів, що повернулися, були розподілені таким чином:

  • • 57 % віддавали перевагу кандидату-республіканцю Альфу Лендону
  • • 40 % вибрали діючого на той час президента-демократа Франкліна Рузвельта

На дійсних же виборах, як відомо, переміг Рузвельт, набравши більше 60 % голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, — оскільки їм було відомо, що більшість їхніх передплатників вважають себе республіканцями, — вони розширили вибірку за рахунок людей, вибраних з телефонних книг і реєстраційних списків. Проте вони не врахували тогочасних реалій і насправді набрали ще більше республіканців: у часи Великої депресії володіти телефонами і автомобілями могли собі дозволити переважно представники середнього і верхнього класу (в більшості республіканці, а не демократи).

Види плану побудови груп з вибірок

Виділяють декілька основних видів плану побудови груп:

  • Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
  • Дослідження з експериментальною і контрольною групами із залученням стратегії попарного відбору
  • Дослідження з використанням тільки однієї групи — експериментальною.
  • Дослідження з використанням змішаного (чинника) плану — всі групи ставляться в різні умови.

Статистична сукупність

Під статистичною сукупністю розуміють масу однорідних у певному відношенні елементів (явищ, фактів і т. ін.), які мають єдину якісну основу, але різняться між собою за певними ознаками. Під одноякісністю, або однорідністю, розуміють підпорядкованість елементів, що складають сукупність, загальному закону розвитку або їх закону розвитку або їх однотиповість (наприклад, Інформація про сукупність одиниць господарств, малих підприємств; про сукупність одиниць виробленої ними продукції. Статистична сукупність складається з окремих одиниць (наприклад, у конкретному малому підприємстві є зведення про вид, вантажопідйомність, кількість днів роботи, витрати на ремонт по кожному автомобілю). Такі окремі первинні елементи, або індивідуальні явища, які складають статистичну сукупність, називають одиницями сукупності. Залежно від мети досліджень однорідність сукупності можна вивчати у різноманітних аспектах розвитку. Так, по молочному стаду корів у господарстві - це породний склад, продуктивність, класність, захворюваність тощо. Повне уявлення про статистичні сукупності можна мати лише при досконалому вивченні їх ознак. У навчальній літературі найбільш вдало ці питання розкриті в навчальному посібнику І. П. Суслова1. Розглянемо це питання в запропонованій автором послідовності.

Статистичні сукупності у сфері суспільного життя можна поділити на дві групи:

1. Сукупності, створені самим життям, які утворюють єдність незалежно від того, чи підлягають вони вивченню статистикою (наприклад, вивчення у господарстві сукупності робітників за освітою, віком, участю у громадській роботі тощо);

2. Сукупності, утворені спеціально з метою статистичного аналізу (наприклад, сукупності підприємств за видами їх комерційної діяльності, за чисельністю в них кваліфікованих робітників, кількістю унікальних видів вироблюваної продукції і т. ін.).

Формування статистичної сукупності передбачає реалізацію одночасно діючих, протилежних один одному прийомів: об'єднання і роз'єднання елементів і частин статистичної сукупності.

Виникає запитання: навіщо потрібні такі операції у формуваннях сукупностей? Відповідь міститься у постановці і формулюванні таких завдань:

1. За становленими правилами па підставі локальних статистичних характеристик визначити загальні характеристики;

2. Виходячи із загальних статистичних характеристик сукупності, на підставі заданих критеріїв знайти локальні статистичні характеристики.

Це все свідчить про важливість категорії "статистична сукупність", адже особливості законів розвитку суспільних явищ вимагають статистичних методів пізнання досліджуваних сукупностей, а шлях цей досить складний і пролягає через методи, які розробляє статистична наука.

Ймовірність

Ймовірність (лат. probabilitas, англ. probability) — числова характеристика можливості того, що випадкова подія відбудеться в умовах, які можуть бути відтворені необмежену кількість разів. Імовірність є основним поняттям розділу математики, що називається теорія імовірностей.

Випадковою подією називається подія, результат якої не може бути відомий наперед. Навіть у тому разі, коли насправді подія детермінована своїми передумовами, вплив цих передумов може бути настільки складним, що вивести з них наслідок логічно й послідовно, неможливо. Наприклад, при підкидуванні монети, сторона на яку монета впаде визначається положенням руки і монети в руці, швидкістю, обертовим моментом тощо, однак відслідкувати всі ці фактори неможливо, тому результат можна вважати випадковим.