Довірчі інтервали для математичного очікування, дисперсії, ймовірності. Розв'язання задач

Довірчий інтервал для математичного очікування - це такий обчислений за даними інтервал, який з певною ймовірністю містить математичне очікуваннягенеральної сукупності. Природною оцінкою для математичного очікування є середнє арифметичне її спостережених значень. Тому далі протягом уроку ми користуватимемося термінами "середнє", "середнє значення". У завданнях розрахунку довірчого інтервалу найчастіше потрібна відповідь типу "Довірчий інтервал середнього числа [величина у конкретній задачі] знаходиться від [менше значення] до [ більше значення]". За допомогою довірчого інтервалу можна оцінювати не тільки середні значення, а й питому вагу тієї чи іншої ознаки генеральної сукупності. Середні значення, дисперсія, стандартне відхиленняі похибка, через які ми будемо приходити до нових визначень та формул, розібрані на уроці Характеристики вибірки та генеральної сукупності .

Точкова та інтервальна оцінки середнього значення

Якщо середнє значення генеральної сукупності оцінюється числом (точкою), то оцінку невідомої середньої величини генеральної сукупності приймається конкретне середнє, яке розраховано за вибіркою спостережень. У разі значення середнього вибірки - випадкової величини - не збігається із середнім значенням генеральної сукупності. Тому, вказуючи середнє значення вибірки, одночасно потрібно вказувати помилку вибірки. Як міра помилки вибірки використовується стандартна помилка, Яка виражена в тих самих одиницях виміру, що і середнє. Тому найчастіше використовується наступний запис: .

Якщо оцінку середнього потрібно пов'язати з певною ймовірністю, то параметр генеральної сукупності, що цікавить, потрібно оцінювати не одним числом, а інтервалом. Довірчим інтервалом називають інтервал, у якому з певною ймовірністю Pперебуває значення оцінюваного показника генеральної сукупності. Довірчий інтервал, у якому з ймовірністю P = 1 - α знаходиться випадкова величина , розраховується так:

,

α = 1 - P, яке можна знайти у додатку до практично будь-якої книги зі статистики.

Насправді середнє значення генеральної сукупності і дисперсія невідомі, тому дисперсія генеральної сукупності замінюється дисперсією вибірки , а середнє генеральної сукупності - середнім значенням вибірки . Таким чином, довірчий інтервал у більшості випадків розраховується так:

.

Формулу довірчого інтервалу можна використовувати для оцінки середньої генеральної сукупності, якщо

  • відоме стандартне відхилення генеральної сукупності;
  • або стандартне відхилення генеральної сукупності невідоме, але обсяг вибірки – більше 30.

Середнє значення вибірки є незміщеною оцінкою середньої генеральної сукупності. У свою чергу, дисперсія вибірки не є незміщеною оцінкою дисперсії генеральної сукупності. Для отримання незміщеної оцінки дисперсії генеральної сукупності у формулі дисперсії вибірки обсяг вибірки nслід замінити на n-1.

приклад 1.Зібрано інформацію зі 100 випадково обраних кафе в деякому місті про те, що середня кількість працівників у них становить 10,5 зі стандартним відхиленням 4,6. Визначити довірчий інтервал 95% числа працівників кафе.

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,05 .

Таким чином, довірчий інтервал 95% середньої кількості працівників кафе становив від 9,6 до 11,4.

приклад 2.Для випадкової вибірки з генеральної сукупності з 64 спостережень обчислено такі сумарні величини:

сума значень у спостереженнях,

сума квадратів відхилення значень від середнього .

Обчислити довірчий інтервал 95% для математичного очікування.

обчислимо стандартне відхилення:

,

обчислимо середнє значення:

.

Підставляємо значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,05 .

Отримуємо:

Таким чином, довірчий інтервал 95% для математичного очікування цієї вибірки становив від 7,484 до 11,266.

приклад 3.Для випадкової вибірки з генеральної сукупності зі 100 спостережень обчислено середнє значення 15,2 та стандартне відхилення 3,2. Обчислити довірчий інтервал 95% для математичного очікування, потім довірчий інтервал 99%. Якщо потужність вибірки та її варіація залишаються незмінними, а збільшується довірчий коефіцієнт, то довірчий інтервал звузиться чи розшириться?

Підставляємо дані значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,05 .

Отримуємо:

.

Таким чином, довірчий інтервал 95% для середньої даної вибірки становив від 14,57 до 15,82.

Знову підставляємо дані значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,01 .

Отримуємо:

.

Таким чином, довірчий інтервал 99% для середньої даної вибірки становив від 14,37 до 16,02.

Як бачимо, при збільшенні довірчого коефіцієнта збільшується також критичне значення стандартного нормального розподілу, а отже початкова і кінцева точки інтервалу розташовані далі від середнього, і таким чином довірчий інтервал для математичного очікування збільшується.

Точкова та інтервальна оцінки частки

Питому вагу деякої ознаки вибірки можна інтерпретувати як точкову оцінку питомої ваги pцієї ж ознаки в генеральній сукупності. Якщо ж цю величину потрібно пов'язати з ймовірністю, слід розрахувати довірчий інтервал частки pознаки у генеральній сукупності з ймовірністю P = 1 - α :

.

приклад 4.У деякому місті два кандидати Aі Bпретендують на посаду мера Випадковим чином було опитано 200 жителів міста, з яких 46% відповіли, що голосуватимуть за кандидата. A, 26% - за кандидата Bта 28% не знають, за кого голосуватимуть. Визначити довірчий інтервал 95% для частки жителів міста, які підтримують кандидата A.

Нехай CB X утворюють генеральну сукупність і — невідомий параметр CB X. Якщо статистична оцінка в * є заможною, то чим більше обсяг вибірки, тим точніше отримуємо значення в. Однак на практиці ми маємо вибірки невеликого обсягу, тому не можемо гарантувати більшої точності.

Нехай * - статистична оцінка для ст. Розмір |в* - в| називається точністю оцінки. Зрозуміло, що точність є CB, тому що в * - випадкова величина. Задамо мале позитивне число 8 і вимагатимемо, щоб точність оцінки |в* - в| була менше 8, тобто | в* - у |< 8.

Надійністю g або довірчою ймовірністю оцінки по * називається ймовірність g, з якою здійснюється нерівність | в * - в |< 8, т. е.

Зазвичай надійність g задають наперед, причому за g беруть число, близьке до 1 (0,9; 0,95; 0,99; ...).

Оскільки нерівність |в * - в|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Інтервал (* - 8, * 5) називається довірчим інтервалом, тобто довірчий інтервал покриває невідомий параметр з ймовірністю у. Зауважимо, що кінці довірчого інтервалу є випадковими і змінюються від вибірки до вибірки, тому точніше говорити, що інтервал (в * - 8, в * + 8) покриває невідомий параметр, а не належить цьому інтервалу.

Нехай Генеральна сукупністьзадана випадковою величиною X, розподіленою за нормальним законом, причому, середнє квадратичне відхиленняа відомо. Невідомим є математичне очікування а = М(Х). Потрібно знайти довірчий інтервал для а при заданій надійності.

Вибіркова середня

є статистичною оцінкоюдля хг = а.

Теорема. Випадкова величинахВ має нормальний розподілякщо X має нормальний розподіл, і М (ХВ) = а,

А (XВ) = а де а = у/Б (X), а = М (X). л/і

Довірчий інтервал для а має вигляд:

Знаходимо 8.

Користуючись співвідношенням

де Ф(г) - функція Лапласа, маємо:

Р (|XВ - а |<8} = 2Ф

таблиці значень функції Лапласа знаходимо значення t.

Позначивши

T, отримаємо F(t) = g Так як g задана, то

З рівності Знаходимо-точність оцінки.

Значить, довірчий інтервал для має вигляд:

Якщо задана вибірка із генеральної сукупності X

нГ до" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, то довірчий інтервал буде:

Приклад 6.35. Знайти довірчий інтервал для оцінки математичного очікування а нормального розподілу з надійністю 0,95, знаючи середню вибіркову Xb = 10,43, обсяг вибірки n = 100 і середнє квадратичне відхилення s = 5.

Скористаємося формулою

Часто оцінювачу доводиться аналізувати ринок нерухомості того сегмента, в якому знаходиться об'єкт оцінки. Якщо ринок розвинений, проаналізувати всю сукупність представлених об'єктів буває складно, для аналізу використовується вибірка об'єктів. Не завжди ця вибірка виходить однорідною, іноді потрібно очистити її від екстремумів - надто високих чи надто низьких пропозицій ринку. Для цієї мети застосовується довірчий інтервал. Мета даного дослідження - провести порівняльний аналіз двох способів розрахунку довірчого інтервалу та вибрати оптимальний варіант розрахунку під час роботи з різними вибірками у системі estimatica.pro.

Довірчий інтервал - обчислений з урахуванням вибірки інтервал значень ознаки, що з певною ймовірністю містить оцінюваний параметр генеральної сукупності.

Сенс обчислення довірчого інтервалу полягає в побудові за даними вибірки такого інтервалу, щоб можна було стверджувати із заданою ймовірністю, що значення параметра, що оцінюється, знаходиться в цьому інтервалі. Іншими словами, довірчий інтервал з певною ймовірністю містить невідоме значення величини, що оцінюється. Чим ширший інтервал, тим вища неточність.

Існують різні способи визначення довірчого інтервалу. У цій статті розглянемо 2 способи:

  • через медіану та середньоквадратичне відхилення;
  • через критичне значення t-статистики (коефіцієнт Стьюдента).

Етапи порівняльного аналізу різних способів розрахунку ДІ:

1. формуємо вибірку даних;

2. обробляємо її статистичними методами: розраховуємо середнє значення, медіану, дисперсію тощо;

3. розраховуємо довірчий інтервал двома способами;

4. аналізуємо очищені вибірки та отримані довірчі інтервали.

Етап 1. Вибірка даних

Вибірку сформовано за допомогою системи estimatica.pro. У вибірку увійшла 91 пропозиція про продаж 1 кімнатних квартир у 3-му ціновому поясі з типом планування «Хрущовка».

Таблиця 1. Вихідна вибірка

Ціна 1 кв.м., д.е.

Рис.1. Вихідна вибірка



Етап 2. Обробка вихідної вибірки

Обробка вибірки методами статистики потребує обчислення наступних значень:

1. Середнє арифметичне значення

2. Медіана - число, що характеризує вибірку: рівно половина елементів вибірки більше медіани, інша половина менше медіани

(Для вибірки, що має непарне число значень)

3. Розмах - різниця між максимальним та мінімальним значеннями у вибірці

4. Дисперсія – використовується для більш точного оцінювання варіації даних

5. Середньоквадратичне відхилення за вибіркою (далі - СКО) - найпоширеніший показник розсіювання значень коригування навколо середнього арифметичного значення.

6. Коефіцієнт варіації - відбиває ступінь розкиданості значень коригувань

7. коефіцієнт осциляції - відбиває відносне коливання крайніх значень цін у вибірці навколо середньої

Таблиця 2. Статистичні показники вихідної вибірки

Коефіцієнт варіації, що характеризує однорідність даних, становить 12,29%, проте коефіцієнт осциляції занадто великий. Таким чином ми можемо стверджувати, що вихідна вибірка не є однорідною, тому перейдемо до розрахунку довірчого інтервалу.

Етап 3. Розрахунок довірчого інтервалу

Спосіб 1. Розрахунок через медіану та середньоквадратичне відхилення.

Довірчий інтервал визначається так: мінімальне значення - з медіани віднімається СКО; максимальне значення - до медіани додається СКО.

Таким чином, довірчий інтервал (47179 д.е.; 60689 д.е.)

Мал. 2. Значення, що потрапили в інтервал довіри 1.



Спосіб 2. Побудова довірчого інтервалу через критичне значення t-статистики (коефіцієнт Стьюдента)

С.В. Грибовський у книзі «Математичні методи оцінки вартості майна» визначає спосіб обчислення довірчого інтервалу через коефіцієнт Стьюдента. При розрахунку цим методом оцінювач повинен сам задати рівень значущості ∝, що визначає ймовірність, з якою буде побудовано довірчий інтервал. Зазвичай використовуються рівні значення 0,1; 0,05 та 0,01. Їм відповідають довірчі ймовірності 0,9; 0,95 та 0,99. При такому методі вважають справжні значення математичного очікування та дисперсії практично невідомими (що майже завжди є вірним при вирішенні практичних завдань оцінки).

Формула довірчого інтервалу:

n – обсяг вибірки;

Критичне значення t-статистики (розподілу Стьюдента) з рівнем значимості ∝, числом ступенів свободи n-1, яке визначається за спеціальними статистичними таблицями або за допомогою MS Excel (→ "Статистичні" → СТЬЮДРАСПОБР);

∝ – рівень значущості, приймаємо ∝=0,01.

Мал. 2. Значення, що потрапили в інтервал довіри 2.

Етап 4. Аналіз різних способів розрахунку довірчого інтервалу

Два способи розрахунку довірчого інтервалу – через медіану та коефіцієнт Стьюдента – привели до різних значень інтервалів. Відповідно, вийшло дві різні очищені вибірки.

Таблиця 3. Статистичні показники за трьома вибірками.

Показник

Вихідна вибірка

1 варіант

2 варіант

Середнє значення

Дисперсія

Коеф. варіації

Коеф. осциляції

Кількість об'єктів, що вибули, шт.

З виконаних розрахунків можна сказати, що отримані різними методами значення довірчих інтервалів перетинаються, тому можна використовувати будь-який із способів розрахунку розсуд оцінювача.

Однак ми вважаємо, що при роботі в системі estimatica.pro доцільно вибирати метод розрахунку довірчого інтервалу в залежності від рівня розвиненості ринку:

  • якщо ринок нерозвинений, застосовувати метод розрахунку через медіану та середньоквадратичне відхилення, оскільки кількість об'єктів, що вибули, у цьому випадку невелика;
  • якщо ринок розвинений, застосовувати розрахунок через критичне значення t-статистики (коефіцієнт Стьюдента), оскільки є можливість сформувати велику вихідну вибірку.

Під час підготовки статті було використано:

1. Грибовський С.В., Сівець С.А., Левикіна І.А. Математичні методи оцінки вартості майна. Москва, 2014 р.

2. Дані системи estimatica.pro

Для початку нагадаємо таке визначення:

Розглянемо наступну ситуацію. Нехай варіанти генеральної сукупності має нормальне розподілення з математичним очікуванням $a$ і середнім квадратичним відхиленням $\sigma$. Вибіркове середнє у разі розглядатиметься як випадкова величина. Коли величина $X$ розподілена нормально, вибіркове середнє також матиме нормальний розподіл з параметрами

Знайдемо довірчий інтервал, який покриває величину $a$ з надійністю $gamma $.

Для цього нам необхідно, щоб виконувалась рівність

З неї отримаємо

Звідси ми можемо легко знайти $t$ за таблицею значень функції $Ф\left(t\right)$ і, як наслідок, знайти $delta$.

Нагадаємо таблицю значень функції $Ф\left(t\right)$:

Малюнок 1. Таблиця значень функції $Ф\left(t\right).$

Довірчий інтеграл для оцінки математичного очікування за невідомого $(\mathbf \sigma )$

У цьому випадку ми користуватимемося значенням виправленої дисперсії $S^2$. Замінюючи у вище виведеній формулі $sigma $ на $S$, отримаємо:

Приклад завдань перебування довірчого інтервалу

Приклад 1

Нехай величина $X$ має нормальний розподіл із дисперсією $\sigma =4$. Нехай обсяг вибірки $ n = 64 $, а надійність дорівнює $ Gamma = 0,95 $. Знайти довірчий інтервал для оцінки математичного очікування цього розподілу.

Нам необхідно знайти інтервал ($\overline(x)-\delta ,\overline(x)+\delta)$.

Як ми бачили вище

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\ t)(2)\]

Параметр $t$ знайдемо з формули

\[Ф\left(t\right)=\frac(\gamma)(2)=\frac(0,95)(2)=0,475\]

З таблиці 1 отримуємо, що $t=1,96$.

Нехай випадкова величина Х генеральної сукупності розподілена нормально, враховуючи, що дисперсія та середнє відхилення квадрати s цього розподілу відомі. Потрібно оцінити невідоме математичне очікування на вибіркову середню. В даному випадку завдання зводиться до знаходження довірчого інтервалу для математичного очікування з надійністю b. Якщо визначити значення довірчої ймовірності (надійності) b, то можна знайти ймовірність попадання в інтервал для невідомого математичного очікування, використовуючи формулу (6.9а):

де Ф(t) – функція Лапласа (5.17а).

В результаті можна сформулювати алгоритм відшукання меж довірчого інтервалу для математичного очікування, якщо відома дисперсія D = s 2:

  1. Задати значення надійності - b.
  2. З (6.14) виразити Ф(t) = 0,5×b. Вибрати значення t із таблиці для функції Лапласа за значенням Ф(t) (див. Додаток 1).
  3. Обчислити відхилення e за формулою (6.10).
  4. Записати довірчий інтервал за такою формулою (6.12), що з ймовірністю b виконується нерівність:

.

Приклад 5.

Випадкова величина Х має нормальний розподіл. Знайти довірчі інтервали з оцінкою з надійністю b = 0,96 невідомого математичного очікування а, якщо дані:

1) генеральне середнє квадратичне відхилення s = 5;

2) вибіркова середня;

3) обсяг вибірки n = 49.

У формулі (6.15) інтервальної оцінки математичного очікування а з надійністю b усі величини, крім t, відомі. Значення t можна знайти за допомогою (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

За таблицею Додатка 1 функції Лапласа Ф(t) = 0,48 знаходять відповідне значення t = 2,06. Отже, . Підставивши у формулу (6.12) обчислене значення e можна отримати довірчий інтервал: 30-1,47< a < 30+1,47.

Шуканий довірчий інтервал оцінки з надійністю b = 0,96 невідомого математичного очікування дорівнює: 28,53< a < 31,47.