Довірчий інтервал оцінки генеральної дисперсії. Довірчі інтервали для математичного очікування, дисперсії, ймовірності

Довірчий інтервал граничні значеннястатистичної величини, яка із заданою довірчою ймовірністю γ буде знаходиться в цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірністьγ із досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити із ймовірністю 0,99 середню квадратичну помилкувибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладено величина настригу, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції на посаді Московської Північної митниці було взято як випадкову повторної вибірки 20 проб товару «А». В результаті перевірки встановлена ​​середня вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте із ймовірністю 0,683 межі середньої вологості продукту у всій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, виявилася рівною 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0,99 інтервальну оцінку для математичного очікуванняцією випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування з абсолютної величинине більше ніж на 2.

Класифікація довірчих інтервалів

На вигляд оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому доборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t– коефіцієнт довіри, який визначається залежно від рівня ймовірності Р(t) за таблицею інтегральної функціїЛапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Щоб знайти межі довірчого інтервалу для середнього значення генеральної сукупності, необхідно виконати такі дії:

1) за отриманою вибіркою обсягу nобчислити середнє арифметичне та стандартну помилкусереднього арифметичного за формулою:

;

2) поставити довірчу можливість 1 – α , Виходячи з мети дослідження;

3) за таблицею t-розподілу Стьюдента (Додаток 4) знайти граничне значення t α залежно від рівня значущості α та числа ступенів свободи k = n – 1;

4) знайти межі довірчого інтервалу за такою формулою:

.

Примітка: У практиці наукових досліджень, коли закон розподілу малої вибіркової сукупності (n < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для наближеноюоцінки довірчих інтервалів

Довірчий інтервал при n≥ 30 знаходиться за такою формулою:

,

де u – процентні точки нормованого нормального розподілу, що знаходяться за таблицею 5.1.

8. Порядок роботи на V етапі

1. Перевірити на нормальність розподілу малу (n< 30) выборку, составленную из разностей парных значений результатов измерений исходного показателя скоростных качеств у «спортсменов» (эти результаты обозначены индексом В) и показателя, достигнутого после двухмесячных тренировок (эти результаты обозначены индексом Г).

2. Вибрати критерій та оцінити ефективність методу тренування, що використовується для прискореного розвитку швидкісних якостей у «спортсменів».

Звіт про роботу на V етапі гри (зразок)

Тема:Оцінка ефективності методики тренування.

Цілі:

    Ознайомитись з особливостями нормального закону розподілу результатів тестування.

    Придбати навички щодо перевірки вибіркового розподілу на нормальність.

    Набути навички оцінки ефективності методики тренування.

    Навчитися розраховувати та будувати довірчі інтервали для генеральних середніх арифметичних малих вибірок.

Запитання:

    Сутність методу оцінки ефективності методики тренування.

    Нормальний закон розподілу. Сутність, значення.

    Основні властивості кривої нормального розподілу.

    Правило трьох сигм та його практичне застосування.

    Оцінка нормальності розподілу малої вибірки.

    Які критерії та у яких випадках використовуються для порівняння середніх попарно залежних вибірок?

    Що характеризує довірчий інтервал? Методика визначення.

Варіант 1: параметричний критерій

Примітка: Як приклад візьмемо наведені в таблиці 5.2 результати вимірювання показника швидкісних якостей у спортсменів до початку тренувань (вони позначені індексом, були отримані в результаті вимірювань наIетапі ділової гри) та після двох місяців тренувань (вони позначені індексом Г).

Від вибірок В і Г перейдемо до вибірки, складеної з різниці парних значень d i = N i Г N i Вта визначимо квадрати цих різниць. Дані занесемо до розрахункової таблиці 5.2.

Таблиця 5.2 - Розрахунок квадратів парних різниць значень d i 2

N i В, уд

N i Г, уд

d i = N i ГN i В, уд

d i 2 , уд 2

Користуючись таблицею 5.2, знайдемо середнє арифметичне парних різниць:

уд.

Далі розрахуємо суму квадратів відхилень d iвід за формулою:

Визначимо дисперсію для вибірки d i :

уд. 2

Висуваємо гіпотези:

- нульову - H 0: про те, що генеральна сукупність парних різниць d iмає нормальний розподіл;

– конкуруючу – H 1: у тому, що розподіл генеральної сукупності парних різниць d iна відміну від нормального.

Перевірку проводимо лише на рівні значимості = 0,05.

І тому складемо розрахункову таблицю 5.3.

Таблиця 5.3 – Дані розрахунку критерію Шапіро та Уілка W наблдля вибірки, складеної з різниць парних значень d i

d i, уд

d n - k + 1 -d k = k

a nk

k ×a nk

17 – (–2) = 19

Порядок заповнення таблиці 5.3:

    Перший стовпець записуємо номери по порядку.

    У другій – різниці парних значень d iу незменшному порядку.

    По-третє – номери по порядку kпарних різниць. Бо в нашому випадку n= 10, то kзмінюється від 1 до n/2 = 5.

4. У четвертий – різниці k, які знаходимо таким чином:

– із самого великого значення d 10 віднімемо щонайменше d 1 k = 1,

- З d 9 віднімемо d 2 і отримане значення запишемо в рядку для k= 2 тощо.

    У п'ятий – записуємо значення коефіцієнтів a nk, взяті з таблиці, що використовується в статистиці для розрахунку критерію Шапіро та Уілка ( W) перевірки нормальності розподілу (Додаток 2) для n= 10.

    У шостий – твір k × a nkі знаходимо суму цих творів:

.

Спостережуване значення критерію W наблзнаходимо за формулою:

.

Перевіримо правильність виконання розрахунків критерію Шапіро та Уілка ( W набл) його розрахунком на комп'ютері за програмою Статистика.

Розрахунок критерію Шапіро та Вілка ( W набл) на комп'ютері дозволив встановити, що:

.

Далі по таблиці критичних значенькритерію Шапіро та Вілка (Додаток 3) шукаємо W крітдля n= 10. Знаходимо, що W кріт= 0,842. Порівняємо величини W кріті W набл .

Робимо висновок: так як W набл (0,874) > W кріт(0,842), має бути прийнята нульова гіпотеза про нормальний розподіл генеральної сукупності d i. Отже, для оцінки ефективності застосовуваної методики розвитку швидкісних якостей слід використовувати параметричний t-Крітерій Стьюдента.

Побудова довірчого інтервалу для дисперсії нормально розподіленої генеральної сукупності полягає в тому, що випадкова величина:

має c 2 -розподіл Пірсона c n = n–1 ступенями свободи. Задамо довірчу ймовірність g і визначимо числа та умови

Числа та , що задовольняють цій умові, можна вибрати незліченним числом способів. Один із способів полягає в наступному

і .

Значення чисел визначаються з таблиць для розподілу Пірсона. Після цього утворимо нерівність

В результаті отримуємо наступну інтервальну оцінку дисперсії генеральної сукупності:

. (3.25)

Іноді цей вираз записують як

, (3.26)

, (3.27)

де для коефіцієнтів складають спеціальні таблиці.

Приклад 3.10.На фабриці працює автоматична лініяза фасуванням розчинної кави в бляшані 100-грамові банки. Якщо середня маса банок, що наповнюються, відрізняється від точної, то лінії налагоджується для підгонки середньої масиу робочому режимі. Якщо дисперсія маси перевищує задане значення, лінія повинна бути зупинена на ремонт і переналагодження. Іноді проводиться відбір банок з кавою для перевірки середньої маси та її коливання. Припустимо, що з лінії у випадковому порядку проводиться відбір банок з кавою та оцінка дисперсії s 2 = 18,540. Побудуйте 95% довірчий інтервал для генеральної дисперсії s 2 .

Рішення.Припускаючи, що генеральна сукупність має нормальне розподілення, скористаємося формулою (3.26). За умовою завдання рівень значущості a=0,05 та a/2=0,025. По таблицях для c 2 -розподіл Пірсона з n= n–1=29 ступенями свободи знаходимо

і .

Тоді довірчий інтервал для s 2 можна записати як

,

.

Для середньо квадратичного відхилення відповідь матиме вигляд

. â

Перевірка статистичних гіпотез

Основні поняття

Більшість економетричних моделей потребує багаторазового покращення та уточнення. Для цього необхідно проведення відповідних розрахунків, пов'язаних із встановленням чи нездійсненності тих чи інших передумов, аналізом якості знайдених оцінок, достовірністю отриманих висновків. Тому знання основних принципів перевірки гіпотез є обов'язковим в економетриці.



У багатьох випадках необхідно знати закон розподілу генеральної сукупності. Якщо закон розподілу невідомий, але є підстави припустити, що він має певний вид, то висувають гіпотезу: генеральна сукупність розподілена за цим законом. Наприклад, можна висунути припущення, що доход населення, щоденна кількість покупців у магазині, розмір деталей, що випускаються, мають нормальний закон розподілу.

Можливий випадок, коли закон розподілу відомий, яке параметри немає. Якщо є підстави припустити, що невідомий параметр q дорівнює очікуваному числу q 0 то висувають гіпотезу: q=q 0 . Наприклад, можна висунути припущення про величину середнього доходу населення, очікуваного середнього доходу по акціях, про розкид у доходах і т.д.

Під статистичною гіпотезою Hрозуміють будь-яке припущення про генеральну сукупність (випадкову величину), що перевіряється за вибіркою. Це можливо припущення про вид розподілу генеральної сукупності, про рівність двох вибіркових дисперсій, про незалежність вибірок, про однорідність вибірок, тобто. що закон розподілу не змінюється від вибірки до вибірки та інших.

Гіпотеза називається простийякщо вона однозначно визначає будь-який розподіл або будь-який параметр; в іншому випадку гіпотеза називається складною. Наприклад, простою гіпотезою є припущення, що випадкова величина Xрозподілено за стандартним нормальним законом N(0; 1); якщо ж висловлюється припущення, що випадкова величина Xмає нормальний розподіл N(m;1), де a£ m£ b, Це складна гіпотеза.

Перевірена гіпотеза називається Основнийабо нульовою гіпотезоюі позначається символом H 0 . Поряд з основною гіпотезою розглядають і гіпотезу, що суперечить їй, яку зазвичай називають конкуруючоїабо альтернативною гіпотезоюта позначають символом H 1 . Якщо основна гіпотеза буде відкинута, має місце альтернативна гіпотеза. Наприклад, якщо перевіряється гіпотеза про рівність параметра q деякому заданому значенню q 0, тобто. H 0:q=q 0 , то альтернативної гіпотези можна розглянути одну з наступних гіпотез: H 1:q>q 0 , H 2:q H 3:q¹q 0 , H 4: q = q 1 . Вибір альтернативної гіпотези визначається конкретним формулюванням завдання.

Висунута гіпотеза може бути правильною чи неправильною, тому виникає потреба її перевірки. Оскільки перевірка здійснюється статистичними методами, то у зв'язку з цим із певною часткою ймовірності може бути ухвалено неправильне рішення. Тут можуть бути припущені помилки двох видів. Помилка першого роду полягає в тому, що буде відкинуто правильну гіпотезу. Можливість помилки першого роду позначають літерою a, тобто.

Помилка другого родуполягає в тому, що буде прийнято неправильну гіпотезу. Можливість помилки другого роду позначають літерою b, тобто.

Наслідки зазначених помилок є нерівнозначними. Перша призводить до більш обережного, консервативного рішення, друга – до невиправданого ризику. Що краще чи гірше – залежить від конкретної постановки завдання та змісту нульової гіпотези. Наприклад, якщо H 0 полягає у визнанні продукції підприємства якісною та припущена помилка першого роду, то буде забракована придатна продукція. Припустившись помилки другого роду, ми відправимо споживачеві шлюб. Очевидно, наслідки цієї помилки серйозніші з погляду іміджу фірми та її довгострокових перспектив.

Виключити помилки першого та другого роду неможливо через обмеженість вибірки. Тому прагнуть мінімізувати втрати від цих помилок. Зазначимо, що одночасне зменшення можливостей даних помилок неможливе, т.к. Завдання їх зменшення є конкуруючими. І зниження ймовірності допустити одну з них спричиняє збільшення ймовірності допустити іншу. Найчастіше єдиний спосіб зменшення обох ймовірностей полягає у збільшенні обсягу вибірки.

Правило, відповідно до якого приймається або відхиляється основна гіпотеза, називається статистичним критерієм . Для цього підбирається така випадкова величина K, розподіл якої точно або наближено, відомо і яка є мірою розбіжності між досвідченими та гіпотетичними значеннями.

Для перевірки гіпотези за даними вибірки обчислюють вибіркове(або спостерігається) значення критерію K набл. Потім, відповідно до розподілу обраного критерію, будується критична область K кріт. Це така сукупність значень критерію, у яких нульову гіпотезу відкидають. Решту можливих значень називають областю прийняття гіпотези. Якщо орієнтуватися на критичну область, то можна зробити помилку
1-го роду, ймовірність якої задана заздалегідь і дорівнює a називається рівнем значимостігіпотези. Звідси випливає така вимога до критичної області. кріт:

.



Рівень значущості a визначає "розмір" критичної області кріт. Однак її становище на багатьох значеннях критерію залежить від виду альтернативної гіпотези. Наприклад, якщо перевіряється нульова гіпотеза H 0:q=q 0 а альтернативна гіпотеза має вигляд H 1:q>q 0 то критична область складатиметься з інтервалу (K 2 , +¥), де точка K 2 визначається з умови P(K>K 2)=a ( правостороння критична область H 2:q P(K лівостороння критична область). Якщо альтернативна гіпотеза має вигляд H 3:q¹q 0 то критична область складатиметься з двох інтервалів (–¥;K 1) і (K 2 , +¥), де точки K 1 і K 2 визначаються з умов: P(K>K 2)=a/2 та P(K двостороння критична область).

Основний принцип перевірки статистичних гіпотез можна сформулювати в такий спосіб. Якщо K наблпотрапляє у критичну область, то гіпотеза H 0 відкидається і приймається гіпотеза H 1 . Проте надходячи таким чином, слід розуміти, що тут можна припуститися помилки 1-го роду з ймовірністю a. Якщо K наблпотрапляє в область прийняття гіпотези – немає підстав, щоб відкидати нульову гіпотезу H 0 . Але це зовсім не означає, що H 0 є єдино підходящою гіпотезою: просто розбіжності між вибірковими даними та гіпотезою H 0 невелика; однак такою ж властивістю можуть мати й інші гіпотези.

Потужністю критеріюназивається ймовірність того, що нульова гіпотеза буде відкинута, якщо вірна альтернативна гіпотеза; тобто. потужність критерію дорівнює 1-b, де b - можливість зробити помилку 2-го роду. Нехай для перевірки гіпотези прийнятий певний рівень значущості і вибірка має фіксований обсяг. Оскільки у виборі критичної області є певне свавілля, то її доцільно будувати так, щоб потужність критерію була максимальною або ймовірність помилки 2-го роду була мінімальною.

Критерії, що використовуються для перевірки гіпотез про параметри розподілу, називаються критеріями значущості. Зокрема, побудова критичної галузі аналогічна до побудови довірчого інтервалу. Критерії, що використовуються для перевірки згоди між вибірковим розподілом та гіпотетичним теоретичним розподілом, називаються критеріями згоди.

Тут середнє вважається відомим фіксованим числом, а дисперсія виступає у ролі невідомого параметра. Покладемо

Оскільки --, має стандартний нормальний розподіл. Тим самим, функція має-розподіл ступенями свободи, що ніяк не залежить від невідомого параметра. Позначаючи через квантилі цього розподілу і фіксуючи деякі такі, що , приходимо до нерівності

яке виконано з ймовірністю. Звідки отримуємо-довірчий інтервал для:

Довірчий інтервал для дисперсії при невідомому середньому

Зауважимо, що функція визначена в такий спосіб, що з заданої вибірці її значення залежить лише від параметра. Щодо розподілу випадкової величини , то по теоремі Фішера (див.8.3) воно є розподілом ступенями свободи і, отже, не залежить від невідомих параметрів. Фіксуючи, такі, що , і розмірковуючи як (47), приходимо до наступного -довірчого інтервалу для:

який, використовуючи позначення (30), можна переписати так

Довірчий інтервал для середнього при невідомій дисперсії

Як і в попередньому пункті, обидва параметри вважаються невідомими, при цьому є параметром, що заважає. За теоремою Фішера

і

незалежні і мають розподіл і-розподіл ступенем свободи відповідно. Отже, відношення

має розподіл Стьюдента із ступенем свободи. Виберемо функцію рівної правої частини (48):

де - вибіркова дисперсія, визначена формулою (30). Функція не залежить явно від параметра, що заважає. Позначаючи через квантиль розподілу Стьюдента ступенем свободи, отримаємо, що нерівність

виконано з ймовірністю. Звідси отримуємо-довірчий інтервал для:

Оскільки розподіл Стьюдента симетричний, то за Пропозицією 3.3

Тому довірчий інтервал можна записати як

Таким чином, середнє вибіркове є серединою цього інтервалу.

Приклад 8.2

Звернемося до прикладу 6.4. Припустимо, що кожна з вибірківята з нормальногорозподілу з невідомимипараметрами -відповідно. (Про те, на підставі чого можна зробити таке припущення, ми поговоримо пізніше в 9.5.)

Наша мета - знайти довірчі інтервали для та, теоретичних значень вмісту вуглецю та міцності на розрив сталі GS50. Нагадаємо, що обсяг кожної із вибірок. Зафіксуємо довірчу можливість, близьку до одиниці, скажімо. По таблиці розподілу Стьюдента на стор.визначимо приблизно, що. Згадуючи значення, знайдені в Прикладі6.5на стор., обчислюємо

і, користуючись формулою (49), отримуємо -довірчий інтервал для процентного вмісту вуглецю

і -довірчий інтервал для значення міцності на розрив

Лабораторна робота №12. Основи теорії оцінювання

Статистик має справу з даними, схильними до випадкової мінливості. Їхня поведінка характеризується деяким законом розподілу ймовірностей. Такий закон зазвичай містить невідомі величини, які прийнято вважати параметрами закону. У силу випадкової мінливості даних, що спостерігаються, не можна, грунтуючись на них, вказати абсолютно точне значення параметрів. Доводиться задовольнятися лише наближеними значеннями. Отже, математичний статистик працює з такими величинами: - випадковою величиною, яку він ніколи не спостерігає, але яку вважає "душою" даних, що вивчаються ним, причиною, що їх породила. Ця величина визначається деякими параметрами; - досліджуваними даними, отримані, як реалізація випадкової величини. Наприклад, випадковою величиною є точний час. Її реалізаціями - показання годинника, доступного для статистика. Завдання статистика - за показаннями n годин t 1, ..., t n максимально точно встановити час. З іншого боку він має охарактеризувати точність встановленого значення. Він виконує оцінювання шуканої величини у вигляді t = t 0 + ξ(a,σ), де t 0 - справжній час у момент дослідження, ξ(a,σ) - випадкова величина, що характеризує відхилення від істинного значення, t 0 , a, σ - параметри, величина ξ характеризується законом розподілу, ймовірностями того, що вона набуває різних значень. Оцінюванням у статистиці називають правило обчислення наближеного значення параметра на основі даних, що спостерігаються. Оцінка - це наближене значення параметра, знайдене за даними, що спостерігаються. При побудові оцінок для практичного застосування, до оцінок пред'являються три основні вимоги:

    точність, тобто близькість до істинного значення параметра, у прикладі ξ(a,σ) має бути мало;

    несмещенность, тобто вимога, щоб математичне очікування оцінки дорівнювало істинному значенню параметра, у прикладі ξ(a,σ) має бути в середньому дорівнює нулю;

    спроможність, тобто вимога, щоб зі збільшенням числа спостережень оцінка сходилася ймовірно до справжнього значення параметра. У прикладі при великому числі годинника n значення ξ(a,σ) має прагнути нуля з ймовірністю, що прагне одиниці.

Найкращих в усіх відношеннях оцінок немає. Наприклад, середнє арифметичне, широко поширена оцінка середнього значення випадкової величини, має властивість оптимальності для нормально розподілених даних. Однак воно призводить до помилок, якщо серед даних є викиди, тобто різко виділяються значення. Такі викиди в економіці породжені грубими помилками у вимірах або друкарськими помилками, при яких може зникнути точка між рублями і копійками і зарплата зросте в сотню разів. Розглянемо випадковий процес, пов'язаний з історією нанесення на карту Великої Британії уточнених меж її володінь, розкиданих по всіх частинах світу. Відомо, що будь-яка точка на Землі характеризується двома координатами – широтою та довготою. Сьогодні будь-який школяр чув про супутникові прилади, що задають будь-яку точку на Землі з точністю до метра. Однак у ті часи навіть подібний прилад не допоміг би морякам, оскільки він не виявив би на небі жодного "опорного" супутника. Широта визначалася безпосередньо за висотою світил над горизонтом за допомогою приладу "секстан", аналогічного сучасному теодоліту (підзорна труба плюс вимірювач кута). Довгота є кутом повороту земної кулі, при якому поєднуються місцевий меридіан і обраний за умовний нуль грінвічський. Земля робить оборот в 360 ° майже за добу, тобто за годину вона повертається на 15 °, за 4 хвилини - на 1 °. Для визначення довготи треба точно знати місцевий та грінвічський час. Якщо штурман каже капітанові: "Місцевий полудень, Сер", а капітан знає час у цей момент у Грінвічі, то різниця часу, поділена на 4 хвилини, визначає довготу місцевості в градусах. Сьогодні все було б просто - зателефонувати до Грінвіча і дізнатися їх час. Але тоді радіо ще не вигадали. Якби на кораблі був кварцовий годинник, який йде на частку хвилини за рік, проблеми теж би не було, але найкращі хронометри, що тоді існували, не забезпечували необхідної для вимірювання довготи точності. Вони за кілька місяців плавання йшли від точного часу на десятки хвилин. І коли в 1831 в кругосвітнє плавання для складання карт відправлявся корабель "Бігль", капітан корабля Фіц Рой, людина освічений і вчений, взяв з собою 24 (!) морських хронометра. Кожен хронометр показував свій "грінвічський час". У цьому дослідженні випадкова величина - момент, коли штурман визначав точний місцевий час по якомусь небесному світилу. "Душа" вимірюваної випадкової величини - справжній час у Грінвічі у цей момент. Таку величину позначимо ξ. Значення цієї величини ніколи не відоме. Значення випадкової величини, що спостерігаються, це показання (різні) хронометрів. Кожен з них дещо помилявся, але загалом вони йшли за загальною "душею", накладаючи на неї свою випадкову похибку. Оцінка випадкової величини - це той грінвічський час, який передбачав за даними капітан. Нехай випадкові величини x i , i = 1,...,n, є реалізаціями однієї випадкової величини ξ, тобто мають однаковий розподіл (одну "душу"), причому для будь-якого i середнє значення показань дорівнює одному й тому ж числу: Е( x i) = Е(ξ). Сенс цього твердження такий: весь годинник не може дружно відставати або поспішати через конструктивні неполадки. У середньому рівноймовірно, що вони поспішають або відстають. Крім того, хай вони незалежні. Іншими словами, у них немає чогось спільного у групах. Так, матрос, що записує показання годинника, міг їх реєструвати в одній послідовності. Тоді останні показання реєструвалися б на хвилину пізніше за перші. Або кілька годин могли висіти у теплому місці та від нагріву дружно поспішати. Припущення, що такого явища немає, відповідає умові незалежності показань у різних випробуваннях. Найпростіше завдання оцінювання - це визначення ймовірності деякої події, наприклад, що реальна (не обов'язково правильна) монета випаде гербом вгору. Визначити можливість події майже ніколи не можна безпосередньо. Універсального методу, який дозволяв би для довільної події вказати його ймовірність, немає. Можна оцінити ймовірність події А, якщо допустимо проводити незалежні повторні випробування, у ході яких ця подія настає з постійною ймовірністю. Нехай у кожному з випробувань ймовірність р = Р(А) події А залишається незмінною і результат кожного випробування незалежний від інших. Позначимо через m випадкове число тих випробувань із загальної кількості n, у яких сталася подія А. Кажуть, що m - число "успіхів" у n випробуваннях Бернуллі. Згідно зі статистичним визначенням ймовірності, при великому n відносна частота m/n події А приблизно дорівнює ймовірності події настання події А, тобто m/n ~ р, де р = Р(А). Доведемо, що це випливає із аксіоматики Колмогорова. У математичному аналізі використовується суворе поняття межі послідовності: при досить великому номері члена послідовності, його значення може бути зроблено як завгодно близьким до граничного значення. Таке визначення не відповідає реальному життю, де дуже рідко відбуваються абсолютно неймовірні події. Наприклад, з первинного хаотичного бульйону виникає бактерія, здатна відтворювати себе. Або риба створює щось, яке спочатку мільйони років їй не треба (але розвивається), а потім стає крилом. Або затоплюється ціле місто (або країна). Теоретично ймовірностей поняття межі тлумачиться у сенсі, відмінному від цього, який вкладається у нього математичному аналізі. Визначення теорії ймовірностей ближче до життя. Воно не забороняє того, що в якийсь момент у послідовності буде число, що різко відрізняється від інших. Послідовність випадкових величин u n збігається за ймовірністю до р, якщо для будь-якого числа ε > 0 ймовірність того, що модуль різниці | u n - р | при n → ∞ менше, ніж ε, прагне одиниці:

Теоретично ймовірностей ніяка подія перестав бути достовірним, але подія: |u n - р| ≤ ε практично достовірно за досить великих n. Доведемо нерівність Чебишева. Нехай ξ - випадкова величина, що має математичне очікування Е(ξ) = а дисперсію D(ξ) = σ², ε - позитивне число. Тоді ймовірність події, що полягає в тому, що центрована (Е(ξ) - а) і нормована випадкова величина перевищує меншу, ніж ε -2:

Справді, σ² = Е(ξ - а)². При обчисленні середнього у правій частині виділимо дві області значень ξ. Для тих ξ, які |ξ - а|< εσ, сумма (или интеграл) соответствующих произведений неотрицателен. Для тех ξ, у которых |ξ - а| >εσ, сума (або інтеграл):

Цікавий окремий випадок: σ = 0. У цьому ясно, що |ξ - а| = 0, тобто ξ = а. Доведемо теорему Чебишева. Нехай х 1,...,х n - незалежні однаково розподілені випадкові величини, що мають математичне очікування та дисперсію. Тобто кожен x i є реалізація випадкової величини ξ, причому Е(ξ) = Е(x i) = а, D(ξ) = D(x i) = σ². Тоді для будь-якого ε > 0:

Доведення. Дисперсія середнього арифметичного:

Розглянемо випадкову величину n, що являє собою середнє арифметичне n спостережень. Її середня та дисперсія . Спостережуваними реалізаціями n є . Відповідно до нерівністю Чебишева для випадкової величини n , ймовірність її відхилення від середнього значення на величину, більшу ніж прагне до нуля:

Імовірність протилежної події прагне за великих n до 1: P(|η n - a|) → 1. Отже, послідовність випадкових величин n збігається ймовірно до a. Повернемося до виміру часу на "Біглі". Показ кожного хронометра x i , i = 1,...,n - це вимір, незалежне від інших приладів. Очевидно, що конструкція хронометра така, що його роботі відсутня систематична помилка. Це означає, що одні екземпляри хронометрів можуть "йти вперед", інші "відставати", але ці помилки випадкові, пов'язані з виготовленням цього зразка. Математично це означає, що середній час – справжній. Якість конструкції та технології виготовлення хронометрів характеризується тим, наскільки однорідна за точністю ходу вся продукція в цілому. Математично виражається розкидом показань окремих приладів, тобто. дисперсією випадкових величин x i. Дисперсія середнього в n = 24 разів менша, ніж дисперсія окремого хронометра. Тому "середній час", визначений за 24 хронометрами в середньому ближче до справжнього часу майже в 5 разів, ніж час будь-якого окремого хронометра.

Побудуємо довірчий інтервал для оцінки дисперсії випадкової величини, розподіленої за нормальним законом,MSEXCEL.

Побудова довірчого інтервалудля оцінки наведено у статті. Процедура побудови довірчого інтервалудля оцінки має багато спільного з процедурою оцінки середньоготому у цій статті вона викладена менш докладно, ніж у зазначеній статті.

Формулювання завдання.Припустимо, що з генеральної сукупностімає з невідомим середнім значеннямμ та невідомої дисперсієюσ 2 взята вибіркарозміру n. Необхідно на підставі цієї вибіркиоцінити дисперсію розподілута побудувати довірчий інтервал.

Примітка: Побудова відносно нечутлива до відхилення. генеральної сукупностівід. А ось при побудові довірчого інтервалу для оцінкивимога нормальностіє суворим.

ПОРАДА: Для побудови Довірчого інтервалунам знадобиться знання наступних понять:

В якості точковою оцінкою дисперсії розподілу,з якого взята вибірка, використовують Дисперсію вибіркиs 2 .

Також, перед процедурою перевірки гіпотези, дослідник встановлює необхідний - це допустима для цього завдання помилка першого роду, тобто. можливість відхилити нульову гіпотезу, коли вона вірна ( рівень значущостіпозначають буквою (альфа) і найчастіше вибирають рівним 0,1; 0,05 або 0,01)

У статті про ХІ2-розподілпоказано, що y=(n-1) s 2 /σ 2 має ХІ2-розподілз n-1 ступенем свободи.

Скористаємося цією властивістю та побудуємо двосторонній довірчий інтервалдля оцінки дисперсії.