Оценки за очакване и дисперсия.

Необходимостта от оценка математическо очакванеспоред резултатите от теста се появява в задачи, когато резултатът от експеримент се описва със случайна променлива и математическото очакване на тази случайна променлива се приема като индикатор за качеството на изследвания обект. Например, като показател за надеждност може да се приеме математическото очакване на времето за безотказна работа на една система, а при оценка на ефективността на производството на продукта, математическото очакване на броя на използваемите продукти и др.

Проблемът за оценка на математическото очакване се формулира по следния начин. Нека приемем, че за да определим неизвестна стойностслучайната променлива X трябва да бъде направена n независима и свободна от систематични грешки измервания X срещу X 2 ,..., X стр.Трябва да изберете най-добрата оценка на математическото очакване.

Най-добрата и най-често срещана оценка на математическото очакване в практиката е средноаритметичната стойност на резултатите от теста

също наричан статистическиили извадкова средна стойност.

Нека покажем, че оценката t xотговаря на всички изисквания за оценка на всеки параметър.

1. От израза (5.10) следва, че

т.е. оценка t" x- безпристрастна оценка.

2. Съгласно теоремата на Чебишев средноаритметичната стойност на резултатите от теста се сближава по вероятност с математическото очакване, т.е.

Следователно, оценката (5.10) е последователна оценка на математическото очакване.

3. Дисперсия на оценката t x,равен

С увеличаване на размера на извадката n намалява неограничено. Доказано е, че ако случайна променлива X е подчинена на нормалния закон за разпределение, то за всеки Пдисперсията (5.11) ще бъде минимална, а оценката t x- ефективна оценка на математическото очакване. Познаването на дисперсията на оценката позволява да се направи преценка относно точността на определяне на неизвестната стойност на математическото очакване, използвайки тази оценка.

Средната аритметична стойност се използва като оценка на математическото очакване, ако резултатите от измерването са еднакво точни (вариации D, i = 1, 2, ..., Псъщото във всяко измерение). На практика обаче трябва да се сблъскате с проблеми, при които резултатите от измерването са различни (например по време на тестване измерванията се извършват с различни инструменти). В този случай оценката за математическото очакване има формата

Където - тегло на z-то измерение.

Във формула (5.12) резултатът от всяко измерване е включен със собственото си тегло СЪС.. Следователно, оценката на резултатите от измерването t xНаречен среднопретеглена стойност.

Може да се покаже, че оценката (5.12) е безпристрастна, последователна и ефективна оценка на математическото очакване. Минималната дисперсия на оценката се дава от


При провеждане на експерименти с модели на компютър подобни проблеми възникват, когато оценките се намират от резултатите от няколко серии от тестове и броят на тестовете във всяка серия е различен. Например, две серии от тестове бяха проведени с обем n 1и p 2, въз основа на резултатите от които са получени оценки T xi и t x_.За да се повиши точността и надеждността на определяне на математическото очакване, резултатите от тези серии от тестове се комбинират. За да направите това, използвайте израз (5.12)

При изчисляване на коефициентите C, вместо дисперсиите D, техните оценки, получени от резултатите от теста във всяка серия, се заместват.

Подобен подход се използва при определяне на вероятността за възникване случайно събитиевъз основа на резултатите от серия от тестове.

За да се оцени математическото очакване на случайна променлива X, в допълнение към средната стойност на извадката, могат да се използват други статистики. Най-често за тези цели се използват членове. вариационна серия, т.е. редовни статистики, на базата на които се базират оценките,

отговарящи на основните изисквания, а именно последователност и непредубеденост.

Да приемем, че вариационната серия съдържа n = 2kчленове. Тогава всяка от средните стойности може да се приеме като оценка на математическото очакване:

При което пръст на краксредно аритметично

не е нищо повече от статистическата медиана на разпределението на случайната променлива X, тъй като има очевидно равенство

Предимството на статистическата медиана е, че тя е свободна от влиянието на аномални резултати от наблюдението, което е неизбежно при използване на първата средна стойност, тоест средната стойност на най-малкия и най-големия брой вариационни серии.

За нечетен размер на извадката П = 2k- 1 статистическа медиана е нейният среден елемент, т.е. Да сечлен на вариационната серия Аз = x k.

Има разпределения, за които средноаритметичното не е ефективна оценка на математическото очакване, например разпределението на Лаплас. Може да се покаже, че за разпределението на Лаплас ефективна оценка на математическото очакване е медианата на извадката.

Доказано е, че ако случайната променлива X има нормално разпределение, тогава при достатъчно голям размер на извадката законът за разпределение на статистическата медиана е близък до нормалния с числени характеристики

От сравнението на формули (5.11) и (5.14) следва, че дисперсията на статистическата медиана е 1,57 пъти по-голяма от дисперсията на средноаритметичната стойност. Следователно средноаритметичната стойност като оценка на математическото очакване е толкова пъти по-ефективна от статистическата медиана. Въпреки това, поради простотата на изчисленията и нечувствителността към аномални резултати от измерването („замърсяване“ на пробата), на практика статистическата медиана все пак се използва като оценка на математическото очакване.

Трябва да се отбележи, че за непрекъснати симетрични разпределения математическото очакване и медианата са еднакви. Следователно статистическата медиана може да служи като добра оценка на математическото очакване само ако разпределението на случайната променлива е симетрично.

За асиметрични разпределения, статистическата медиана азима значително отклонение спрямо математическото очакване, поради което е неподходящо за оценката му.

ПРЕДМЕТ:Точкови оценки на математическото очакване. Точкови оценки на дисперсията. Точкова оценка на вероятността от събитие. Точкова оценка на параметрите на равномерното разпределение.

клауза 1.Точкови оценки на математическото очакване.

Да приемем, че функцията на разпределение на случайната променлива ξ зависи от неизвестния параметър θ : P (ξ θ;).

Ако х 1 , х 2 …., х не извадка от общата съвкупност на случайна променлива ξ, след това чрез оценка на параметъра θ е произволна функция от примерни стойности

Стойността на оценката се променя от извадка на извадка и следователно е случайна променлива. В повечето експерименти стойността на тази случайна променлива е близка до стойността на оценения параметър, ако за всяка стойност n математическото очакване на стойността е равно на истинската стойност на параметъра, тогава се наричат ​​оценки, които удовлетворяват условието; безпристрастен. Безпристрастната оценка означава, че оценката не подлежи на системна грешка.

Оценката се нарича оценка на последователен параметър θ , ако за всяко ξ>0 е вярно

По този начин, с увеличаване на размера на извадката, точността на резултата се увеличава.

Позволявам х 1 , х 2 х н – извадка от генералната съвкупност, съответстваща на случайна променлива ξ с неизвестно математическо очакване и известна дисперсия Dξ=σ 2 . Нека изградим няколко оценки на неизвестния параметър. Ако, тогава , т.е. въпросният оценител е безпристрастен оценител. Но тъй като стойността изобщо не зависи от размера на извадката n, оценката не е валидна.

Ефективна оценка на математическото очакване на нормално разпределена случайна променлива е оценката

Оттук нататък, за да оценим неизвестното математическо очакване на случайна променлива, ще използваме средната стойност на извадката, т.е.

Съществуват стандартни (редовни) методи за получаване на оценки на неизвестни параметри на разпределението. Най-известните от тях: метод на моментите, метод на максимална вероятностИ метод на най-малките квадрати.

т.2 Точкови оценки на дисперсията.

За дисперсията σ 2 на случайна променлива ξ Може да се предложи следната оценка:

къде е средната стойност на извадката.

Доказано е, че тази оценка е валидна, но разместен.

Като последователна безпристрастна оценка на дисперсията използвайте стойността

Това е именно безпристрастността на оценката с 2 обяснява по-честото му използване като оценка на стойността дξ.

Имайте предвид, че Mathcad предлага като оценка на дисперсията стойността , не s 2: функция вар(х) изчислява стойността

Където означава (х) -извадкова средна стойност.

ЗАДАЧА 6.5

Μξ и дисперсия дξ случайна променлива ξ въз основа на примерните стойности, дадени в задачата.

Процедура за изпълнение на задачата

    Прочетете файл, съдържащ примерни стойности от диска, или въведете определена проба от клавиатурата.

    Изчисляване на точкови оценки Μξ И дξ.

Пример за изпълнение на задача

Намерете последователни безпристрастни оценки на математическото очакване Μξ и дисперсия дξ случайна величина ξ според примерните стойности, дадени в следната таблица.

За извадка, дефинирана от таблица от този тип (дадена е стойността на извадката и число, показващо колко пъти тази стойност се среща в извадката), формулите за последователни безпристрастни оценки на очакването и дисперсията са:

, ,

Където к - брой стойности в таблицата; н i - брой стойности х i в пробата; н- размер на извадката.

По-долу е даден фрагмент от работен документ на Mathcad с изчисления на точкови оценки.

От горните изчисления става ясно, че предубедената оценка дава подценяване на оценката на дисперсията.

клауза 3. Точкова оценка на вероятността за събитие

Да предположим, че в някакъв експеримент събитието А(благоприятен резултат от теста) възниква с вероятност стри не се случва с вероятност р = 1 - Р.Задачата е да се получи оценка на неизвестния параметър на разпределението стрвъз основа на резултатите от серията нслучайни експерименти. За определен брой тестове нброй благоприятни резултати мв серия от тестове - случайна променлива с разпределение на Бернули. Нека го обозначим с буквата μ.

Ако събитието Ав поредица от нпроведени независими тестове

мпъти, след това оценката на стойността стрпредлага се да се изчисли по формулата

Нека разберем свойствата на предложената оценка. Тъй като случайната променлива μ тогава има разпределение на Бернули Μμ= н.п. ИМ = М = p, т.е. има безпристрастна оценка.

За тестовете на Бернули е валидна теоремата на Бернули, според която , т.е. клас стр богат.

Доказано е, че тази оценка е ефективна, тъй като при равни други условия има минимална дисперсия.

В Mathcad за симулиране на извадка от стойности на случайна променлива с разпределение на Бернули е предназначена функцията rbinom(fc,η,ρ), която генерира вектор от Да се произволни числа, κα­ ι всеки от които е равен на броя успехи в серия от η независими опити с вероятност за успех ρ във всеки.

ЗАДАЧА 6.6

Симулирайте няколко проби от стойности на случайна променлива с разпределение на Бернули дадена стойностпараметър Р. Изчислете оценката на параметъра за всяка проба стри сравнете с посочената стойност. Представете резултатите от изчислението графично.

Процедура за изпълнение на задачата

1. Използване на функцията rbinom(1, н, стр), описват и генерират последователност от стойности на случайна променлива, имаща разпределение на Бернули с дадено стрИ нЗа н = 10, 20, ..., Ν, като функция от размера на извадката П.

2. Изчислете за всяка стойност нточкови вероятностни оценки Р.

Пример за изпълнение на задача

Пример за получаване на точкови оценки за обемни проби н= 10, 20,..., 200 стойности на случайна променлива μ с разпределение на Бернули с параметър стр= 0,3, дадено по-долу.

Забележка. Тъй като стойността на функцията е вектор, брой успехи в серия ннезависими опити с вероятност за успех стрвъв всеки опит се съдържа в първия компонент на вектора rbinom(1, н, стр), т.е. броят на успехите е rbinom(1, н, стр). В горния фрагмент к- аз векторен компонент Ρ съдържа броя на успехите в серията 10 кнезависими тестове за к = 1,2,..., 200.

т. 4. Точкова оценка на параметри на равномерно разпределение

Нека да разгледаме още един поучителен пример. Нека е извадка от генералната съвкупност, съответстваща на случайна променлива ξ, която има равномерно разпределение в сегмент с неизвестен параметър θ . Нашата задача е да оценим този неизвестен параметър.

Нека разгледаме един от възможни начиниизграждане на необходимата оценка. Ако ξ е случайна променлива, която има равномерно разпределение на сегмента, тогава Μ ξ = . Тъй като оценката на величината известен Μξ =, след това за оценка на параметъра θ можете да вземете оценка

Безпристрастността на оценката е очевидна:

След като изчислихме дисперсията и границата D като n →∞, проверяваме валидността на оценката:

За да получите различна оценка на параметъра θ Нека да разгледаме други статистики. Нека = max). Нека намерим разпределението на случайната променлива:

След това математическото очакване и дисперсията на случайната променлива

с разпределение са равни съответно:

;

тези. Оценката е основателна, но необективна. Ако обаче вместо = max) считаме = max), тогава и следователно оценката е последователна и безпристрастна.

В същото време, тъй като

значително по-ефективен от оценката

Например, с n = 97, разпространението на оценката θ^ е 33 ral по-малко от разпространението на оценката

Последният пример още веднъж показва, че изборът на статистическа оценка на неизвестен параметър на разпределение е важна и нетривиална задача.

В Mathcad за симулиране на извадка от стойности на случайна променлива, която има равномерно разпределение в интервала [a, b], е предназначена функцията runif(fc,o,b), която генерира вектор от Да се случайни числа, всяко от които е стойността на случайна променлива, равномерно разпределена на интервала [a, 6].

Оценки на математическото очакване и дисперсията.

Запознахме се с понятието параметри на разпределението в теорията на вероятностите. Например в нормалния закон за разпределение, определен от функцията за плътност на вероятността

служат като параметри А– математическо очакване и А- средно аритметично стандартно отклонение. В разпределението на Поасон параметърът е числото а = пр.

Определение. Статистическа оценка на неизвестен параметър на теоретично разпределение е неговата приблизителна стойност, в зависимост от извадковите данни(x 1, x 2, x 3,..., xk; n 1, n 2, n 3,..., n k), т.е. някаква функция на тези количества.

Тук x 1, x 2, x 3,..., x k– характерни стойности, n 1, n 2, n 3,..., n k– съответните честоти. Статистическата оценка е случайна променлива.

Нека означим с θ е оцененият параметър и през θ * - неговият статистическа оценка. Магнитуд | θ *–θ | Наречен точност на оценката.Колкото по-малко | θ *–θ |, толкова по-добре, неизвестният параметър е по-точно дефиниран.

Да отбележи θ * имаше практическо значение, не трябва да съдържа систематична грешка и в същото време да има възможно най-малката дисперсия. В допълнение, с увеличаване на размера на извадката, вероятността от произволно малки отклонения | θ *–θ | трябва да е близо до 1.

Нека формулираме следните определения.

1. Оценката на параметъра се нарича безпристрастна, ако нейното математическо очакване е M(θ *) равен на оценения параметър θ, т.е.

М(θ *) = θ, (1)

и изместен ако

М(θ *) ≠ θ, (2)

2. Една оценка θ* се казва, че е последователна, ако за всяко δ > 0

(3)

Равенството (3) се чете така: оценка θ * се сближава по вероятност към θ .

3. Оценка θ* се нарича ефективна, ако за дадено n има най-малката дисперсия.

Теорема 1.Средната стойност на извадката X B е безпристрастна и последователна оценка на математическото очакване.

Доказателство. Нека извадката е представителна, т.е. всички елементи от генералната съвкупност имат еднаква възможност да бъдат включени в извадката. Характерни стойности x 1, x 2, x 3,..., x nмогат да се приемат като независими случайни променливи X 1, X 2, X 3, ..., X nс еднакви разпределения и числени характеристики, включително равни математически очаквания, равни а,

Тъй като всяко от количествата X 1, X 2, X 3, ..., X pима разпределение, което съответства на разпределението на населението, тогава М(х)= а.Ето защо

откъдето следва, че е последователна оценка М(х).

Използвайки правилото за изследване за екстремум, е възможно да се докаже, че това също е ефективна оценка М(х).

Нека се проведат независими експерименти върху случайна променлива с неизвестно математическо очакване и дисперсия, което даде резултатите - . Нека изчислим последователни и безпристрастни оценки за параметрите и .

Като оценка за математическото очакване вземаме средноаритметичната стойност на експерименталните стойности

. (2.9.1)

Според закона за големите числа тази оценка е богат , със стойност по вероятност. Същата оценка е и безпристрастен , тъй като

. (2.9.2)

Дисперсията на тази оценка е

. (2.9.3)

Може да се покаже, че за нормалния закон на разпределение тази оценка е ефективен . За други закони това може да не е така.

Нека сега оценим дисперсията. Нека първо изберем за оценка формулата за статистическа дисперсия

. (2.9.4)

Нека проверим последователността на оценката на дисперсията. Нека отворим скобите във формула (2.9.4)

.

Когато първият член се сближава по вероятност със стойността , във втория - до. Така нашата оценка се сближава по вероятност с дисперсията

,

следователно тя е богат .

Да проверим неразместен оценки за количеството. За да направим това, заместваме израза (2.9.1) във формула (2.9.4) и вземаме предвид, че случайните променливи независима

,

. (2.9.5)

Нека преминем във формула (2.9.5) към флуктуациите случайни променливи

Отваряйки скобите, получаваме

,

. (2.9.6)

Нека изчислим математическото очакване на стойността (2.9.6), като вземем предвид това

. (2.9.7)

Връзката (2.9.7) показва, че стойността, изчислена по формула (2.9.4) не е безпристрастна оценка за дисперсия. Неговото математическо очакване не е равно, а малко по-малко. Такава оценка води до низходяща систематична грешка. За да премахнете такова отклонение, трябва да въведете корекция чрез умножаване на стойността. Тази коригирана статистическа дисперсия може след това да служи като безпристрастен оценител за дисперсията

. (2.9.8)

Тази оценка е също толкова валидна, колкото и оценката, тъй като стойността е .

На практика, вместо оценка (2.9.8), понякога е по-удобно да се използва еквивалентна оценка, свързана с втория начален статистически момент

. (2.9.9)

Оценките (2.9.8), (2.9.9) не са ефективни. Може да се покаже, че в случай на нормален закон за разпределение те ще бъдат асимптотично ефективна (по желание се стремят към минималната възможна стойност).

Така могат да се формулират следните правила за обработка на ограничен по обем статистически материал. Ако при независими експерименти случайната променлива приема стойностите с неизвестно математическо очакване и дисперсия, тогава за определяне на тези параметри трябва да се използват приблизителни оценки

(2.9.10)

Край на работата -

Тази тема принадлежи към раздела:

Бележки от лекции по математика, теория на вероятностите, математическа статистика

Катедра Висша математика и компютърни науки.. Конспекти от лекции.. по математика..

Ако имате нужда от допълнителен материал по тази тема или не сте намерили това, което търсите, препоръчваме да използвате търсенето в нашата база данни с произведения:

Какво ще правим с получения материал:

Ако този материал е бил полезен за вас, можете да го запазите на страницата си в социалните мрежи:

Всички теми в този раздел:

Теория на вероятностите
Теорията на вероятностите е дял от математиката, в който се изучават моделите на случайни масови явления. Явление, което е случайно, се нарича

Статистическа дефиниция на вероятността
Събитието е случайно явление, което може или не може да се появи в резултат на опит (двусмислено явление). Посочете събитията с главни латински букви

Пространство на елементарни събития
Нека има много събития, свързани с някакво преживяване и: 1) в резултат на преживяването се появява едно и само едно нещо

Действия върху събития
Сумата от две събития и

Пренареждания
Броят на различните пермутации на елементи се означава с

Разположения
Чрез поставяне на елементите според

Комбинации
Комбинация от елементи

Формула за добавяне на вероятности за несъвместими събития
Теорема. Вероятността за сумата от две несъвместими събития е равна на сумата от вероятностите за тези събития. (1

Формула за добавяне на вероятности за произволни събития
Теорема. Вероятността за сумата от две събития е равна на сумата от вероятностите за тези събития без вероятността за техния продукт.

Формула за умножение на вероятностите
Нека две събития и да бъдат дадени. Помислете за събитието

Формула за пълна вероятност
Нека е пълна група от несъвместими събития; те се наричат ​​хипотези; Нека разгледаме някакво събитие

Формула за вероятност на хипотеза (Бейес)
Да разгледаме отново – пълната група от несъвместими хипотези и събитието

Асимптотична формула на Поасон
В случаите, когато броят на тестовете е голям и вероятността за възникване на събитие

Случайни дискретни величини
Случайно количество е количество, което при повторение на експеримента може да приеме различни числени стойности. Случайната променлива се нарича дискретна,

Случайни непрекъснати променливи
Ако в резултат на експеримент случайна променлива може да приеме произволна стойност от определен сегмент или цялата реална ос, тогава тя се нарича непрекъсната. закон

Функция на плътността на вероятността на случайна непрекъсната променлива
Нека бъде. Нека разгледаме една точка и да я увеличим

Числени характеристики на случайни величини
Случайните дискретни или непрекъснати променливи се считат за напълно определени, ако техните закони за разпределение са известни. Всъщност, знаейки законите за разпределение, винаги можете да изчислите вероятността за удряне

Квантили на случайни променливи
Квантил от порядъка на случайна непрекъсната променлива

Математическо очакване на случайни променливи
Математическото очакване на случайна величина характеризира нейната средна стойност. Всички стойности на случайната променлива са групирани около тази стойност. Нека първо разгледаме случайната дискретна променлива

Стандартно отклонение и дисперсия на случайни променливи
Нека първо разгледаме случайна дискретна променлива. Режим на числови характеристики, медиана, квантили и математическо очакване

Моменти на случайни променливи
В допълнение към математическото очакване и дисперсията, теорията на вероятностите използва числови характеристикипо-високи порядки, които се наричат ​​моменти на случайни променливи.

Теореми за числените характеристики на случайни величини
Теорема 1. Математическото очакване на неслучайна стойност е равно на самата тази стойност. Доказателство: Нека

Биномен закон на разпределение

Закон за разпределение на Поасон
Нека произволна дискретна променлива приема стойностите

Закон за равномерно разпределение
Равномерният закон за разпределение на случайна непрекъсната променлива е законът на функцията за плътност на вероятността, който

Закон за нормалното разпределение
Нормалният закон за разпределение на случайна непрекъсната променлива е законът за функцията на плътността

Експоненциален закон за разпределение
Експоненциалното или експоненциалното разпределение на случайна променлива се използва в приложения на теорията на вероятностите като теорията опашка, теория на надеждността

Системи от случайни величини
На практика в приложенията на теорията на вероятностите често се срещат проблеми, при които резултатите от даден експеримент се описват не от една случайна променлива, а от няколко случайни променливи наведнъж.

Система от две случайни дискретни променливи
Нека две са произволни дискретни количестваобразуват система. Случайна стойност

Система от две случайни непрекъснати променливи
Нека сега системата е образувана от две случайни непрекъснати променливи. Законът за разпределение на тази система се нарича вероятно

Условни закони на разпределение
Нека зависими произволни непрекъснати количества

Числени характеристики на система от две случайни величини
Началният момент на подреждане на система от случайни променливи

Система от няколко случайни променливи
Резултатите, получени за система от две случайни променливи, могат да бъдат обобщени за случая на системи, състоящи се от произволен брой случайни променливи. Нека системата е образувана от множество

Нормален закон на разпределение за система от две случайни променливи
Помислете за система от две произволни непрекъснати количества. Законът за разпределение на тази система е нормалният закон за разпределение

Пределни теореми на теорията на вероятностите
Основната цел на дисциплината теория на вероятностите е да изучава моделите на случайни масови явления. Практиката показва, че наблюдението на маса от еднородни случайни явления разкрива

Неравенството на Чебишев
Нека разгледаме случайна променлива с математическо очакване

Теорема на Чебишев
Ако случайните променливи са по двойки независими и имат крайни, колективно ограничени дисперсии

Теорема на Бернули
С неограничено увеличаване на броя на експериментите, честотата на възникване на събитие се сближава по вероятност с вероятността на събитието

Централна гранична теорема
При добавяне на случайни променливи с всякакви закони на разпределение, но със съвместно ограничени вариации, законът на разпределение

Основни проблеми на математическата статистика
Законите на теорията на вероятностите, обсъдени по-горе, представляват математически израз на реални модели, които действително съществуват в различни случайни масови явления. Изучаване

Проста статистическа съвкупност. Статистическа функция на разпределение
Нека разгледаме някаква случайна променлива, чийто закон на разпределение е неизвестен. Изисква се въз основа на опит

Статистически серии. стълбовидна диаграма
При голям брой наблюдения (от порядъка на стотици) популацията става неудобна и тромава за записване на статистически материал. За прегледност и компактност, статистически материал

Числени характеристики на статистическото разпределение
В теорията на вероятностите бяха разгледани различни числени характеристики на случайни променливи: математическо очакване, дисперсия, начални и централни моменти от различен порядък. Подобни числа

Избор на теоретично разпределение по метода на моментите
Всяко статистическо разпределение неизбежно съдържа елементи на случайност, свързани с ограничения брой наблюдения. С голям брой наблюдения тези елементи на случайност се изглаждат,

Проверка на правдоподобността на хипотезата за формата на закона за разпределение
Нека даденото статистическо разпределениеапроксимирана с някаква теоретична крива или

Критерии за съгласие
Нека разгледаме един от най-често използваните критерии за съответствие - така нареченият критерий на Пиърсън. Познайте

Точкови оценки за неизвестни параметри на разпределение
В пп. 2.1. – 2.7 разгледахме подробно как се решават първата и втората основни задачи на математическата статистика. Това са проблемите за определяне на законите на разпределение на случайни променливи въз основа на експериментални данни

Доверителен интервал. Вероятност за доверие
На практика, с малък брой експерименти върху случайна променлива, приблизителна замяна на неизвестния параметър

Нека има случайна променлива X и нейните параметри са математическото очакване Аи дисперсията са неизвестни. Бяха проведени N независими експеримента върху стойността X, които дадоха резултатите x 1, x 2, x n.

Без да намаляваме общността на разсъжденията, ще считаме тези стойности на случайната променлива за различни. Ще разгледаме стойностите x 1, x 2, x n като независими, еднакво разпределени случайни променливи X 1, X 2, X n.

Най-простият методстатистическа оценка - методът на заместване и аналогия - се състои в вземането на съответната характеристика на разпределението на извадката - характеристиката на извадката - като оценка на една или друга числена характеристика (средна стойност, дисперсия и т.н.) на генералната съвкупност.

Използване на метода на заместване като оценка на математическото очакване Атрябва да вземем математическото очакване на извадковото разпределение - извадковата средна стойност. Така получаваме

За да проверите безпристрастността и последователността на средната стойност на извадката като оценка А, разгледайте тази статистика като функция на избрания вектор (X 1, X 2, X n). Като се има предвид, че всяка от величините X 1, X 2, X n има същия закон на разпределение като стойността X, заключаваме, че числените характеристики на тези величини и стойността X са еднакви: M(X i) = M(X) = а, D(X i) = D(X) = , i = 1, 2, н , където X i са колективно независими случайни променливи.

следователно

От тук по дефиниция получаваме, че това е безпристрастна оценка А, и тъй като D()®0 за n®¥, тогава по теоремата от предходния параграф е последователна оценка на математическото очакване Аобщо население.

Ефективността или неефективността на оценката зависи от вида на закона за разпределение на случайната променлива X. Може да се докаже, че ако стойността X е разпределена по нормален закон, тогава оценката е ефективна. За други закони за разпределение това може да не е така.

Безпристрастна оценка на общата дисперсияслужи като коригирана дисперсия на извадката

,

защото , където е общата дисперсия. Наистина ли,

Оценката s -- 2 за общата дисперсия също е валидна, но не е ефективна. Въпреки това, в случай на нормално разпределение, то е „асимптотично ефективно“, т.е., когато n нараства, съотношението на неговата дисперсия към минимално възможното се доближава до единица за неопределено време.

Така че, ако се даде извадка от разпределението F( х) случайна променлива X с неизвестно математическо очакване Аи дисперсия, тогава за изчисляване на стойностите на тези параметри имаме право да използваме следните приблизителни формули:

а ,

.

Тук x-i- - опция за вземане на проби, n- i - - опции за честота x i, - - размер на извадката.
За изчисляване на коригираната дисперсия на извадката формулата е по-удобна


.

За да опростите изчислението, препоръчително е да преминете към условни опции (както при това е изгодно да се вземе оригиналната версия, разположена в средата на интервалната вариационна серия). Тогава

, .

Интервална оценка

По-горе разгледахме въпроса за оценката на неизвестен параметър Аедно число. Ние наричаме такива оценки точкови оценки. Те имат недостатъка, че при малък размер на извадката могат да се различават значително от оценените параметри. Следователно, за да получите представа за близостта между параметър и неговата оценка, в математическа статистикавъвеждат се така наречените интервални оценки.

Нека в извадката за параметър q бъде намерено точкова оценка q*. Обикновено изследователите получават достатъчно информация предварително. голяма вероятност g (например 0,95; 0,99 или 0,999), така че събитие с вероятност g може да се счита за практически надеждно и се повдига въпросът за намирането на стойност e > 0, за която

.

Променяйки това равенство, получаваме:

и в този случай ще кажем, че интервалът ]q * - e; q * + e[ покрива оценения параметър q с вероятност g.

Интервал ]q * -e; q * +e [ се извиква доверителен интервал .

Вероятността g се нарича надеждност (вероятност за доверие) интервална оценка.

завършва доверителен интервал, т.е. се наричат ​​точките q * -e и q * +e граници на доверие .

Числото e се нарича точност на оценката .

Като пример за проблема за определяне на доверителните граници, разгледайте въпроса за оценка на математическото очакване на случайна променлива X, която има нормален закон на разпределение с параметри Аи s, т.е. X = N( а, с). Математическото очакване в този случай е равно на А. Въз основа на наблюдения X 1, X 2, X n изчисляваме средната стойност и оценка дисперсия s 2.

Оказва се, че от примерните данни е възможно да се конструира случайна променлива

което има разпределение на Стюдънт (или t-разпределение) с n = n -1 степени на свобода.

Нека използваме таблица A.1.3 и намерим за дадена вероятност g и число n числото t g, така че вероятността

P(|t(n)|< t g) = g,

.

След като направихме очевидни трансформации, получаваме,

Процедурата за прилагане на F-теста е следната:

1. Приема се, че разпределението на населението е нормално. За дадено ниво на значимост a се формулира нулевата хипотеза H 0: s x 2 = s y 2 относно равенството общи отклонениянормални популации при конкурентната хипотеза H 1: s x 2 > s y 2.

2. Две независими проби се получават от популации X и Y съответно с обем n x и n y.

3. Изчислете стойностите на коригираните дисперсии на извадката s x 2 и s y 2 (методите за изчисление са разгледани в §13.4). По-голямата от дисперсиите (s x 2 или s y 2) се обозначава с 1 2, по-малката - s 2 2.

4. Стойността на F-критерия се изчислява по формулата F obs = s 1 2 / s 2 2.

5. Използвайки таблицата на критичните точки на разпределението на Fisher-Snedecor, при дадено ниво на значимост a и броя на степените на свобода n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 е броят на степени на свобода на по-голямата коригирана дисперсия), се намира критичната точка F cr (a, n 1, n 2).

Имайте предвид, че таблица A.1.7 показва критични стойностиедностранен F-тест. Следователно, ако се приложи двустранен критерий (H 1: s x 2 ¹ s y 2), тогава дясностранната критична точка F cr (a/2, n 1, n 2) се търси чрез нивото на значимост a/ 2 (половината от определената стойност) и броя на степените на свобода n 1 и n 2 (n 1 е броят на степените на свобода на по-голяма дисперсия). Лявата критична точка може да не бъде намерена.

6. Прави се заключението: ако изчислената стойност на F-критерия е по-голяма или равна на критичната стойност (F obs ³ F cr), тогава дисперсиите се различават значително при дадено ниво на значимост. В противен случай (F обс.< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Задача 15.1. Разходът на суровини за единица продукция по старата технология беше:

Използване на нова технология:

Ако приемем, че съответните население X и Y имат нормални разпределенияпроверете дали променливостта на потреблението на суровини за нови и стари технологии не се различава, ако вземем нивото на значимост a = 0,1.

Решение. Продължаваме по реда, посочен по-горе.

1. Ще преценим променливостта на потреблението на суровини от нови и стари технологии въз основа на стойностите на дисперсията. Така нулевата хипотеза има формата H 0: s x 2 = s y 2. Като конкурентна хипотеза приемаме хипотеза H 1: s x 2 ¹ s y 2, тъй като не сме сигурни предварително, че някоя от общите вариации е по-голяма от другата.

2-3. Нека намерим примерните отклонения. За да опростим изчисленията, нека да преминем към условни опции:

u i = x i - 307, v i = y i - 304.

Ще организираме всички изчисления под формата на следните таблици:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Контрол: å m i u i 2 + 2å m i u i + m i = Контрол: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Нека намерим коригираните примерни отклонения:

4. Нека сравним дисперсиите. Нека намерим съотношението на по-голямата коригирана дисперсия към по-малката:

.

5. По условие конкурентната хипотеза има формата s x 2 ¹ s y 2, следователно критичната област е двустранна и при намиране на критичната точка трябва да се вземат нива на значимост, които са половината от определената стойност.

Съгласно таблица A.1.7, като използваме нивото на значимост a/2 = 0,1/2 = 0,05 и броя на степените на свобода n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, намираме критична точка F cr (0,05; 8) = 3,28.

6. Тъй като F obs.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и нови технологииприемаме.

По-горе, когато тествахме хипотези, приехме нормалното разпределение на изследваните случайни променливи. Специални проучвания обаче показват, че предложените алгоритми са много стабилни (особено при големи размери на извадката) по отношение на отклонения от нормалното разпределение.