فترات الثقة للتوقعات الرياضية والتباين والاحتمال. حلول المشاكل

لتؤخذ عينة من عامة السكان الخاضعين للقانون طبيعيتوزيع Xن( م; ). يعتمد هذا الافتراض الأساسي للإحصاء الرياضي على نظرية الحد المركزي. وليكن معروفا الانحراف المعياري العام , لكن التوقع الرياضي للتوزيع النظري غير معروف م(متوسط ​​القيمة ).

في هذه الحالة، العينة تعني ، التي تم الحصول عليها خلال التجربة (القسم 3.4.2)، ستكون أيضًا متغيرًا عشوائيًا م;
). ثم الانحراف "المطبيع".
N(0;1) – هو متغير عشوائي عادي قياسي.

المهمة هي العثور على تقدير الفاصل الزمني ل م. دعونا نبني فترة ثقة ذات وجهين لـ م بحيث يكون التوقع الرياضي الحقيقي له باحتمال معين (الموثوقية) .

قم بتعيين مثل هذا الفاصل الزمني للقيمة
- وهذا يعني إيجاد القيمة القصوى لهذه الكمية
والحد الأدنى
، وهي حدود المنطقة الحرجة:
.

لأن هذا الاحتمال متساوي
ثم جذر هذه المعادلة
يمكن العثور عليها باستخدام جداول دالة لابلاس (الجدول 3، الملحق 1).

ثم مع الاحتمال ويمكن القول أن المتغير العشوائي
أي أن المتوسط ​​العام المطلوب ينتمي إلى الفترة
. (3.13)

مقاس
(3.14)

مُسَمًّى دقةالتقييمات.

رقم
الكمية التوزيع الطبيعي- يمكن العثور عليها كوسيطة لدالة لابلاس (الجدول 3، الملحق 1)، مع مراعاة العلاقة 2Ф( ش)=، أي. F( ش)=
.

إلى الوراء تعيين القيمةالانحرافات يمكن العثور على احتمالية أن ينتمي المتوسط ​​العام غير المعروف إلى الفترة
. للقيام بذلك تحتاج إلى حساب

. (3.15)

اخرج سكانتم استخراج عينة عشوائية باستخدام أخذ العينات المتكررة. من مكافئ.
يمكن ايجاده الحد الأدنىحجم إعادة التشكيل ن، ضروري لفترة الثقة بموثوقية معينة لم تتجاوز القيمة المحددة مسبقا . يتم تقدير حجم العينة المطلوب باستخدام الصيغة:

. (3.16)

دعنا نستكشف دقة التقدير
:

1) كلما زاد حجم العينة نضخامة يتناقص، وبالتالي دقة التقدير يزيد.

2) ج يزيدموثوقية التقييم تزداد قيمة الحجة ش(لأن F(ش) يزيد رتابة) وبالتالي يزيد . في هذه الحالة، الزيادة في الموثوقية يقللدقة تقييمها .

تقييم
(3.17)

مُسَمًّى كلاسيكي(أين ر- معلمة معينة اعتمادا على و ن)، لأن فهو يصف قوانين التوزيع الأكثر شيوعًا.

3.5.3 فترات الثقة لتقدير التوقع الرياضي للتوزيع الطبيعي مع انحراف معياري غير معروف 

وليعلم أن السكان يخضعون لقانون التوزيع الطبيعي Xن( م;)، حيث القيمة معدل الجذر التربيعيالانحرافات مجهول.

ولإنشاء فاصل الثقة لتقدير المتوسط ​​العام في هذه الحالة، يتم استخدام الإحصائيات
، وجود توزيع الطلاب مع ك= ن– 1 درجات الحرية . وهذا يأتي من حقيقة ذلك N(0;1) (انظر القسم 3.5.2)، و
(انظر القسم 3.5.3) ومن تعريف توزيع الطلاب (الجزء 1. القسم 2.11.2).

دعونا نجد دقة التقدير الكلاسيكي لتوزيع الطلاب: أي. سوف نجد رمن الصيغة (3.17). دع احتمال تحقيق عدم المساواة
نظرا للموثوقية :

. (3.18)

بسبب ال تSt( ن-1) فالظاهر ذلك ريعتمد على و ن، لذلك يكتبون عادة
.

(3.19)

أين
– وظيفة توزيع الطلاب مع ن-1 درجات الحرية.

حل هذه المعادلة ل م، نحصل على الفاصل الزمني
والتي تغطي بشكل موثوق  المعلمة غير المعروفة م.

ضخامة ر , ن-1، يستخدم لتحديد فاصل الثقة متغير عشوائي ت(ن-1), موزعة حسب اختبار t مع ن-1 درجة الحرية تسمى معامل الطالب. يجب العثور عليه من خلال القيم المعطاة نو  من جداول "النقاط الحرجة لتوزيع الطلاب". (الجدول 6، الملحق 1)، والتي تمثل حلول المعادلة (3.19).

ونتيجة لذلك، نحصل على التعبير التالي دقة فترة الثقة للتقدير توقع رياضي(المتوسط ​​العام)، إذا كان التباين غير معروف:

(3.20)

وبالتالي، هناك صيغة عامة لبناء فترات الثقة للتوقع الرياضي للسكان:

أين هي دقة فاصل الثقة اعتمادا على التشتت المعروف أو غير المعروف تم العثور عليه وفقا للصيغ، على التوالي 3.16. و3.20.

المشكلة 10.تم إجراء بعض الاختبارات، ونتائجها موضحة في الجدول:

س أنا

ومن المعروف أنهم يخضعون لقانون التوزيع الطبيعي مع
. البحث عن التقييم م* للتوقع الرياضي م، قم ببناء فاصل ثقة 90% لذلك.

حل:

لذا، م(2.53;5.47).

المشكلة 11.يتم قياس عمق البحر بواسطة جهاز خطأه المنهجي 0، وتتوزع الأخطاء العشوائية حسب القانون العادي، مع انحراف معياري = 15 م. ما هو عدد القياسات المستقلة التي يجب إجراؤها لتحديد العمق بأخطاء لا تزيد عن 5 أمتار عند مستوى ثقة 90%؟

حل:

وفقا لظروف المشكلة لدينا Xن( م; )، أين = 15 م، =5 م، =0.9. دعونا نجد الحجم ن.

1) مع موثوقية معينة = 0.9 نجد من الجدول 3 (الملحق 1) وسيطة دالة لابلاس ش = 1.65.

2) معرفة دقة التقدير المحددة =ش=5، دعونا نجد
. لدينا

. وبالتالي عدد الاختبارات ن25.

المشكلة 12.أخذ عينات درجة الحرارة ريتم عرض الأيام الستة الأولى من شهر يناير في الجدول:

أوجد فترة الثقة للتوقع الرياضي مالسكان مع احتمال الثقة
وتقييم العام الانحراف المعياري س.

حل:


و
.

2) تقدير غير متحيز العثور عليه باستخدام الصيغة
:

=-175

=234.84

;
;

=-192

=116


.

3) بما أن التباين العام غير معروف ولكن تقديره معروف، فتقدير التوقع الرياضي منستخدم توزيع الطلاب (الجدول 6، الملحق 1) والصيغة (3.20).

لأن ن 1 =ن 2 = 6، إذن،
, س 1 = 6.85 لدينا:
، وبالتالي -29.2-4.1<م 1 < -29.2+4.1.

لذلك -33.3<م 1 <-25.1.

وبالمثل لدينا،
, س 2 = 4.8

–34.9< م 2 < -29.1. Тогда доверительные интервалы примут вид: م 1 (-33.3;-25.1) و م 2 (-34.9;-29.1).

في العلوم التطبيقية، على سبيل المثال، في تخصصات البناء، يتم استخدام جداول فترات الثقة لتقييم دقة الأشياء، والتي يتم تقديمها في الأدبيات المرجعية ذات الصلة.

هناك نوعان من التقديرات في الإحصائيات: النقطة والفاصل الزمني. تقدير النقطةعبارة عن عينة إحصائية واحدة تُستخدم لتقدير معلمة مجتمعية. على سبيل المثال، متوسط ​​العينة هو تقدير نقطي للتوقع الرياضي للسكان وتباين العينة س 2- تقدير نقطة التباين السكاني σ 2. لقد ثبت أن متوسط ​​العينة هو تقدير غير متحيز للتوقعات الرياضية للسكان. يسمى متوسط ​​العينة غير متحيز لأن متوسط ​​جميع متوسطات العينة (بنفس حجم العينة) ن) يساوي التوقع الرياضي لعامة السكان.

من أجل تباين العينة س 2أصبح تقديرًا غير متحيز للتباين السكاني σ 2، ينبغي تعيين مقام تباين العينة على قدم المساواة ن – 1 ، لكن لا ن. وبعبارة أخرى، فإن التباين السكاني هو متوسط ​​جميع تباينات العينة الممكنة.

عند تقدير المعلمات السكانية، يجب أن نأخذ في الاعتبار أن إحصاءات العينات مثل ، تعتمد على عينات محددة. لأخذ هذه الحقيقة بعين الاعتبار، للحصول عليها تقدير الفاصل الزمنيالتوقعات الرياضية لعامة السكان، وتحليل توزيع متوسطات العينة (لمزيد من التفاصيل، انظر). وتتميز الفترة التي تم إنشاؤها بمستوى ثقة معين، وهو ما يمثل احتمالية تقدير المعلمة السكانية الحقيقية بشكل صحيح. يمكن استخدام فترات ثقة مماثلة لتقدير نسبة الخاصية روالكتلة الموزعة الرئيسية للسكان.

قم بتنزيل المذكرة بالتنسيق أو بالأمثلة بالتنسيق

بناء فاصل الثقة للتوقع الرياضي للسكان مع انحراف معياري معروف

بناء فاصل الثقة لحصة خاصية في السكان

يوسع هذا القسم مفهوم فترة الثقة ليشمل البيانات الفئوية. وهذا يسمح لنا بتقدير حصة الخاصية في السكان رباستخدام حصة العينة رس= س/ن. كما هو مبين، إذا كانت الكميات نرو ن(1 - ع)إذا تجاوزت الرقم 5، فيمكن تقريب التوزيع ذي الحدين كالمعتاد. لذلك، لتقدير حصة الخاصية في السكان رمن الممكن إنشاء فاصل زمني يساوي مستوى الثقة فيه (1 - α)x100%.


أين صس- حصة العينة من الخاصية تساوي X/ن، أي. عدد النجاحات مقسوما على حجم العينة ر- حصة الخاصية في عموم السكان، ز- القيمة الحرجة للتوزيع الطبيعي الموحد، ن- حجم العينة.

مثال 3.لنفترض أنه تم استخراج عينة مكونة من 100 فاتورة تم ملؤها خلال الشهر الماضي من نظام المعلومات. لنفترض أن 10 من هذه الفواتير تم تجميعها مع وجود أخطاء. هكذا، ر= 10/100 = 0.1. يتوافق مستوى الثقة 95% مع القيمة الحرجة Z = 1.96.

وبالتالي فإن احتمال احتواء ما بين 4.12% و15.88% من الفواتير على أخطاء هو 95%.

بالنسبة لحجم عينة معين، يبدو فاصل الثقة الذي يحتوي على نسبة الخاصية في المجتمع أوسع من المتغير العشوائي المستمر. وذلك لأن قياسات المتغير العشوائي المستمر تحتوي على معلومات أكثر من قياسات البيانات الفئوية. بمعنى آخر، تحتوي البيانات الفئوية التي تأخذ قيمتين فقط على معلومات غير كافية لتقدير معلمات توزيعها.

فيحساب التقديرات المستخرجة من عدد محدود من السكان

تقدير التوقع الرياضي.عامل التصحيح للسكان النهائي ( الشركة العامة للفوسفات) تم استخدامه لتقليل الخطأ المعياري بعامل. عند حساب فترات الثقة لتقديرات المعلمات السكانية، يتم تطبيق عامل التصحيح في الحالات التي يتم فيها سحب العينات دون إعادتها. وبالتالي، فإن فترة الثقة للتوقع الرياضي لها مستوى ثقة يساوي (1 - α)x100%، يتم حسابه بواسطة الصيغة:

مثال 4.لتوضيح استخدام عامل التصحيح لعدد محدود من السكان، دعونا نعود إلى مشكلة حساب فاصل الثقة لمتوسط ​​مبلغ الفواتير، والتي تمت مناقشتها أعلاه في المثال 3. لنفترض أن الشركة تصدر 5000 فاتورة شهريًا، و =110.27 دولار س= 28.95 دولارًا، ن = 5000, ن = 100, α = 0.05، ر 99 = 1.9842. باستخدام الصيغة (6) نحصل على:

تقدير حصة الميزة.عند الاختيار بدون إرجاع، فإن فاصل الثقة لنسبة السمة التي لها مستوى ثقة يساوي (1 - α)x100%، يتم حسابه بواسطة الصيغة:

فترات الثقةوالقضايا الأخلاقية

عند أخذ عينات من السكان واستخلاص استنتاجات إحصائية، غالبا ما تنشأ قضايا أخلاقية. العامل الرئيسي هو مدى توافق فترات الثقة وتقديرات النقاط لإحصائيات العينة. يمكن أن يؤدي نشر تقديرات النقاط دون تحديد فترات الثقة المرتبطة بها (عادةً عند مستوى ثقة 95%) وحجم العينة التي يتم اشتقاقها منها إلى حدوث ارتباك. قد يعطي هذا للمستخدم انطباعًا بأن تقدير النقطة هو بالضبط ما يحتاجه للتنبؤ بخصائص المجتمع بأكمله. وبالتالي، من الضروري أن نفهم أنه في أي بحث لا ينبغي أن يكون التركيز على تقديرات النقاط، ولكن على تقديرات الفواصل الزمنية. وبالإضافة إلى ذلك، ينبغي إيلاء اهتمام خاص للاختيار الصحيح لأحجام العينات.

في أغلب الأحيان، تكون أهداف التلاعب الإحصائي هي نتائج المسوحات الاجتماعية للسكان حول بعض القضايا السياسية. وفي الوقت نفسه، يتم نشر نتائج الاستطلاع على الصفحات الأولى من الصحف، ويتم نشر خطأ أخذ العينات ومنهجية التحليل الإحصائي في مكان ما في الوسط. ولإثبات صحة تقديرات النقاط التي تم الحصول عليها، من الضروري الإشارة إلى حجم العينة التي تم الحصول عليها على أساسها، وحدود فترة الثقة ومستوى أهميتها.

الملاحظة التالية

يتم استخدام مواد من كتاب Levin et al. إحصائيات المديرين. – م: ويليامز، 2004. – ص. 448-462

نظرية الحد المركزيتنص على أنه مع وجود حجم عينة كبير بما فيه الكفاية، يمكن تقريب توزيع العينة للوسائل عن طريق التوزيع الطبيعي. هذه الخاصية لا تعتمد على نوع توزيع السكان.

وغيرها كلها عبارة عن تقديرات لنظائرها النظرية، والتي يمكن الحصول عليها إن لم يكن عينة، ولكن المجتمع العام متاح. ولكن للأسف، فإن عامة السكان مكلفون للغاية ولا يمكن الوصول إليهم في كثير من الأحيان.

مفهوم تقدير الفاصل الزمني

أي تقدير عينة له بعض الانتشار، لأن هو متغير عشوائي يعتمد على القيم الموجودة في عينة معينة. لذلك، للحصول على استنتاجات إحصائية أكثر موثوقية، ينبغي للمرء أن يعرف ليس فقط تقدير النقطة، ولكن أيضا الفاصل الزمني، والذي ذو احتمالية عالية γ (جاما) يغطي المؤشر الذي تم تقييمه θ (ثيتا).

رسميًا، هاتان القيمتان (إحصائيات) ت 1 (س)و ت 2 (س)، ماذا تي 1< T 2 ، والتي عند مستوى احتمال معين γ تم استيفاء الشرط:

باختصار، هذا محتمل γ أو أكثر يكون المؤشر الحقيقي بين النقاط ت 1 (س)و ت 2 (س)والتي تسمى الحدود الدنيا والعليا فاصل الثقة.

أحد شروط بناء فترات الثقة هو الحد الأقصى لضيقها، أي. يجب أن تكون قصيرة قدر الإمكان. الرغبة طبيعية تماماً، لأن... يحاول الباحث تحديد موقع المعلمة المطلوبة بشكل أكثر دقة.

ويترتب على ذلك أن فترة الثقة يجب أن تغطي الحد الأقصى لاحتمالات التوزيع. ويجب أن يكون التقييم نفسه في المركز.

أي أن احتمال الانحراف (المؤشر الحقيقي عن التقدير) للأعلى يساوي احتمال الانحراف للأسفل. تجدر الإشارة أيضًا إلى أنه بالنسبة للتوزيعات غير المتماثلة، فإن الفاصل الزمني على اليمين لا يساوي الفاصل الزمني على اليسار.

يوضح الشكل أعلاه بوضوح أنه كلما زاد احتمال الثقة، كلما اتسع الفاصل الزمني - علاقة مباشرة.

كانت هذه مقدمة قصيرة لنظرية تقدير الفاصل الزمني للمعلمات غير المعروفة. دعنا ننتقل إلى إيجاد حدود الثقة للتوقع الرياضي.

فاصل الثقة للتوقعات الرياضية

إذا تم توزيع البيانات الأصلية على، فإن المتوسط ​​سيكون قيمة عادية. يتبع هذا من القاعدة التي تنص على أن المجموعة الخطية من القيم العادية لها أيضًا توزيع طبيعي. ولذلك، لحساب الاحتمالات يمكننا استخدام الجهاز الرياضي لقانون التوزيع الطبيعي.

ومع ذلك، فإن هذا سيتطلب معرفة معلمتين - التوقع والتباين، والتي عادة ما تكون غير معروفة. يمكنك، بالطبع، استخدام التقديرات بدلا من المعلمات (المتوسط ​​الحسابي و )، ولكن بعد ذلك لن يكون توزيع المتوسط ​​طبيعيا تماما، وسيتم تسويته قليلا إلى الأسفل. وقد لاحظ المواطن الأيرلندي ويليام جوسيت هذه الحقيقة بذكاء، حيث نشر اكتشافه في عدد مارس 1908 من مجلة Biometrica. ولأغراض السرية، وقع جوسيت على نفسه كطالب. هكذا ظهر توزيع الطالب.

ومع ذلك، فإن التوزيع الطبيعي للبيانات المستخدمة من قبل K. Gauss في تحليل الأخطاء في الملاحظات الفلكية، نادر للغاية في الحياة الأرضية ويصعب تحديده (هناك حاجة إلى حوالي 2 ألف ملاحظة للحصول على دقة عالية). ولذلك، فمن الأفضل تجاهل افتراض الحالة الطبيعية واستخدام الأساليب التي لا تعتمد على توزيع البيانات الأصلية.

والسؤال الذي يطرح نفسه: ما هو توزيع الوسط الحسابي إذا تم حسابه من بيانات توزيع مجهول؟ الجواب من النظرية المعروفة في نظرية الاحتمالات نظرية الحد المركزي(كبت). في الرياضيات، هناك العديد من المتغيرات (تم تحسين الصياغة على مر السنين)، ولكن جميعها، بشكل تقريبي، تتلخص في العبارة التي مفادها أن مجموع عدد كبير من المتغيرات العشوائية المستقلة يخضع لقانون التوزيع الطبيعي.

عند حساب الوسط الحسابي، يتم استخدام مجموع المتغيرات العشوائية. ومن هنا يتبين أن الوسط الحسابي له توزيع طبيعي، حيث التوقع هو توقع البيانات الأصلية، والتباين هو .

يعرف الأشخاص الأذكياء كيفية إثبات CLT، لكننا سنتحقق من ذلك بمساعدة تجربة أجريت في برنامج Excel. لنقم بمحاكاة عينة مكونة من 50 متغيرًا عشوائيًا موزعة بشكل موحد (باستخدام دالة Excel RANDBETWEEN). ثم سنقوم بعمل 1000 عينة من هذه العينات ونحسب الوسط الحسابي لكل منها. دعونا نلقي نظرة على توزيعها.

ويمكن ملاحظة أن توزيع المتوسط ​​قريب من القانون الطبيعي. وإذا تم زيادة حجم العينة وعددها، فسيكون التشابه أفضل.

الآن بعد أن رأينا بأعيننا صحة CLT، يمكننا، باستخدام، حساب فترات الثقة للوسط الحسابي، والتي تغطي المتوسط ​​الحقيقي أو التوقع الرياضي مع احتمال معين.

لتحديد الحدود العليا والدنيا، تحتاج إلى معرفة معلمات التوزيع الطبيعي. كقاعدة عامة، لا يوجد شيء، لذلك يتم استخدام التقديرات: المتوسط ​​الحسابيو تباين العينة. وأكرر أن هذه الطريقة تعطي تقديرًا جيدًا فقط مع العينات الكبيرة. عندما تكون العينات صغيرة، يوصى غالبًا باستخدام توزيعة الطالب. لا تصدق ذلك! يحدث توزيع الطالب للمتوسط ​​فقط عندما يتم توزيع البيانات الأصلية بشكل طبيعي، أي تقريبًا لا يحدث أبدًا. لذلك، من الأفضل تعيين حد أدنى على الفور لكمية البيانات المطلوبة واستخدام الأساليب الصحيحة غير المقاربة. يقولون 30 ملاحظة كافية. خذ 50 - لن تخطئ.

تي 1.2- الحدود الدنيا والعليا لفترة الثقة

- عينة المتوسط ​​الحسابي

س 0– الانحراف المعياري للعينة (غير متحيزة)

ن - حجم العينة

γ - احتمالية الثقة (عادة تساوي 0.9 أو 0.95 أو 0.99)

ج γ =Φ -1 ((1+γ)/2)- القيمة العكسية لدالة التوزيع الطبيعي القياسية. ببساطة، هذا هو عدد الأخطاء المعيارية من الوسط الحسابي إلى الحد الأدنى أو الأعلى (تتوافق هذه الاحتمالات الثلاثة مع قيم 1.64 و1.96 و2.58).

جوهر الصيغة هو أن الوسط الحسابي يؤخذ ثم يخصص منه مبلغ معين ( مع γ) الأخطاء القياسية ( ق 0 /√ن). كل شيء معروف، خذه واعتبره.

قبل انتشار استخدام الحواسيب الشخصية، كانت تحصل على قيم دالة التوزيع الطبيعي وعكسها. لا تزال تستخدم حتى يومنا هذا، ولكن من الأكثر فعالية استخدام صيغ Excel الجاهزة. يمكن حساب جميع العناصر من الصيغة أعلاه ( و ) بسهولة في برنامج Excel. ولكن هناك صيغة جاهزة لحساب فاصل الثقة - الثقة. نورم. بناء الجملة الخاص به هو كما يلي.

الثقة.NORM(alpha;standard_off;الحجم)

ألفا- مستوى الأهمية أو مستوى الثقة، والذي يساوي في الترميز المعتمد أعلاه 1- γ، أي. احتمال أن الرياضيةسيكون التوقع خارج فترة الثقة. مع مستوى ثقة 0.95، ألفا هو 0.05، الخ.

Standard_off- الانحراف المعياري لبيانات العينة. ليست هناك حاجة لحساب الخطأ القياسي؛ إذ سيقسم برنامج Excel نفسه على جذر n.

مقاس- حجم العينة (ن).

نتيجة الدالة CONFIDENCE NORM هي الحد الثاني من صيغة حساب فاصل الثقة، أي. نصف فاصل وبناء على ذلك، فإن النقاط السفلية والعليا هي متوسط ​​± القيمة التي تم الحصول عليها.

وبالتالي، من الممكن بناء خوارزمية عالمية لحساب فترات الثقة للوسط الحسابي، والتي لا تعتمد على توزيع البيانات الأصلية. ثمن العالمية هو طبيعتها المقاربة، أي. الحاجة إلى استخدام عينات كبيرة نسبيا. ومع ذلك، في عصر التكنولوجيا الحديثة، عادة ما يكون جمع الكمية المطلوبة من البيانات ليس بالأمر الصعب.

اختبار الفرضيات الإحصائية باستخدام فترات الثقة

(الوحدة 111)

واحدة من المشاكل الرئيسية التي تم حلها في الإحصاء هي. جوهرها هو لفترة وجيزة على النحو التالي. يتم الافتراض، على سبيل المثال، أن توقعات عامة السكان تساوي بعض القيمة. ثم يتم بناء توزيع العينة التي يمكن ملاحظتها لتوقع معين. بعد ذلك، ينظرون إلى مكان وجود المتوسط ​​الحقيقي في هذا التوزيع الشرطي. فإذا تجاوزت الحدود المقبولة فإن ظهور مثل هذا المتوسط ​​أمر مستبعد جداً، وإذا تكررت التجربة مرة واحدة يكاد يكون مستحيلاً، وهو ما يتناقض مع الفرضية المطروحة والتي تم رفضها بنجاح. إذا لم يتجاوز المتوسط ​​المستوى الحرج، فلن يتم رفض الفرضية (ولكنها أيضًا غير مثبتة!).

لذا، بمساعدة فترات الثقة، في حالتنا الخاصة بالتوقع، يمكنك أيضًا اختبار بعض الفرضيات. فإنه من السهل جدا القيام به. لنفترض أن المتوسط ​​الحسابي لعينة معينة يساوي 100. ويتم اختبار الفرضية بأن القيمة المتوقعة هي، على سبيل المثال، 90. أي أننا إذا طرحنا السؤال بشكل بدائي، يبدو الأمر كما يلي: هل يمكن أن يكون ذلك مع الحقيقة قيمة المتوسط ​​تساوي 90، المتوسط ​​الملاحظ تبين أنه 100؟

للإجابة على هذا السؤال، ستحتاج بالإضافة إلى ذلك إلى معلومات حول الانحراف المعياري وحجم العينة. لنفترض أن الانحراف المعياري هو 30 وعدد الملاحظات هو 64 (لاستخراج الجذر بسهولة). ثم الخطأ المعياري للوسط هو 30/8 أو 3.75. لحساب فاصل ثقة بنسبة 95%، ستحتاج إلى إضافة خطأين قياسيين إلى كل جانب من المتوسط ​​(على نحو أكثر دقة، 1.96). سيكون فاصل الثقة حوالي 100±7.5 أو من 92.5 إلى 107.5.

مزيد من المنطق على النحو التالي. إذا كانت القيمة التي يتم اختبارها تقع ضمن فترة الثقة، فإنها لا تتعارض مع الفرضية، لأن يقع ضمن حدود التقلبات العشوائية (باحتمال 95%). إذا كانت النقطة التي يتم فحصها تقع خارج نطاق الثقة، فإن احتمال حدوث مثل هذا الحدث يكون صغيرًا جدًا، وعلى أي حال أقل من المستوى المقبول. وهذا يعني رفض الفرضية لأنها تتعارض مع البيانات المرصودة. في حالتنا، فإن الفرضية الخاصة بالقيمة المتوقعة تقع خارج فترة الثقة (القيمة المختبرة 90 غير متضمنة في الفترة 100±7.5)، لذلك يجب رفضها. الإجابة على السؤال البدائي أعلاه، ينبغي أن يقال: لا، لا يمكن، في أي حال، يحدث هذا نادرا للغاية. في كثير من الأحيان، فهي تشير إلى الاحتمال المحدد لرفض الفرضية بشكل خاطئ (المستوى p)، وليس المستوى المحدد الذي تم بناء فاصل الثقة عليه، ولكن المزيد عن ذلك في وقت آخر.

كما ترون، فإن إنشاء فاصل ثقة للمتوسط ​​(أو التوقعات الرياضية) ليس بالأمر الصعب. الشيء الرئيسي هو فهم الجوهر، وبعد ذلك سوف تتحرك الأمور. ومن الناحية العملية، تستخدم معظم الحالات فاصل ثقة بنسبة 95%، وهو عبارة عن خطأين معياريين تقريبًا على جانبي المتوسط.

هذا كل شئ حتى الان. أتمنى لك كل خير!

يمكنك استخدام نموذج البحث هذا للعثور على المهمة التي تحتاجها. أدخل كلمة أو عبارة من المهمة أو رقمها، إذا كنت تعرفها.


<نوع الإدخال="submit" value="" name="searchbutton" class="button">

البحث فقط في هذا القسم


فترات الثقة: قائمة الحلول للمشاكل

فترات الثقة: النظرية والمشاكل

فهم فترات الثقة

دعونا نقدم بإيجاز مفهوم فترة الثقة، والتي
1) تقدير بعض معلمات العينة العددية مباشرة من بيانات العينة نفسها،
2) يغطي قيمة هذه المعلمة باحتمال γ.

فاصل الثقةللمعلمة X(مع احتمال γ) يسمى فاصل من النموذج، بحيث ، ويتم حساب القيم بطريقة ما من العينة.

عادة في المسائل التطبيقية يؤخذ احتمال الثقة يساوي γ ​​= 0.9؛ 0.95؛ 0.99.

دعونا نفكر في عينة من الحجم n، مصنوعة من عامة السكان، وموزعة وفقًا لقانون التوزيع الطبيعي. دعونا نظهر ما هي الصيغ المستخدمة للعثور عليها فترات الثقة لمعلمات التوزيع- التوقع الرياضي والتشتت (الانحراف المعياري).

فاصل الثقة للتوقعات الرياضية

حالة 1.تباين التوزيع معروف ويساوي . ثم فاصل الثقة للمعلمة ألديه النموذج:
ريتم تحديده من جدول توزيع لابلاس وفقًا للعلاقة

الحالة 2.تباين التوزيع غير معروف؛ ويتم حساب تقدير نقطة التباين من العينة. ثم فاصل الثقة للمعلمة ألديه النموذج:
، حيث يتم حساب متوسط ​​العينة من العينة، المعلمة ريتم تحديدها من جدول توزيع الطلاب

مثال.بناءً على 7 قياسات لكمية معينة، وجد أن متوسط ​​نتائج القياس هو 30 وتباين العينة هو 36. أوجد الحدود التي يتم من خلالها احتواء القيمة الحقيقية للكمية المقاسة بموثوقية 0.99.

حل.سوف نجد . ثم يمكن العثور على حدود الثقة للفاصل الزمني الذي يحتوي على القيمة الحقيقية للقيمة المقاسة باستخدام الصيغة:
، أين هو متوسط ​​العينة، هو تباين العينة. نستبدل جميع القيم ونحصل على:

فاصل الثقة للتباين

ونحن نعتقد، بشكل عام، أن التوقع الرياضي غير معروف، ولا يُعرف سوى التقدير النقطي غير المتحيز للتباين. ثم يكون فاصل الثقة بالشكل:
، أين - كميات التوزيع المحددة من الجداول.

مثال.وبناء على بيانات 7 اختبارات تم العثور على القيمة التقييمية للانحراف المعياري ق=12. أوجد، باحتمال 0.9، عرض فترة الثقة المبنية لتقدير التشتت.

حل.يمكن العثور على فاصل الثقة للتباين السكاني غير المعروف باستخدام الصيغة:

نعوض ونحصل على:


ثم يكون عرض فاصل الثقة هو 465.589-71.708=393.881.

فاصل الثقة للاحتمال (النسبة)

حالة 1.دع حجم العينة وكسر العينة (التكرار النسبي) معروفين في المشكلة. ثم يكون فاصل الثقة للحصة العامة (الاحتمال الحقيقي) بالشكل:
، حيث المعلمة ريتم تحديده من جدول توزيع لابلاس باستخدام العلاقة.

الحالة 2.إذا كان الحجم الإجمالي للمجتمع الذي تم أخذ العينة منه معروفًا أيضًا في المشكلة، فيمكن العثور على فاصل الثقة للحصة العامة (الاحتمال الحقيقي) باستخدام الصيغة المعدلة:
.

مثال.ومن المعلوم أن أوجد الحدود التي يحتمل أن تكون الحصة العامة ضمنها.

حل.نحن نستخدم الصيغة:

دعونا نجد المعلمة من الشرط ، نحصل على البديل في الصيغة:


ستجد أمثلة أخرى للمشاكل في الإحصائيات الرياضية على الصفحة

دع المتغير العشوائي (يمكننا التحدث عن مجتمع عام) يتم توزيعه وفقًا للقانون الطبيعي، والذي يُعرف التباين فيه D = 2 (> 0). من عامة السكان (على مجموعة الكائنات التي يتم تحديد متغير عشوائي لها)، يتم إجراء عينة بالحجم n. تعتبر العينة x 1 , x 2 ,..., x n بمثابة مجموعة من المتغيرات العشوائية المستقلة n الموزعة بنفس الطريقة (الطريقة الموضحة أعلاه في النص).

تمت أيضًا مناقشة المساواة التالية وإثباتها مسبقًا:

Mx 1 = Mx 2 = ... = Mx n = M؛

Dx 1 = Dx 2 = ... = Dx n = D;

ويكفي أن نثبت ببساطة (نحذف البرهان) أن المتغير العشوائي في هذه الحالة يتم توزيعه أيضًا وفقًا للقانون العادي.

دعونا نشير إلى الكمية غير المعروفة M بواسطة a ونختار، بناءً على الموثوقية المحددة، الرقم d > 0 بحيث يتم استيفاء الشرط:

ف(- أ< d) = (1)

وبما أن المتغير العشوائي موزع وفق القانون العادي مع التوقع الرياضي M = M = a والتباين D = D /n = 2 /n، نحصل على:

ف(- أ< d) =P(a - d < < a + d) =

يبقى أن نختار د بحيث تكون المساواة قائمة

بالنسبة لأي رقم، يمكنك استخدام الجدول للعثور على رقم t بحيث يكون (t)= / 2. ويسمى هذا الرقم t أحيانًا الكمية.

الآن من المساواة

دعونا نحدد قيمة د:

نحصل على النتيجة النهائية من خلال تقديم الصيغة (1) في النموذج:

معنى الصيغة الأخيرة هو كما يلي: مع الموثوقية، فاصل الثقة

يغطي المعلمة غير المعروفة a = M من السكان. يمكننا أن نقول ذلك بشكل مختلف: يحدد تقدير النقطة قيمة المعلمة M بدقة d= t / والموثوقية.

مهمة. ليكن هناك مجتمع عام ذو صفة معينة موزعة وفق قانون عادي بتباين يساوي 6.25. تم أخذ حجم عينة n = 27 وتم الحصول على متوسط ​​قيمة العينة للخاصية = 12. أوجد فاصل ثقة يغطي التوقع الرياضي غير المعروف للخاصية المدروسة لعامة السكان مع موثوقية = 0.99.

حل. أولاً، باستخدام جدول دالة لابلاس، نجد قيمة t من المساواة (t) = / 2 = 0.495. بناءً على القيمة التي تم الحصول عليها t = 2.58، نحدد دقة التقدير (أو نصف طول فترة الثقة) d: d = 2.52.58 / 1.24. ومن هنا نحصل على فترة الثقة المطلوبة: (10.76؛ 13.24).

الفرضية الإحصائية التباين العام

فترة الثقة للتوقع الرياضي للتوزيع الطبيعي مع تباين غير معروف

ليكن متغيرا عشوائيا موزعا وفق قانون عادي مع توقع رياضي مجهول M والذي نرمز له بالحرف a. لنقم بعمل عينة من المجلد n. دعونا نحدد متوسط ​​​​العينة ونصحح تباين العينة s 2 باستخدام الصيغ المعروفة.

قيمة عشوائية

موزعة وفقًا لقانون الطالب بدرجات حرية n - 1.

وتتمثل المهمة في العثور على رقم t لموثوقية معينة وعدد درجات الحرية n - 1 بحيث تكون متساوية

أو ما يعادلها من المساواة

هنا مكتوب بين قوسين الشرط أن قيمة المعلمة غير المعروفة a تنتمي إلى فترة زمنية معينة، وهي فترة الثقة. تعتمد حدودها على الموثوقية بالإضافة إلى معلمات أخذ العينات و s.

لتحديد قيمة t من حيث الحجم، نحول المساواة (2) إلى النموذج:

الآن، باستخدام جدول المتغير العشوائي t الموزع حسب قانون الطالب، وباستخدام الاحتمال 1 - وعدد درجات الحرية n - 1 نجد t. الصيغة (3) تعطي الإجابة على المشكلة المطروحة.

مهمة. وفي اختبارات التحكم لـ 20 مصباحًا كهربائيًا، كان متوسط ​​مدة تشغيلها يساوي 2000 ساعة بمتوسط انحراف مربع(يتم حسابه على أنه الجذر التربيعي لتباين العينة المصحح) ويساوي 11 ساعة. من المعروف أن زمن تشغيل المصباح هو متغير عشوائي موزع توزيعاً طبيعياً. حدد بموثوقية 0.95 فترة ثقة للتوقع الرياضي لهذا المتغير العشوائي.

حل. القيمة 1 - في هذه الحالة تساوي 0.05. وحسب جدول توزيع الطلاب، حيث أن عدد درجات الحرية يساوي 19 نجد: t = 2.093. دعونا الآن نحسب دقة التقدير: 2.093121/ = 56.6. ومن هنا نحصل على فترة الثقة المطلوبة: (1943.4; 2056.6).