सामान्य जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण। सामान्य वितरण के विचरण के लिए विश्वास अंतराल

होने देना यादृच्छिक मूल्यएक सामान्य नियम के अनुसार वितरित किया जाता है, जिसके लिए विचरण D अज्ञात है। आकार n का एक नमूना बनाया गया है। इससे संशोधित नमूना विचरण s 2 निर्धारित किया जाता है। यादृच्छिक मूल्य

स्वतंत्रता की n -1 डिग्री के साथ कानून 2 के अनुसार वितरित। विश्वसनीयता को देखते हुए, आप 1 2 और 2 2 अंतरालों की कितनी भी सीमाएँ पा सकते हैं, जैसे कि

आइए निम्नलिखित स्थितियों से 1 2 और 2 2 खोजें:

पी(2 1 2) = (1 -)/ 2(**)

पी(2 2 2) = (1 -)/ 2(***)

जाहिर है, यदि अंतिम दो शर्तें पूरी होती हैं, तो समानता (*) सत्य है।

यादृच्छिक चर 2 के लिए तालिकाओं में, समीकरण का समाधान आमतौर पर दिया जाता है

ऐसी मेज से दिया गया मूल्य q और स्वतंत्रता की डिग्री n - 1 की संख्या से, q 2 का मान निर्धारित किया जा सकता है। इस प्रकार, सूत्र (***) में मान 2 2 तुरंत मिल जाता है।

1 2 निर्धारित करने के लिए हम रूपांतरित करते हैं (**):

पी(2 1 2) = 1 - (1 -)/ 2 = (1 +)/ 2

परिणामी समानता हमें तालिका से मान 1 2 निर्धारित करने की अनुमति देती है।

अब जब मान 1 2 और 2 2 मिल गए हैं, तो आइए समानता (*) को रूप में निरूपित करें

आइए हम अंतिम समानता को इस तरह से फिर से लिखें कि अज्ञात मान D के लिए विश्वास अंतराल की सीमाएँ निर्धारित हों:

यहां से वह सूत्र प्राप्त करना आसान है जिसका उपयोग खोजने के लिए किया जाता है विश्वास अंतरालमानक विचलन के लिए:

काम। हम मान लेंगे कि एक निश्चित मोड में चलने वाले इंजनों के साथ एक ही प्रकार के हेलीकॉप्टरों के कॉकपिट में शोर एक सामान्य कानून के अनुसार वितरित एक यादृच्छिक चर है। 20 हेलीकॉप्टरों को यादृच्छिक रूप से चुना गया और उनमें से प्रत्येक में शोर का स्तर (डेसिबल में) मापा गया। माप का संशोधित नमूना विचरण 22.5 पाया गया। अज्ञात को कवर करने वाला विश्वास अंतराल ज्ञात कीजिए मानक विचलनहेलीकाप्टर केबिनों में शोर का स्तर इस प्रकार का 98% विश्वसनीयता के साथ.

समाधान। 19 के बराबर स्वतंत्रता की डिग्री की संख्या और संभावना (1 - 0.98)/2 = 0.01 के आधार पर, हम वितरण तालिका 2 से मान 2 2 = 36.2 पाते हैं। इसी प्रकार, प्रायिकता (1 + 0.98)/2 = 0.99 के साथ, हमें 1 2 = 7.63 प्राप्त होता है। सूत्र (****) का उपयोग करके, हम आवश्यक आत्मविश्वास अंतराल प्राप्त करते हैं: (3.44; 7.49)।

सांख्यिकी में अनुमान दो प्रकार के होते हैं: बिंदु और अंतराल। बिंदु लागतएक अलग नमूना आँकड़ा दर्शाता है जिसका उपयोग किसी पैरामीटर का अनुमान लगाने के लिए किया जाता है जनसंख्या. उदाहरण के लिए, नमूना माध्य एक बिंदु अनुमान है गणितीय अपेक्षाजनसंख्या, और नमूना भिन्नता एस 2- जनसंख्या भिन्नता का बिंदु अनुमान σ 2. यह दिखाया गया है कि नमूना माध्य जनसंख्या की गणितीय अपेक्षा का एक निष्पक्ष अनुमान है। एक नमूना माध्य को निष्पक्ष कहा जाता है क्योंकि सभी नमूना माध्य का औसत (समान नमूना आकार के साथ) एन) सामान्य जनसंख्या की गणितीय अपेक्षा के बराबर है।

नमूना विचरण के लिए एस 2जनसंख्या भिन्नता का एक निष्पक्ष अनुमान बन गया σ 2, नमूना विचरण के हर को बराबर सेट किया जाना चाहिए एन – 1 , लेकिन नहीं एन. दूसरे शब्दों में, जनसंख्या भिन्नता सभी संभावित नमूना भिन्नताओं का औसत है।

जनसंख्या मापदंडों का अनुमान लगाते समय, यह ध्यान में रखा जाना चाहिए कि नमूना आँकड़े जैसे , पर निर्भर करता है विशिष्ट नमूने. इस तथ्य को ध्यान में रखना, प्राप्त करना अंतराल अनुमानसामान्य जनसंख्या की गणितीय अपेक्षा, नमूना साधनों के वितरण का विश्लेषण करें (अधिक जानकारी के लिए, देखें)। निर्मित अंतराल को एक निश्चित आत्मविश्वास स्तर की विशेषता होती है, जो इस संभावना को दर्शाता है कि वास्तविक जनसंख्या पैरामीटर का सही अनुमान लगाया गया है। किसी विशेषता के अनुपात का अनुमान लगाने के लिए समान आत्मविश्वास अंतराल का उपयोग किया जा सकता है आरऔर जनसंख्या का मुख्य वितरित जनसमूह।

नोट को प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

ज्ञात मानक विचलन के साथ जनसंख्या की गणितीय अपेक्षा के लिए एक विश्वास अंतराल का निर्माण करना

जनसंख्या में किसी विशेषता की हिस्सेदारी के लिए विश्वास अंतराल का निर्माण करना

यह खंड विश्वास अंतराल की अवधारणा को श्रेणीबद्ध डेटा तक विस्तारित करता है। इससे हमें जनसंख्या में विशेषता की हिस्सेदारी का अनुमान लगाने की अनुमति मिलती है आरनमूना शेयर का उपयोग करना आरएस= एक्स/एन. जैसा कि संकेत दिया गया है, यदि मात्राएँ एनआरऔर एन(1 - पी)संख्या 5 से अधिक, द्विपद वितरणसामान्य रूप से अनुमान लगाया जा सकता है। इसलिए, जनसंख्या में किसी विशेषता के हिस्से का अनुमान लगाना आरएक ऐसे अंतराल का निर्माण करना संभव है जिसका आत्मविश्वास स्तर बराबर हो (1 - α)x100%.


कहाँ पीएस- विशेषता का नमूना अनुपात बराबर एक्स/एन, अर्थात। सफलताओं की संख्या को नमूना आकार से विभाजित किया गया, आर- सामान्य जनसंख्या में विशेषता का हिस्सा, जेड - महत्वपूर्ण मानमानकीकृत सामान्य वितरण, एन- नमूने का आकार।

उदाहरण 3.आइए मान लें कि पिछले महीने के दौरान भरे गए 100 चालानों का एक नमूना सूचना प्रणाली से निकाला गया है। मान लीजिए कि इनमें से 10 चालान त्रुटियों के साथ संकलित किए गए थे। इस प्रकार, आर= 10/100 = 0.1. 95% विश्वास स्तर महत्वपूर्ण मान Z = 1.96 से मेल खाता है।

इस प्रकार, 4.12% से 15.88% चालानों में त्रुटियाँ होने की संभावना 95% है।

किसी दिए गए नमूना आकार के लिए, जनसंख्या में विशेषता के अनुपात वाला आत्मविश्वास अंतराल एक सतत यादृच्छिक चर की तुलना में व्यापक दिखाई देता है। ऐसा इसलिए है क्योंकि निरंतर यादृच्छिक चर के माप में श्रेणीबद्ध डेटा के माप की तुलना में अधिक जानकारी होती है। दूसरे शब्दों में, श्रेणीबद्ध डेटा जो केवल दो मान लेता है, उसमें उनके वितरण के मापदंडों का अनुमान लगाने के लिए अपर्याप्त जानकारी होती है।

मेंएक सीमित जनसंख्या से निकाले गए अनुमानों की गणना करना

गणितीय अपेक्षा का अनुमान.अंतिम जनसंख्या के लिए सुधार कारक ( पांचवें वेतन आयोग) का उपयोग किसी कारक द्वारा मानक त्रुटि को कम करने के लिए किया गया था। जनसंख्या पैरामीटर अनुमानों के लिए विश्वास अंतराल की गणना करते समय, एक सुधार कारक उन स्थितियों में लागू किया जाता है जहां नमूने वापस किए बिना खींचे जाते हैं। इस प्रकार, गणितीय अपेक्षा के लिए एक आत्मविश्वास अंतराल का आत्मविश्वास स्तर बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

उदाहरण 4.एक सीमित जनसंख्या के लिए सुधार कारक के उपयोग को स्पष्ट करने के लिए, आइए ऊपर उदाहरण 3 में चर्चा की गई चालान की औसत राशि के लिए विश्वास अंतराल की गणना करने की समस्या पर वापस आएं। मान लीजिए कि एक कंपनी प्रति माह 5,000 चालान जारी करती है, और एक्स=110.27 डॉलर, एस= $28.95 एन = 5000, एन = 100, α = 0.05, टी 99 = 1.9842. सूत्र (6) का उपयोग करके हम प्राप्त करते हैं:

किसी सुविधा की हिस्सेदारी का अनुमान.रिटर्न के बिना चुनते समय, आत्मविश्वास स्तर वाले गुण के अनुपात के लिए विश्वास अंतराल बराबर होता है (1 - α)x100%, सूत्र द्वारा गणना की जाती है:

आत्मविश्वास अंतराल और नैतिक मुद्दे

किसी जनसंख्या का नमूना लेते समय और सांख्यिकीय निष्कर्ष निकालते समय, अक्सर नैतिक मुद्दे उठते हैं। मुख्य बात यह है कि नमूना आँकड़ों के आत्मविश्वास अंतराल और बिंदु अनुमान कैसे सहमत होते हैं। संबंधित विश्वास अंतराल (आमतौर पर 95% विश्वास स्तर पर) और जिस नमूना आकार से वे प्राप्त होते हैं उसे निर्दिष्ट किए बिना प्रकाशन बिंदु अनुमान भ्रम पैदा कर सकते हैं। इससे उपयोगकर्ता को यह आभास हो सकता है कि बिंदु अनुमान बिल्कुल वही है जो उसे पूरी आबादी के गुणों की भविष्यवाणी करने के लिए चाहिए। इस प्रकार, यह समझना आवश्यक है कि किसी भी शोध में बिंदु अनुमान पर नहीं, बल्कि अंतराल अनुमान पर ध्यान केंद्रित किया जाना चाहिए। अलावा, विशेष ध्यानदी जानी चाहिए सही चुनावनमूना आकार.

अक्सर, सांख्यिकीय हेरफेर की वस्तुएँ कुछ राजनीतिक मुद्दों पर जनसंख्या के समाजशास्त्रीय सर्वेक्षण के परिणाम होते हैं। इस मामले में, सर्वेक्षण के परिणाम समाचार पत्रों के पहले पन्ने पर प्रकाशित होते हैं, और त्रुटि होती है नमूना सर्वेक्षणऔर कार्यप्रणाली सांख्यिकीय विश्लेषणबीच में कहीं छपा हुआ. प्राप्त बिंदु अनुमानों की वैधता साबित करने के लिए, नमूना आकार को इंगित करना आवश्यक है जिसके आधार पर उन्हें प्राप्त किया गया था, आत्मविश्वास अंतराल की सीमाएं और इसके महत्व का स्तर।

अगला नोट

लेविन एट अल पुस्तक से सामग्री का उपयोग प्रबंधकों के लिए किया जाता है। - एम.: विलियम्स, 2004. - पी. 448-462

केंद्रीय सीमा प्रमेयबताता है कि पर्याप्त बड़े नमूना आकार के साथ, साधनों के नमूना वितरण को सामान्य वितरण द्वारा अनुमानित किया जा सकता है। यह संपत्ति जनसंख्या के वितरण के प्रकार पर निर्भर नहीं करती है।

सामान्य रूप से वितरित जनसंख्या के विचरण के लिए विश्वास अंतराल का निर्माण इस तथ्य पर आधारित है कि यादृच्छिक चर:

n= के साथ एक c 2-पियर्सन वितरण है एन-1 स्वतंत्रता की डिग्री. आइए सेट करें आत्मविश्वास की संभावनाजी और संख्याएँ और स्थिति से निर्धारित करें

संख्याओं और इस स्थिति को संतुष्ट करने के लिए अनंत तरीकों से चयन किया जा सकता है। एक तरीका इस प्रकार है

और .

संख्याओं का मान पियर्सन वितरण के लिए तालिकाओं से निर्धारित किया जाता है। इसके बाद हम असमानता बनाते हैं

परिणामस्वरूप, हमें निम्नलिखित अंतराल प्राप्त होता है विचरण अनुमान सामान्य जनसंख्या:

. (3.25)

कभी-कभी इस अभिव्यक्ति को इस प्रकार लिखा जाता है

, (3.26)

, (3.27)

जहां गुणांकों के लिए विशेष तालिकाएं संकलित की जाती हैं।

उदाहरण 3.10.फैक्ट्री में काम करता है स्वचालित लाइन 100 ग्राम के डिब्बे में इंस्टेंट कॉफ़ी की पैकेजिंग के लिए। यदि भरे हुए डिब्बों का औसत वजन सटीक डिब्बे से भिन्न होता है, तो लाइनों को फिट करने के लिए समायोजित किया जाता है औसत वजनकार्यशील मोड में. यदि द्रव्यमान फैलाव निर्दिष्ट मूल्य से अधिक है, तो मरम्मत और पुन: समायोजन के लिए लाइन को रोक दिया जाना चाहिए। समय-समय पर औसत वजन और इसकी परिवर्तनशीलता की जांच के लिए कॉफी के डिब्बे का चयन किया जाता है। आइए मान लें कि कॉफी के डिब्बे लाइन से यादृच्छिक रूप से चुने गए हैं और भिन्नता का अनुमान लगाया गया है एस 2 =18.540. के लिए 95% विश्वास अंतराल प्लॉट करें सामान्य विचरणएस2.

समाधान।यह मानते हुए कि जनसंख्या का वितरण सामान्य है, हम सूत्र (3.26) का उपयोग करते हैं। समस्या की स्थितियों के अनुसार, महत्व स्तर a=0.05 और a/2=0.025 है। c 2 के लिए तालिकाओं के अनुसार - n= के साथ पियर्सन वितरण एन-1=29 डिग्री की स्वतंत्रता हम पाते हैं

और .

तब s 2 के लिए विश्वास अंतराल को इस प्रकार लिखा जा सकता है

,

.

मानक विचलन के लिए उत्तर होगा

. â

सांख्यिकीय परिकल्पनाओं का परीक्षण

बुनियादी अवधारणाओं

अधिकांश अर्थमितीय मॉडलों को बार-बार सुधार और परिशोधन की आवश्यकता होती है। ऐसा करने के लिए, कुछ पूर्वापेक्षाओं की व्यवहार्यता या असंभवता स्थापित करने, पाए गए अनुमानों की गुणवत्ता का विश्लेषण करने और प्राप्त निष्कर्षों की विश्वसनीयता से संबंधित उचित गणना करना आवश्यक है। अत: अर्थमिति में परिकल्पना परीक्षण के मूल सिद्धांतों का ज्ञान अनिवार्य है।



कई मामलों में जनसंख्या के वितरण नियम को जानना आवश्यक है। यदि वितरण कानून अज्ञात है, लेकिन यह मानने का कारण है कि ऐसा है खास प्रकार का, फिर उन्होंने एक परिकल्पना सामने रखी: सामान्य जनसंख्या को इस कानून के अनुसार वितरित किया जाता है। उदाहरण के लिए, कोई यह धारणा बना सकता है कि जनसंख्या की आय, किसी स्टोर में ग्राहकों की दैनिक संख्या और उत्पादित भागों के आकार का एक सामान्य वितरण कानून है।

यह संभव है कि वितरण कानून ज्ञात हो, लेकिन इसके पैरामीटर ज्ञात नहीं हों। यदि यह मानने का कारण है कि अज्ञात पैरामीटर q अपेक्षित संख्या q 0 के बराबर है, तो एक परिकल्पना सामने रखी जाती है: q=q 0। उदाहरण के लिए, आप जनसंख्या की औसत आय, स्टॉक पर औसत अपेक्षित रिटर्न, आय का प्रसार आदि के बारे में धारणाएँ बना सकते हैं।

अंतर्गत सांख्यिकीय परिकल्पनाएचकिसी नमूने के विरुद्ध परीक्षण की गई जनसंख्या (यादृच्छिक चर) के बारे में किसी भी धारणा को समझें। यह सामान्य जनसंख्या के वितरण के प्रकार के बारे में, दो नमूना भिन्नताओं की समानता के बारे में, नमूनों की स्वतंत्रता के बारे में, नमूनों की एकरूपता के बारे में, यानी एक धारणा हो सकती है। कि वितरण नियम नमूने से नमूने आदि में नहीं बदलता है।

परिकल्पना कहलाती है सरल, यदि यह विशिष्ट रूप से किसी वितरण या किसी पैरामीटर को निर्धारित करता है; अन्यथा परिकल्पना कहलाती है जटिल. उदाहरण के लिए, एक सरल परिकल्पना यह धारणा है कि यादृच्छिक चर एक्समानक सामान्य कानून के अनुसार वितरित किया गया एन(0;1); यदि यह मान लिया जाए कि यादृच्छिक चर एक्ससामान्य वितरण है एन(एम;1), कहाँ £ एम£ बी, तो यह एक जटिल परिकल्पना है।

परीक्षण की जा रही परिकल्पना को कहा जाता है बुनियादीया शून्य परिकल्पनाऔर प्रतीक द्वारा दर्शाया गया है एच 0 . मुख्य परिकल्पना के साथ-साथ एक विरोधाभासी परिकल्पना पर भी विचार किया जाता है, जिसे आमतौर पर कहा जाता है प्रतिस्पर्धाया वैकल्पिक परिकल्पनाऔर प्रतीक द्वारा निर्दिष्ट किया गया है एच 1 . यदि मुख्य परिकल्पना अस्वीकृत हो जाती है तो वैकल्पिक परिकल्पना जन्म लेती है। उदाहरण के लिए, यदि परिकल्पना का परीक्षण किया जाता है कि पैरामीटर q कुछ के बराबर है मूल्य ते करनाक्यू 0 , यानी एच 0:q=q 0, तो निम्नलिखित परिकल्पनाओं में से एक को वैकल्पिक परिकल्पना माना जा सकता है: एच 1:q>q 0 , एच 2:q एच 3:q¹q 0 , एच 4:q=q 1 . वैकल्पिक परिकल्पना का चुनाव समस्या के विशिष्ट सूत्रीकरण द्वारा निर्धारित होता है।

प्रस्तुत की गई परिकल्पना सही या गलत हो सकती है, इसलिए इसका परीक्षण करने की आवश्यकता है। चूँकि सत्यापन सांख्यिकीय विधियों का उपयोग करके किया जाता है, इस संबंध में, कुछ हद तक संभावना के साथ, एक गलत निर्णय लिया जा सकता है। यहां दो प्रकार की त्रुटियां हो सकती हैं। पहली तरह की गलती यह कि सही परिकल्पना अस्वीकृत कर दी जायेगी। टाइप I त्रुटि की संभावना को अक्षर a द्वारा निरूपित किया जाता है, अर्थात।

दूसरे प्रकार की त्रुटिवह यह कि गलत परिकल्पना स्वीकार कर ली जायेगी। टाइप II त्रुटि की संभावना को अक्षर b द्वारा निरूपित किया जाता है, अर्थात।

इन त्रुटियों के परिणाम समान नहीं हैं. पहला अधिक सतर्क, रूढ़िवादी निर्णय की ओर ले जाता है, दूसरा अनुचित जोखिम की ओर ले जाता है। क्या बेहतर या बुरा है यह समस्या के विशिष्ट सूत्रीकरण और शून्य परिकल्पना की सामग्री पर निर्भर करता है। उदाहरण के लिए, यदि एच 0 में उद्यम के उत्पादों को उच्च गुणवत्ता के रूप में मान्यता देना शामिल है और यदि पहले प्रकार की त्रुटि की जाती है, तो उपयुक्त उत्पादों को अस्वीकार कर दिया जाएगा। यदि हम टाइप 2 त्रुटि करते हैं, तो हम उपभोक्ता को एक दोषपूर्ण वस्तु भेजेंगे। जाहिर है, इस गलती के परिणाम कंपनी की छवि और उसकी दीर्घकालिक संभावनाओं के लिहाज से अधिक गंभीर हैं।

सीमित नमूने के कारण पहले और दूसरे प्रकार की त्रुटियों को बाहर करना असंभव है। इसलिए, वे इन त्रुटियों से होने वाले नुकसान को कम करने का प्रयास करते हैं। ध्यान दें कि इन त्रुटियों की संभावनाओं को एक साथ कम करना असंभव है, क्योंकि इन्हें कम करने की चुनौतियों में प्रतिस्पर्धा हो रही है। और उनमें से एक को अनुमति देने की संभावना में कमी से दूसरे को अनुमति देने की संभावना में वृद्धि होती है। ज्यादातर मामलों में, दोनों संभावनाओं को कम करने का एकमात्र तरीका नमूना आकार को बढ़ाना है।

वह नियम जिसके अनुसार मुख्य परिकल्पना को स्वीकार या अस्वीकार किया जाता है, कहलाता है सांख्यिकीय मानदंड . इस प्रयोजन के लिए, एक यादृच्छिक चर K का चयन किया जाता है, जिसका वितरण बिल्कुल या लगभग ज्ञात होता है और जो प्रयोगात्मक और काल्पनिक मूल्यों के बीच विसंगति के माप के रूप में कार्य करता है।

परिकल्पना का परीक्षण करने के लिए, नमूना डेटा के आधार पर गणना करें चयनात्मक(या नमूदार) मानदंड मान K नमूदार. फिर, चयनित मानदंड के वितरण के अनुसार, ए महत्वपूर्ण क्षेत्रक्रेते. यह मानदंड मानों का एक सेट है जिस पर शून्य परिकल्पना खारिज कर दी जाती है। संभावित मानों के शेष भाग को कहा जाता है परिकल्पना स्वीकृति का क्षेत्र. यदि आप महत्वपूर्ण क्षेत्र पर ध्यान केंद्रित करेंगे तो आप गलती कर सकते हैं
पहली तरह, जिसकी संभावना पहले से दी गई है और ए के बराबर है, कहा जाता है स्तर का महत्वपरिकल्पनाएँ इसका तात्पर्य क्रांतिक क्षेत्र K के लिए निम्नलिखित आवश्यकता से है क्रेते:

.



महत्व स्तर a महत्वपूर्ण क्षेत्र K का "आकार" निर्धारित करता है क्रेते. हालाँकि, मानदंड मूल्यों के सेट पर इसकी स्थिति वैकल्पिक परिकल्पना के प्रकार पर निर्भर करती है। उदाहरण के लिए, यदि शून्य परिकल्पना का परीक्षण किया जाता है एच 0:q=q 0 , और वैकल्पिक परिकल्पना का रूप है एच 1:q>q 0, तो क्रांतिक क्षेत्र में अंतराल (K 2, +¥) शामिल होगा, जहां बिंदु K 2 स्थिति से निर्धारित होता है पी(के>के 2)=ए ( सही महत्वपूर्ण क्षेत्र एच 2:q पी(क बाएं महत्वपूर्ण क्षेत्र). यदि वैकल्पिक परिकल्पना स्वरूप की है एच 3:q¹q 0, तो महत्वपूर्ण क्षेत्र में दो अंतराल (-¥;K 1) और (K 2, +¥) शामिल होंगे, जहां बिंदु K 1 और K 2 शर्तों से निर्धारित होते हैं: पी(के>के 2)=ए/2 और पी(क दोतरफा महत्वपूर्ण क्षेत्र).

सांख्यिकीय परिकल्पनाओं के परीक्षण का मूल सिद्धांत निम्नानुसार तैयार किया जा सकता है। यदि के नमूदारक्रांतिक क्षेत्र में आता है, फिर परिकल्पना एच 0 को अस्वीकृत किया जाता है एवं परिकल्पना स्वीकृत की जाती है एच 1 . हालाँकि, ऐसा करते समय, आपको यह समझना चाहिए कि यहां आप प्रायिकता a के साथ टाइप 1 त्रुटि कर सकते हैं। यदि के नमूदारपरिकल्पना की स्वीकृति की सीमा के अंतर्गत आता है - तब शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है एच 0 . लेकिन इसका ये मतलब बिल्कुल भी नहीं है एच 0 एकमात्र उपयुक्त परिकल्पना है: नमूना डेटा और परिकल्पना के बीच बस एक विसंगति है एच 0 छोटा है; हालाँकि, अन्य परिकल्पनाओं में समान संपत्ति हो सकती है।

कसौटी की शक्तिसंभावना है कि यदि वैकल्पिक परिकल्पना सत्य है तो शून्य परिकल्पना खारिज कर दी जाएगी; वे। मानदंड की शक्ति 1-बी है, जहां बी टाइप 2 त्रुटि होने की संभावना है। परिकल्पना का परीक्षण करने के लिए एक निश्चित महत्व स्तर को अपनाया जाए और नमूने का एक निश्चित आकार हो। चूंकि महत्वपूर्ण क्षेत्र के चुनाव में एक निश्चित मनमानी होती है, इसलिए इसे इस तरह से बनाने की सलाह दी जाती है कि मानदंड की शक्ति अधिकतम हो या ताकि टाइप 2 त्रुटि की संभावना न्यूनतम हो।

वितरण मापदंडों के बारे में परिकल्पनाओं का परीक्षण करने के लिए उपयोग किए जाने वाले मानदंड कहलाते हैं महत्व मानदंड. विशेष रूप से, एक महत्वपूर्ण क्षेत्र का निर्माण एक विश्वास अंतराल के निर्माण के समान है। नमूना वितरण और काल्पनिक सैद्धांतिक वितरण के बीच समझौते का परीक्षण करने के लिए उपयोग किए जाने वाले परीक्षणों को कहा जाता है सहमति मानदंड.

विश्वास अंतराल- एक सांख्यिकीय मात्रा के सीमित मूल्य, जो किसी दिए गए आत्मविश्वास की संभावना के साथ, बड़ी मात्रा का नमूना लेते समय इस अंतराल में होंगे। P(θ - ε) के रूप में दर्शाया जाता है। व्यवहार में, विश्वास संभावना γ को एकता के काफी करीब मूल्यों से चुना जाता है: γ = 0.9, γ = 0.95, γ = 0.99।

सेवा का उद्देश्य. इस सेवा का उपयोग करके, आप यह निर्धारित कर सकते हैं:

  • सामान्य माध्य के लिए विश्वास अंतराल, विचरण के लिए विश्वास अंतराल;
  • मानक विचलन के लिए विश्वास अंतराल, सामान्य शेयर के लिए विश्वास अंतराल;
परिणामी समाधान एक Word फ़ाइल में सहेजा गया है (उदाहरण देखें)। प्रारंभिक डेटा कैसे भरें, इस पर एक वीडियो निर्देश नीचे दिया गया है।

उदाहरण क्रमांक 1. एक सामूहिक फार्म पर, 1000 भेड़ों के कुल झुंड में से, 100 भेड़ों को चयनात्मक नियंत्रण कतरन से गुजरना पड़ा। परिणामस्वरूप, प्रति भेड़ औसतन 4.2 किलोग्राम ऊन की कतरन स्थापित की गई। प्रति भेड़ औसत ऊन कतरन का निर्धारण करते समय नमूने की औसत वर्ग त्रुटि 0.99 की संभावना के साथ निर्धारित करें और यदि भिन्नता 2.5 है तो कतरनी मूल्य किस सीमा के भीतर निहित है। नमूना गैर-दोहरावदार है.
उदाहरण क्रमांक 2. मॉस्को उत्तरी सीमा शुल्क के पद पर आयातित उत्पादों के एक बैच से, उत्पाद "ए" के 20 नमूने यादृच्छिक दोहराया नमूने द्वारा लिए गए थे। परीक्षण के परिणामस्वरूप, नमूने में उत्पाद "ए" की औसत नमी सामग्री स्थापित की गई, जो 1% के मानक विचलन के साथ 6% के बराबर निकली।
आयातित उत्पादों के पूरे बैच में उत्पाद की औसत नमी सामग्री की सीमा 0.683 संभावना के साथ निर्धारित करें।
उदाहरण संख्या 3. 36 छात्रों के एक सर्वेक्षण से पता चला कि शैक्षणिक वर्ष के दौरान उनके द्वारा पढ़ी गई पाठ्यपुस्तकों की औसत संख्या 6 के बराबर थी। यह मानते हुए कि प्रति सेमेस्टर एक छात्र द्वारा पढ़ी जाने वाली पाठ्यपुस्तकों की संख्या 6 के बराबर मानक विचलन के साथ एक सामान्य वितरण कानून है, खोजें : ए) इस यादृच्छिक चर की गणितीय अपेक्षा के लिए 0.99 अंतराल अनुमान की विश्वसनीयता के साथ; बी) हम किस संभावना के साथ कह सकते हैं कि इस नमूने से गणना की गई प्रति सेमेस्टर एक छात्र द्वारा पढ़ी जाने वाली पाठ्यपुस्तकों की औसत संख्या गणितीय अपेक्षा से पूर्ण मूल्य में 2 से अधिक नहीं भटकेगी।

आत्मविश्वास अंतराल का वर्गीकरण

मूल्यांकन किए जा रहे पैरामीटर के प्रकार के अनुसार:

नमूना प्रकार के अनुसार:

  1. अनंत नमूने के लिए विश्वास अंतराल;
  2. अंतिम नमूने के लिए विश्वास अंतराल;
नमूने को पुनः नमूनाकरण कहा जाता है, यदि चयनित वस्तु अगले वस्तु को चुनने से पहले जनसंख्या में वापस कर दी जाती है। नमूने को गैर-दोहराना कहा जाता है, यदि चयनित वस्तु जनसंख्या में वापस नहीं आती है। व्यवहार में, हम आम तौर पर गैर-दोहराव वाले नमूनों से निपटते हैं।

यादृच्छिक नमूनाकरण के लिए औसत नमूनाकरण त्रुटि की गणना

नमूने से प्राप्त संकेतकों के मूल्यों और सामान्य जनसंख्या के संबंधित मापदंडों के बीच विसंगति को कहा जाता है प्रतिनिधित्व संबंधी त्रुटि.
सामान्य और नमूना आबादी के मुख्य मापदंडों के पदनाम।
औसत नमूनाकरण त्रुटि सूत्र
पुनः चयनगैर-दोहरावीय चयन
औसत के लिएशेयर के लिएऔसत के लिएशेयर के लिए
नमूना त्रुटि सीमा (Δ) के बीच संबंध कुछ संभावना के साथ गारंटीकृत है Р(टी),और औसत नमूनाकरण त्रुटि का रूप है: या Δ = t·μ, जहां टी- आत्मविश्वास गुणांक, लाप्लास इंटीग्रल फ़ंक्शन की तालिका के अनुसार संभाव्यता स्तर पी (टी) के आधार पर निर्धारित किया जाता है।

विशुद्ध रूप से यादृच्छिक नमूनाकरण विधि का उपयोग करके नमूना आकार की गणना के लिए सूत्र

जनसंख्या माध्य के लिए विश्वास अंतराल सीमा ज्ञात करने के लिए, आपको निम्नलिखित कदम उठाने होंगे:

1) प्राप्त नमूना मात्रा के आधार पर एनअंकगणितीय माध्य और अंकगणितीय माध्य की मानक त्रुटि की गणना करें सूत्र के अनुसार:

;

2) आत्मविश्वास संभाव्यता 1 सेट करें - α , अध्ययन के उद्देश्य के आधार पर;

3) तालिका के अनुसार टी-छात्र वितरण (परिशिष्ट 4) सीमा मान ज्ञात करें टी α महत्व स्तर पर निर्भर करता है α और स्वतंत्रता की डिग्री की संख्या = एन – 1;

4) सूत्र का उपयोग करके विश्वास अंतराल की सीमाएँ ज्ञात करें:

.

टिप्पणी: वैज्ञानिक अनुसंधान के अभ्यास में, जब एक छोटी नमूना आबादी के वितरण का कानून (एन < 30) неизвестен или отличен от нормального, пользуются вышеприведенной формулой для अनुमानितआत्मविश्वास अंतराल अनुमान.

आत्मविश्वास अंतराल पर एन≥ 30 निम्नलिखित सूत्र का उपयोग करके पाया जाता है:

,

कहाँ यू - सामान्यीकृत सामान्य वितरण के प्रतिशत अंक, जो तालिका 5.1 के अनुसार पाए जाते हैं।

8. चरण V पर कार्य क्रम

1. छोटे (एन) के वितरण की सामान्यता की जाँच करें< 30) выборку, составленную из разностей парных значений результатов измерений исходного показателя скоростных качеств у «спортсменов» (эти результаты обозначены индексом В) и показателя, достигнутого после двухмесячных тренировок (эти результаты обозначены индексом Г).

2. एक मानदंड चुनें और "एथलीटों" में गति गुणों के त्वरित विकास के लिए उपयोग की जाने वाली प्रशिक्षण पद्धति की प्रभावशीलता का मूल्यांकन करें।

खेल के V चरण में कार्य पर रिपोर्ट (नमूना)

विषय:प्रशिक्षण तकनीक की प्रभावशीलता का आकलन करना।

लक्ष्य:

    परीक्षण परिणामों के वितरण के सामान्य नियम की विशेषताओं से स्वयं को परिचित करें।

    सामान्यता के लिए नमूना वितरण का परीक्षण करने में कौशल हासिल करें।

    प्रशिक्षण विधियों की प्रभावशीलता का मूल्यांकन करने के लिए कौशल हासिल करें।

    छोटे नमूनों के सामान्य अंकगणितीय साधनों के लिए आत्मविश्वास अंतराल की गणना और निर्माण करना सीखें।

प्रशन:

    प्रशिक्षण तकनीक की प्रभावशीलता का आकलन करने की विधि का सार।

    सामान्य वितरण कानून. सार, अर्थ.

    सामान्य वितरण वक्र के मूल गुण।

    थ्री सिग्मा नियम और उसका व्यावहारिक अनुप्रयोग।

    एक छोटे नमूना वितरण की सामान्यता का आकलन करना।

    जोड़ीवार निर्भर नमूनों के औसत की तुलना करने के लिए किन मानदंडों और किन मामलों में उपयोग किया जाता है?

    आत्मविश्वास अंतराल की विशेषता क्या है? इसके निर्धारण की पद्धति.

विकल्प 1: पैरामीट्रिक मानदंड

टिप्पणी: एक उदाहरण के रूप में, आइए तालिका 5.2 में दिए गए प्रशिक्षण शुरू होने से पहले एथलीटों में गति गुणों के संकेतक को मापने के परिणाम लें (उन्हें सूचकांक बी द्वारा निर्दिष्ट किया गया है, वे माप के परिणामस्वरूप प्राप्त किए गए थे)मैंएक व्यावसायिक खेल का चरण) और दो महीने के प्रशिक्षण के बाद (उन्हें सूचकांक जी द्वारा दर्शाया गया है)।

नमूने सी और डी से हम युग्मित मानों के बीच अंतर से बने नमूने की ओर बढ़ते हैं डी मैं = एन मैं जी एन मैं मेंऔर इन अंतरों का वर्ग निर्धारित करें। हम डेटा को गणना तालिका 5.2 में दर्ज करेंगे।

तालिका 5.2 - मानों के वर्ग युग्मित अंतर की गणना डी मैं 2

एन मैं में, मारो

एन मैं जी, मारो

डी मैं = एन मैं जीएन मैं में, मारो

डी मैं 2 , हराना 2

तालिका 5.2 का उपयोग करते हुए, हम युग्मित अंतरों का अंकगणितीय माध्य पाते हैं:

मारो

इसके बाद, हम वर्ग विचलनों के योग की गणना करते हैं डी मैंसे सूत्र के अनुसार:

आइए नमूने के लिए विचरण निर्धारित करें डी मैं :

मारो 2

हमने परिकल्पनाएँ सामने रखीं:

– शून्य – एच 0: कि युग्मित भिन्नताओं की सामान्य जनसंख्या डी मैंसामान्य वितरण है;

- प्रतिस्पर्धा - एच 1: युग्मित मतभेदों की जनसंख्या का वितरण डी मैंसामान्य से भिन्न.

हम महत्व के स्तर पर जाँच करते हैं = 0,05.

ऐसा करने के लिए, हम एक गणना तालिका 5.3 तैयार करेंगे।

तालिका 5.3 - शापिरो और विल्क मानदंड की गणना के लिए डेटा डब्ल्यू नमूदारयुग्मित मानों के बीच अंतर से बने नमूने के लिए डी मैं

डी मैं, मारो

डी एन - के + 1 -डी =

एन.के

×ए एन.के

17 – (–2) = 19

तालिका 5.3 भरने की प्रक्रिया:

    पहले कॉलम में हम संख्याओं को क्रम से लिखते हैं।

    दूसरे में - युग्मित मूल्यों के बीच अंतर डी मैंगैर घटते क्रम में.

    तीसरे में - क्रम में संख्याएँ जोड़ी मतभेद. चूंकि हमारे मामले में एन= 10, तो 1 से भिन्न होता है एन/2 = 5.

4. चौथे में - मतभेद , जिसे हम इस प्रकार पाते हैं:

- सबसे बड़ा महत्व डी 10 सबसे छोटा घटाओ डी 1 = 1,

- से डी 9 घटाना डी 2 और परिणामी मान को पंक्ति में लिखें = 2, आदि.

    पांचवें में - हम गुणांकों के मान लिखते हैं एन.केशापिरो और विल्क परीक्षण की गणना के लिए आंकड़ों में प्रयुक्त तालिका से लिया गया ( डब्ल्यू) वितरण की सामान्यता की जाँच करना (परिशिष्ट 2)। एन= 10.

    छठे में - एक काम × एन.केऔर इन उत्पादों का योग ज्ञात करें:

.

अवलोकन किया गया मानदंड मान डब्ल्यू नमूदारहम सूत्र द्वारा पाते हैं:

.

आइए हम शापिरो और विल्क मानदंड की गणना की शुद्धता की जांच करें ( डब्ल्यू नमूदार) "सांख्यिकी" प्रोग्राम का उपयोग करके कंप्यूटर पर इसकी गणना करके।

शापिरो और विल्क मानदंड की गणना ( डब्ल्यू नमूदार) कंप्यूटर पर हमें यह स्थापित करने की अनुमति दी गई:

.

इसके बाद, शापिरो और विल्क मानदंड (परिशिष्ट 3) के महत्वपूर्ण मूल्यों की तालिका का उपयोग करते हुए, हम खोजते हैं डब्ल्यू क्रेतेके लिए एन= 10. हमें वह मिला डब्ल्यू क्रेते= 0.842. आइए मूल्यों की तुलना करें डब्ल्यू क्रेतेऔर डब्ल्यू नमूदार .

किया जाए निष्कर्ष: क्योंकि डब्ल्यू नमूदार (0,874) > डब्ल्यू क्रेते(0.842), जनसंख्या के सामान्य वितरण की शून्य परिकल्पना को स्वीकार किया जाना चाहिए डी मैं. इसलिए, गति गुणों को विकसित करने के लिए लागू पद्धति की प्रभावशीलता का आकलन करने के लिए, किसी को पैरामीट्रिक का उपयोग करना चाहिए टी-छात्र का टी-टेस्ट।