Основи статистичного аналізу даних. Статистичний аналіз даних (курс лекцій, К.В.Воронцов)

1. Визначення терміна "статистика" та історія її виникнення


Статистика - це точна наука, що вивчає методи збирання, аналізу та обробки даних, які описують масові дії, явища та процеси. Дані, що вивчаються у статистиці, зачіпають не окремі об'єкти, які сукупності. Головним методом збору даних для статистики є повне обстеження об'єктів, що стосуються досліджуваної проблеми.

Статистика - галузь знань, у якій викладаються загальні питання збору, виміру та аналізу масових статистичних (кількісних чи якісних) даних.

Слово «статистика» походить від латинського status – стан справ. У науку термін «статистика» ввів німецький вчений Готфрід Ахенваль у 1746 році, запропонувавши замінити назву курсу «Державознавство», що викладався в університетах Німеччини, на «Статистику», започаткувавши тим самим початок розвитку статистики як науки та навчальної дисципліни. Незважаючи на це, статистичний облік вівся набагато раніше: проводилися переписи населення в Стародавньому Китаї, здійснювалося порівняння військового потенціалу держав, вівся облік майна громадян у Стародавньому Римі тощо.

Статистика розробляє спеціальну методологію дослідження та обробки матеріалів: масові статистичні спостереження, метод угруповань, середніх величин, індексів, балансовий метод, метод графічних зображень та інші методи аналізу статистичних даних.

Початок статистичної практики належить приблизно на час виникнення держави. Першою опублікованою статистичною інформацією можна вважати глиняні таблички Шумерського царства (III – II тисячоліття до н. е.).

Спочатку під статистикою розуміли опис економічного та політичного стану держави чи її частини. Наприклад, до 1792 відноситься визначення: «статистика описує стан держави в даний час або в деякий відомий момент у минулому». І в даний час діяльність державних статистичних служб цілком укладається в це визначення.

Поступово термін «статистика» став використовуватися ширше. У XX столітті статистику часто розглядають передусім самостійну наукову дисципліну. Статистика є сукупність методів та принципів, згідно з якими проводиться збір, аналіз, порівняння, подання та інтерпретація числових даних. У 1954 р. академік АН УРСР Б. В. Гнєденко дав таке визначення: «Статистика складається з трьох розділів:

Збір статистичних відомостей, тобто відомостей, що характеризують окремі одиниці будь-яких масових сукупностей;

Статистичне дослідження одержаних даних, що полягає у з'ясуванні тих закономірностей, які можуть бути встановлені на основі даних масового спостереження;

Розробка прийомів статистичного спостереження та аналізу статистичних даних. Останній розділ, власне, і становить зміст математичної статистики».

Термін «статистика» використовують ще двох сенсах. По-перше, в побуті під «статистикою» часто розуміють набір кількісних даних про якесь явище або процес. По-друге, статистикою називають функцію від результатів спостережень, що використовується для оцінки характеристик та параметрів розподілів та перевірки гіпотез.

Типові приклади раннього етапу застосування статистичних методів описані у Біблії, у Старому Завіті. Там, зокрема, наводиться кількість воїнів у різних племенах. З математичної погляду справа зводилося до підрахунку числа попадань значень спостерігаються ознак у певні градації.

Відразу після виникнення теорії ймовірностей (Паскаль, Ферма, XVII століття) імовірнісні моделі почали використовувати при обробці статистичних даних. Наприклад, вивчалася частота народження хлопчиків і дівчаток, було встановлено відмінність вірогідності народження хлопчика від 0.5, аналізувалися причини, що у паризьких притулках ця ймовірність та, що у самому Парижі, тощо.

В 1794 (за іншими даними - в 1795) німецький математик Карл Гаусс формалізував один з методів сучасної математичної статистики - метод найменших квадратів. У XIX столітті помітний внесок у розвиток практичної статистики вніс бельгієць Кетле, на основі аналізу великої кількості реальних даних, що показав стійкість відносних статистичних показників, таких як частка самогубств серед усіх смертей.

Перша третина ХХ ст. пройшла під знаком параметричної статистики. Вивчалися методи, засновані на аналізі даних параметричних сімейств розподілів, що описуються кривими сімейства Пірсона. Найбільш популярним був нормальний розподіл. Для перевірки гіпотез використовувалися критерії Пірсона, Стьюдента, Фішера. Було запропоновано метод максимальної правдоподібності, дисперсійний аналіз, сформульовано основні ідеї планування експерименту.

Розроблену в першій третині ХХ століття теорію аналізу даних називають параметричною статистикою, оскільки її основний об'єкт вивчення - це вибірки з розподілів, що описуються одним чи невеликим числом параметрів. Найбільш загальним є сімейство кривих Пірсона, які задаються чотирма параметрами. Як правило, не можна вказати будь-яких вагомих причин, через які розподіл результатів конкретних спостережень має входити в ту чи іншу параметричну родину. Винятки добре відомі: якщо ймовірна модель передбачає підсумовування незалежних випадкових величин, то суму природно описувати нормальним розподілом; якщо ж у моделі розглядається добуток таких величин, то результат, певне, наближається логарифмічно нормальним розподілом тощо.

В даний час термін статистика вживається в 4 значеннях:

Наука, що вивчає кількісний бік масових явищ і процесів у нерозривному зв'язку з їх якісним змістом - навчальний предмет у вищих та середніх спеціальних навчальних закладів;

Сукупність цифрових відомостей, що характеризують стан масових явищ та процесів суспільного життя; статистичні дані, що подаються у звітності підприємств, організацій, галузей економіки, а також публікуються у збірниках, довідниках, періодичному друку та в Інтернеті, які є результатом статистичної роботи;

Галузь практичної діяльності («статистичний облік») зі збору, обробки, аналізу та публікації масових цифрових даних про найрізноманітніші явища та процеси суспільного життя;

Якийсь параметр ряду випадкових величин, що отримується за певним алгоритмом з результатів спостережень, наприклад, статистичні критерії (критичні статистики), що застосовуються при перевірці різних гіпотез (імовірних тверджень) щодо природи або значень окремих показників досліджуваних даних, особливостей їх розподілу та ін.


2. Опис наукових підходів та методів статистики


Як і будь-яка інша наука, статистика має свій предмет та метод дослідження. Статистика вивчає кількісний бік масових суспільних явищ у нерозривному зв'язку з їх якісною стороною або змістом, а також досліджує кількісне вираження закономірностей суспільного розвитку в конкретних умовах місця та часу. Таке вивчення ґрунтується на системі категорій (понять), що відображають найбільш загальні та суттєві властивості, ознаки, зв'язки та відносини предметів та явищ об'єктивного світу.

Статистична сукупність - безліч соціально-економічних об'єктів чи явищ життя, об'єднаних якісної основою, але відмінних друг від друга окремими ознаками, тобто. однорідних щодо одного, але різнорідних щодо іншого. Такими є, наприклад, сукупність домогосподарств, сімей, підприємств, фірм тощо.

Одиниця сукупності - первинний елемент статистичної сукупності, що є носієм ознак і основою облікового рахунку, що ведеться при обстеженні.

Ознака одиниці сукупності - властивості одиниці сукупності, які різняться способами їх виміру та іншими особливостями

Статистичний показник - поняття, що відображає кількісні характеристики (розміри) чи співвідношення ознак суспільних явищ. Статистичні показники можна поділити на первинні (об'ємні) - характеризують або загальне числоодиниць сукупності (обсяг сукупності), або суму значень будь-якої ознаки (обсяг ознаки) і виражаються абсолютними величинами та вторинні (розрахункові) - задаються на одиницю первинного показника та виражаються відносними та середніми величинами. Статистичні показники можуть бути плановими, звітними та прогнозними.

Система статистичних показників – сукупність статистичних показників, що відбиває взаємозв'язки, які об'єктивно існують між явищами. Вона охоплює всі сторони життя як на макро-, так і на мікрорівні. Зі зміною умов життя суспільства змінюються й системи статистичних показників, удосконалюється методологія їхнього розрахунку.

Сукупність прийомів, користуючись якими статистика досліджує свій предмет, становить метод статистики. Можна виділити 3 групи статистичних методів (3 етапи статистичного дослідження):

Статистичне спостереження - науково організований збірвідомостей, що полягає у реєстрації тих чи інших фактів, ознак, що належать до кожної одиниці досліджуваної сукупності;

Зведення та угруповання - обробка зібраних первинних даних, що включає їх угруповання, узагальнення та оформлення у таблицях;

Статистичний аналіз - на основі підсумкових даних зведення розраховуються різні узагальнюючі показники у вигляді середніх та відносних величин, виявляються певні закономірності у розподілах, динаміці показників тощо.

Таким чином, будь-яке закінчене статистичне дослідження проходить у 3 етапи, між якими, зрозуміло, можуть бути перерви у часі.

Статистичні методи – методи аналізу статистичних даних. Виділяють методи прикладної статистики, які можуть застосовуватися у всіх галузях наукових досліджень та будь-яких галузях народного господарства, та інші статистичні методи, застосовність яких обмежена тією чи іншою сферою. Маються на увазі такі методи, як статистичний приймальний контроль, статистичне регулювання технологічних процесів, надійність та випробування, планування експериментів.

Класифікація статистичних методів. Статистичні методи аналізу даних застосовуються практично у всіх сферах діяльності людини. Їх використовують завжди, коли необхідно отримати та обґрунтувати будь-які судження про групу (об'єктів чи суб'єктів) з деякою внутрішньою неоднорідністю.

Доцільно виділити три види наукової та прикладної діяльності в галузі статистичних методів аналізу даних (за ступенем специфічності методів, пов'язаної з зануреністю у конкретні проблеми):

а) розробка та дослідження методів загального призначення, без урахування специфіки галузі застосування;

б) розробка та дослідження статистичних моделей реальних явищ та процесів відповідно до потреб тієї чи іншої галузі діяльності;

в) застосування статистичних методів та моделей для статистичного аналізу конкретних даних.

Прикладна статистика - це наука у тому, як обробляти дані довільної природи. Математичною основою прикладної статистики та статистичних методів аналізу є теорія ймовірностей та математична статистика.

Опис виду даних та механізму їх породження – початок будь-якого статистичного дослідження. Для опису даних застосовують як детерміновані, і ймовірнісні методи. За допомогою детермінованих методів можна проаналізувати ті дані, які є у розпорядженні дослідника. Наприклад, з допомогою отримані таблиці, розраховані органами офіційної державної статистики з урахуванням представлених підприємствами і організаціями статистичних звітів. Перенести отримані результати більш широку сукупність, використовувати їх задля передбачення і управління можна лише з основі вероятностно-статистического моделювання. Тому математичну статистику часто включають лише методи, що спираються на теорію ймовірностей.

Статистичні методи - наукові методи опису та вивчення масових явищ, що допускають кількісне (чисельне) вираження. Слово статистика (від гол. stato - держава) має спільний корінь зі словом держава . Спочатку воно відносилося до науки управління та означало збирання даних про деякі параметри життєдіяльності держави. Згодом статистика стала охоплювати збір, обробку та аналіз даних про масові явища взагалі; нині статистичні методи охоплюють собою практично всі галузі знань та життєдіяльності суспільства.

Статистичні методи включають і експериментальне, і теоретичне початку. Статистика виходить насамперед із досвіду; недаремно її часто визначають як науку про загальні способи обробки результатів експерименту. Обробка масових дослідних даних представляє самостійне завдання. Іноді проста реєстрація деяких рядів спостережень призводить до того чи іншого значимого висновку. Так, якщо в деякій країні рік у рік зростає обсяг валового внутрішнього продукту, то це говорить про її сталий розвиток. Однак у більшості випадків для обробки досвідченого статистичного матеріалу використовуються математичні моделі досліджуваного явища, основу яких становлять ідеї та методи теорії ймовірностей.

Теорія ймовірностей є наука про масові випадкові явища. Масовість означає, що досліджуються великі кількості однорідних явищ (об'єктів, процесів). Випадковість означає, що значення аналізованого параметра окремого явища (об'єкта) у своїй основі не залежить і не визначається значеннями цього параметра в інших явищ, що входять в ту ж сукупність. Основною характеристикою масового випадкового явища є розподіл ймовірностей. Теорію ймовірностей можна визначити як науку про імовірнісні розподіли їх властивості, види, закони взаємозв'язків, розподіл величин, що характеризують досліджуваний об'єкт, і закони зміни розподілів у часі. Так, говорять про розподіл молекул газу за швидкостями, про розподіл доходів громадян у деякому суспільстві тощо.

розподіли, Що Емпірично задаються, співвідносяться з т.з. генеральною сукупністю, Т. е. з найбільш повним теоретичним описом розподілів відповідних масових явищ. При цьому у багатьох випадках буває недоцільно перебирати всі елементи аналізованих сукупностей або з надзвичайно великої їх числа, або з того, що за наявності деякого числа перебраних елементів облік нових не внесе істотних змін до загальних результатів. Для цих випадків розроблено спеціальний вибірковий метод дослідження загальних властивостей статистичних систем на основі вивчення частини відповідних елементів, взятих на вибірку. Так, в оцінці політичних симпатій громадян певного регіону чи країни перед майбутніми виборами неможливо проводити суцільне опитування громадян. У цих випадках і вдаються до вибіркового методу. Щоб вибірковий розподіл досить надійно характеризував досліджувану систему, він повинен задовольняти спеціальним умовам репрезентативності. Репрезентативність потребує випадкового вибору елементів та обліку макроструктури всього масового явища.

Розподіли становлять найбільш загальну характеристику масових випадкових явищ. Завдання вихідного розподілу нерідко передбачає побудову математичної моделі відповідних галузей дійсності. Побудова та аналіз таких моделей і становить основну спрямованість статистичних методів. Побудована математична модель, своєю чергою, показує, які змінні слід вимірювати і які мають основне значення. Але головне у побудові математичної моделі полягає у поясненні досліджуваних явищ та процесів. Якщо модель досить повна, вона описує залежності між основними параметрами цих явищ.

Статистичні методи в природознавстві породили багато наукових теорій, що призвели до розробки найважливіших фундаментальних напрямів дослідження - класичної статистичної фізики, генетики, квантової теорії, теорії ланцюгових. хімічних реакційта ін. Слід, проте, відзначити, що у багатьох випадках вихідні ймовірні розподіли задаються не шляхом безпосередньої обробки масового матеріалу. Імовірнісна гіпотеза найчастіше вводиться гіпотетично, побічно, з урахуванням теоретичних передумов. Так, у вчення про гази припущення про існування ймовірнісних розподілів було введено як гіпотеза, на основі припущень про молекулярному безладді . Можливість подібного завдання ймовірнісних розподілів та перевірки їх справедливості обумовлена ​​характером і природою самих розподілів, математичний вираз яких має самостійні характеристики, досить незалежні від конкретних значень елементів.

Особливі складнощі виникають при застосуванні статистичних методів у вивченні соціальних явищ. Аналіз загальних напрямів соціальних процесів та внутрішніх механізмів, що викликають конкретні статистичні результати, надзвичайно трудомісткий. Так, добробут людей характеризується дуже багатьма параметрами та відповідними розподілами - рівнем доходів, участю у суспільно-корисній праці, рівнем освіти та охорони здоров'я та ін. показниками життєдіяльності людини. Виявлення взаємозв'язку цих розподілів та тенденцій їх зміни потребує вирішення багатьох складних завдань. Стан суспільства можна визначити через такі параметри, як внутрішній валовий продукт, споживання енергії на душу населення, розшарування суспільства за доходами тощо. Разом з тим суспільство є надзвичайно складною системою, а пізнання складних систем ґрунтується на розробці багатьох моделей, що виражають різні аспекти їх структури та функціонування. Відповідно, для більш повної характеристикистану суспільства потрібно оперувати дуже багатьма параметрами та його розподілами. Так, говорять про економічну, виробничу, сільськогосподарську, соціальну та багато інших статистиків. Для об'єднання цих статистик на єдину цілісну картину необхідно виявлення субординації, ієрархії параметрів, що характеризують стан суспільства.


3. Взаємозв'язок статистики коїться з іншими науками


Статистика є мультидисципліною, тому що вона використовує методи та принципи, запозичені з інших дисциплін. Так, як теоретична база для формування статистичної науки служать знання в галузі соціології та економічної теорії. У цих дисциплін відбувається вивчення законів суспільних явищ. Статистика допомагає провести оцінку масштабу тієї чи іншої явища, і навіть розробити систему методів аналізу та вивчення. Статистика, безсумнівно, пов'язані з математикою, оскільки виявлення закономірностей, оцінки та аналізу об'єкта дослідження потрібно ряд математичних операцій, методів і законів, а систематизація результатів знаходить відображення як графіків і таблиць.


4. Види статистичних досліджень


Спостереження як початковий етап дослідження пов'язане зі збором вихідних даних про питання, що вивчається. Воно властиво багатьом наукам. Однак кожна наука має свою специфіку, відрізняючись за своїми спостереженнями. Тому не всяке спостереження – статистичне.

Статистичне дослідження - це науково організований за єдиною програмою збір, зведення та аналіз даних (фактів) про соціально-економічні, демографічні та інші явища та процеси суспільного життя в державі з реєстрацією їх найбільш суттєвих ознак в обліковій документації.

Відмінними рисами (специфікою) статистичного дослідження є: цілеспрямованість, організованість, масовість, системність (комплексність), сумісність, документованість, контрольованість, практичність.

Загалом статистичне дослідження має:

Мати суспільно-корисну мету та загальну (державну) значимість;

Відноситися до предмета статистики в конкретних умовах його місця та часу;

Висловлювати статистичний виглядобліку (а не бухгалтерський та не оперативний);

Проводиться за заздалегідь розробленою програмою з її науково обґрунтованим методологічним та іншим забезпеченням;

Здійснювати збір масових даних (фактів), у яких відбивається вся сукупність причинно-наслідкових та інших факторів, що різнобічно характеризують явище;

Реєструватися як облікових документів встановленого зразка;

Гарантувати відсутність помилок спостереження або зводити їх до можливого мінімуму;

Передбачати певні критерії якості та способи контролю зібраних даних, забезпечуючи їх достовірність, повноту та змістовність;

орієнтуватися на економічно ефективну технологію збору та обробки даних;

Бути надійною інформаційною базою для всіх наступних етапів статистичного дослідження та всіх користувачів статистичної інформації.

Дослідження, які задовольняють цим вимогам, статистичними є. Не є статистичними дослідження, наприклад, спостереження та дослідження: матері за дитиною, що грає (особисте питання); глядачів за театральною постановкою (немає облікової документації щодо видовища); наукового працівника за фізико-хімічними дослідами з їх вимірами, розрахунками та документальною реєстрацією (не масово-суспільні дані); лікаря за хворими із веденням медичних карток (оперативний облік); бухгалтера за рухом грошових коштівна банківському рахунку підприємства (бухгалтерський облік); журналістів за громадською та особистою життєдіяльністю державних осіб чи інших знаменитостей (не предмет статистики).

Статистична сукупність - безліч одиниць, які мають масовістю, типовістю, якісною однорідністю та наявністю варіації.

Статистична сукупність складається з матеріально існуючих об'єктів (працівники, підприємства, країни, регіони), є об'єктом статистичного дослідження.

Статистичне спостереження є першою стадією статистичного дослідження, що є науково організованим збором даних про досліджувані явища і процеси суспільного життя.


5. Призначення вибіркового методу


Безліч всіх одиниць сукупності, що мають певну ознаку і підлягають вивченню, носить у статистиці назву генеральної сукупності.

На практиці з тих чи інших причин не завжди можливо або недоцільно розглядати всю генеральну сукупність. Тоді обмежуються вивченням лише певної частини її, кінцевою метою якого є поширення одержаних результатів на всю генеральну сукупність, тобто застосовують вибірковий метод.

Для цього з генеральної сукупності особливим чином відбирається частина елементів, так звана вибірка, результати обробки вибіркових даних (наприклад, середні арифметичні значення) узагальнюються на всю сукупність.

Теоретичною основою вибіркового методу є закон великих чисел. У силу цього закону при обмеженому розсіюванні ознаки в генеральній сукупності і досить великій вибірці з ймовірністю, близькою до повної достовірності, середня вибіркова може бути як завгодно близька до генеральної середньої. Закон цей, що включає групу теорем, доведений строго математично. Таким чином, середня арифметична, розрахована на вибірку, може з достатньою підставою розглядатися як показник, що характеризує генеральну сукупність в цілому.

Зрозуміло, не всяка вибірка може бути основою для характеристики всієї сукупності, до якої належить. Такою властивістю мають лише репрезентативні (представницькі) вибірки, т. е. вибірки, які правильно відбивають властивості генеральної сукупності. Існують способи, що дозволяють гарантувати достатню репрезентативність вибірки. Як доведено в ряді теорем математичної статистики, у такий спосіб за умови досить великої вибірки є метод випадкового відбору елементів генеральної сукупності, такого відбору, коли кожен елемент генеральної сукупності має рівний з іншими елементами шанс потрапити у вибірку. Вибірки, отримані в такий спосіб, називаються випадковими вибірками. Випадковість вибірки є таким чином істотною умовою застосування вибіркового методу.

Області застосування вибіркового методу у історичних дослідженнях. Сфера застосування цього у вивченні історії велика. По-перше, історики можуть застосовувати вибірковий метод під час проведення різноманітних обстежень з вивчення різних явищ і процесів сучасності. Щоправда, зараз такими дослідженнями більше займаються соціологи, ніж історики, хоча саме історики можуть проводити конкретно-соціологічні обстеження, спираючись на історичні дані, і досягати найбільшого ефекту таких досліджень.

По-друге, історики нерідко мають справу з даними раніше проведених власне вибіркових обстежень, що збереглися. Такі обстеження стали дедалі ширше застосовуватися з кінця в XIX ст. Так, при проведенні низки суцільних обстежень та переписів вибірково збиралися та збираються відомості щодо більш широкої програми. Багато даних збиралися лише вибірково. Найбільш цікавими серед них для істориків є описи різного роду господарських комплексів (селянських господарств, промислових підприємств, колгоспів, радгоспів тощо), а також бюджетні та іншого обстеження різних верств населення.

По-третє, у розпорядженні істориків є значна кількість різноманітних первинних суцільних масових даних, повна обробка яких дуже скрутна навіть при застосуванні сучасної обчислювальної техніки. При вивченні їх можна застосувати вибірковий метод. Такі матеріали є за всіма періодами історії, але багато їх з історії XIX-XX ст.

Зрештою, історикам дуже часто доводиться мати справу з частковими даними, так званими природними вибірками. При обробці цих даних також може бути використаний вибірковий метод. Характер природних вибірок буває різним. Насамперед вони можуть являти собою залишок, що колись існувала більш-менш повної сукупності даних. Так, багато актових матеріалів, документів поточного діловодства та звітності представляють залишки в минулому великих і систематичних масивів даних. Далі, при систематичному зборі тих чи інших відомостей окремі показники могли враховуватися лише частково (саме частково, а чи не вибірково). Так, при складанні «Економічних приміток» до Генерального межування другої половини XVIII ст., яке охопило більшу частину території країни, низка показників (кількість населення, площа земельних угідь та ін.) враховувалася повсюдно, а деякі важливі дані (про величину панських запашок, розмірах оброку) було зібрано з низки причин лише частково. Багато відомостей взагалі збиралися лише частково. Це, перш за все, стосується тих з них, які не були нормативними і збором яких займалися різні місцеві органи, наукові та громадські організації та окремі особи.

Отже, області вибіркового методу в історичних дослідженнях дуже великі, а завдання, які слід у своїй вирішувати, різні.

Так, при організації вибіркового обстеження та формування вибірки з наявних суцільних даних дослідник має певну свободу маневру для забезпечення репрезентативності вибірок. При цьому він може спиратися на добре розроблену математичну статистику теорію, методику і техніку отримання таких вибірок.

При оперуванні даними раніше проведених вибіркових обстежень слід перевірити, наскільки вони були виконані відповідно до вимог, що пред'являються до вибіркового методу. Для цього треба знати, як було проведено це обстеження. Найчастіше це цілком можна зробити.

І зовсім інша справа – природні вибірки даних, з якими дуже часто має справу історик. Насамперед необхідно довести їхню репрезентативність. Без цього екстраполяція показників вибірок на всю досліджувану сукупність буде необґрунтованою. Оскільки ще немає достатньо надійних методів математичної перевірки репрезентативності природних вибірок, то вирішальну роль тут відіграє з'ясування історії їх виникнення та змістовний аналіз наявних даних.


6. Призначення кореляційно-регресійного аналізу

сезонний регресійний статистичний вибірковий

Економічні дані майже завжди представлені у вигляді таблиць. Числові дані, які у таблицях, зазвичай мають між собою явні (відомі) чи неявні (приховані) зв'язку.

Явно пов'язані показники отримані методами прямого рахунку, тобто обчислені за відомими заздалегідь формулами. Наприклад, обчислюються відсотки виконання плану, темпи зростання, індекси тощо.

Зв'язки другого типу заздалегідь невідомі. Однак люди повинні вміти пояснювати та передбачати (прогнозувати) складні явища для того, щоб керувати ними. Тому фахівці з допомогою спостережень прагнуть виявити приховані залежності і висловити їх як формул, т. е. математично змоделювати явища чи процеси. Одну з таких можливостей надає кореляційно- регресійний аналіз.

Звернімо увагу на те, що фахівці будують та використовують математичні моделі для трьох узагальнених цілей – пояснення, передбачення та управління.

Подання економічних та інших даних в електронних таблицях у наші дні стало простим та природним. Оснащення ж електронних таблиць засобами кореляційно-регресійного аналізу сприяє тому, що з групи складних, глибоко наукових і тому рідко використовуваних майже екзотичних методів кореляційно-регресійний аналіз перетворюється для фахівця на повсякденний, ефективний та оперативний аналітичний інструмент.

Користуючись методами кореляційно-регресійного аналізу, аналітики вимірюють тісноту зв'язків показників за допомогою коефіцієнта кореляції. При цьому виявляються зв'язки, різні за силою (сильні, слабкі, помірні та ін) та різні за напрямом (прямі, зворотні). Якщо зв'язки виявляться суттєвими, то доцільно буде знайти їх математичне вираз у вигляді регресійної моделі та оцінити статистичну значущість моделі. У економіці значне рівняння регресії використовується, зазвичай, для прогнозування досліджуваного явища чи показника.

Тому регресійний аналіз називають основним методом сучасної математичної статистики виявлення неявних і завуальованих зв'язків між даними спостережень. Електронні таблиці роблять такий аналіз легко доступним.


7. Призначення та методика проведення аналізу сезонних коливань


При аналізі багатьох рядів динаміки можна помітити певну повторюваність (циклічність, закономірність у коливаннях), зміни їх рівнів. Наприклад, у більшості галузей економіки це проявляється у вигляді внутрішньотрудових чергувань, підйомів та спадів випуску продукції, неоднаковим споживанням сировини та енергії, коливання рівнів собівартості, прибутку та інших показників. Яскраво виражений сезонний характер має сільське господарство, рибальство, лісозаготівля, полювання, туризм тощо. Значної коливання у внутрішній динаміці схильні грошові звернення та товарообіг. Найбільші грошові доходи утворюються у населення III і IV кварталах, особливо в селян. Максимальний обсяг товарообігу (різного) посідає кінець кожного року. Продаж молочних продуктів збільшується зазвичай у II та III кварталах, а фруктів та овочів – у другому півріччі. Споживання їжі пов'язане з часом доби, днями тижня, часом року. Також закономірності у зміні рівнів низки динаміки прийнято називати сезонними коливаннями.

Під сезонними коливаннями розуміється більш менш стійкі внутрішньорічні коливання рівнів динамічного роду, зумовлені специфіками розвитку даного явища.

Мета вивчення сезонних коливань полягає як у розробці заходів його ліквідації чи пом'якшення сезонних коливань (нерідко цим і обмежується статистичне дослідження), так оптимального дослідження умов, сприяють розвитку масових явищ і процесів.

При статистичному дослідженні у лавах динаміки сезонних коливань вирішуються такі дві взаємозалежні завдання: 1) виявлення специфіки розвитку явища, що вивчається у внутрішньо річний динаміці; 2) вимір сезонних коливань досліджуваного явища з побудовою моделі сезонної хвилі.

Особлива увага позначається забезпечення сумісності рівнів ряду. За наявності у вихідному матеріалі різноважних за тривалістю періодів часу об'ємні величини перераховуються на середні величини, що характеризують інтенсивність розвитку явища, що вивчається в одиницю часу.

Для виявлення сезонних коливань зазвичай беруться дані кілька останніх років, розподілені по певним внутрішньорічним періодам.

Для вимірювання сезонних коливань обчислюються спеціальні статистичні показники, які називаються індексами сезонності (Is) та сукупність яких відбиває сезонну хвилю.

Для обчислення індексів сезонності застосовуються різноманітні методи.

У загальному вигляді індекси сезонності визначаються ставленням вихідних (фактичних) рівнів початкового ряду (y) до розрахункових (теоретичних) рівнів, що виступають як база порівняння.

Тим самим було ліквідується (усувається) вплив основний тенденції (тренду). Потім усереднення індивідуальних індексів сезонних однойменних внутрішньорічних періодів аналізованого ряду динаміки усувається вплив на сезонні коливання випадкових відхилень. Тому для кожного періоду сума визначається узагальненням показників у вигляді середніх індексів сезонності

Залежно від характеру тренду остання формула може бути записана по-різному:

Наприклад, коефіцієнти місячної безперервності визначаються у разі як відношення рівня кожного місяця до середньомісячного протягом року. Для більшої надійності індекси сезонності зазвичай розраховуються за даними за 3-5 років. При цьому для кожного місяця розраховується середня величина рівня за ці 3-5 діт, яка зіставляється із загальним щомісячним рівнем за 3-5 років. Можна, таким чином, спочатку для кожного з цих 3-5 років розрахувати щомісячний індекс сезонності, з яких потім розраховується середній індекс сезонності для кожного місяця. Результати збігатимуться.

Тому всім фактичних рівнів аналізованого низки динаміки загальний середній рівень є постійної величиною, цей підхід називається способом постійної середньої. І тут спочатку виконується попереднє аналітичне вирівнювання фактичних рівнів і після цього обчислюється сезонна величина, але з постійної середньої (як у попередньому випадку), як від вирівняних даних.

Вимірювання сезонних коливань на основі змінних рівнів тренду (розрахункових рівнів ряду) у статистиці отримало назву методи змінної середньої. Є й інші, складніші методи розрахунку індексів сезонності. Наприклад, якщо всі коливання членів початкового ряду пояснюються лише (чи переважно) сезонними причинами, то рівняння тренду висловлює лише сезонні коливання. Отже вивчення сезонного коливання зводиться до проблеми вибору адекватної математичної функції. Проте найкраще з погляду відображення сезонних коливань навантаження рівняння вибирають щонайменше середнього квадратичного індексів сезонності 100 %.


Список літератури


1.Гусаров В.М. Теорія статистики: М.: "Аудит", видавниче об'єднання "ЮНІТІ", 2010.

2.Лапуніна Л., Четверіна Т. Напруженість на Російському ринку та механізми її подолання: Питання економіки, N 2, 2008.

.Загальна теорія статистики: статистична методологія у вивченні комерційної діяльності, Підручник/за редакцією А.А. Спіріна, О.Е. Башин: М.: «Фінанси та статистика», 2009.

.Сабір'янова К. Мікроекономічний аналіз динамічних змін на Російському ринку праці. Питання економіки, N 1, 2012.

.Соціальна статистика: Підручник / За ред. чл.-кор. РАН І.І. Єлісєєвої.- 3-тє вид., перераб. та доп.- М.: Фінанси та статистика, 2011.- 480 с.


Репетиторство

Потрібна допомога з вивчення якоїсь теми?

Наші фахівці проконсультують або нададуть репетиторські послуги з цікавої для вас тематики.
Надішліть заявкуіз зазначенням теми прямо зараз, щоб дізнатися про можливість отримання консультації.

Досить часто виникають явища, які можна проаналізувати лише за допомогою статистичних методів. У цьому кожному суб'єкта, прагне глибоко вивчити проблему, проникнути у суть теми, важливо мати уявлення про них. У статті розберемося, що таке статистичний аналіз даних, які його особливості, і навіть які методи застосовують у його проведенні.

Особливості термінології

Статистику розглядають як специфічну науку, систему держорганів, а також як набір цифр. Тим часом, далеко не всі цифри можна вважати статистикою. Розберемося у цьому питанні.

Для початку слід згадати, що слово "статистика" має латинське коріння і походить від поняття status. У буквальному перекладі термін означає "певне становище предметів, речей". Отже, статистичними визнаються лише такі дані, з допомогою яких фіксуються щодо стійкі явища. Аналіз, власне, і виявляє цю стійкість. Його застосовують, наприклад, щодо соціально-економічних, політичних явищ.

Призначення

Застосування статистичного аналізу дозволяє відображати кількісні показники у нерозривному зв'язку з якісними. В результаті дослідник може побачити взаємодію фактів, встановити закономірності, виявити типові ознакиситуацій, сценарії розвитку, обґрунтувати прогноз.

Статистичний аналіз – це один із ключових інструментів ЗМІ. Найчастіше його використовують у ділових виданнях, таких як, наприклад, "Відомості", "Комерсант", "Експерт-профі" та ін. У них завжди публікуються "аналітичні міркування" про валютний курс, котирування акцій, облікові ставки, інвестиції, ринок , економіці загалом.

Вочевидь, щоб результати аналізу були достовірними, постійно проводиться збір даних.

Джерела інформації

Збір даних може здійснюватись по-різному. Головне, щоб способи не порушували закон та не обмежували інтереси інших осіб. Якщо говорити про ЗМІ, то для них ключовими джерелами інформації є державні статистичні органи. Ці структури мають:

  1. Збирати звітні відомості відповідно до затверджених програм.
  2. Групувати інформацію за тими чи іншими критеріями, найбільш значущим досліджуваного явища, формувати зведення.
  3. Проводити свій статистичний аналіз.

До завдань уповноважених держорганів входить також надання отриманих ними даних у звітах, тематичних добірках чи прес-релізах. Останнім часом статистика оприлюднюється на офіційних сайтах держструктур.

Крім зазначених органів, інформацію можна отримати у Єдиному держреєстрі підприємств, установ, об'єднань та організацій. Мета його створення полягає у формуванні єдиної інформаційної бази.

Для аналізу можна використовувати інформацію, отриману від міжурядових організацій. Існують спеціальні бази даних економічної статистики країн.

Часто інформація надходить від приватних осіб, громадських організацій. Ці суб'єкти зазвичай ведуть свою статистику. Так, наприклад, Союз охорони птахів у Росії регулярно влаштовує звані солов'їні вечори. Наприкінці травня через ЗМІ організація запрошує всіх бажаючих взяти участь у підрахунку солов'їв біля Москви. Отримані відомості обробляються групою експертів. Після цього відомості переносяться у спеціальну картку.

Багато журналістів звертаються за інформацією до представників інших авторитетних ЗМІ, які користуються в аудиторії популярністю. Найпоширенішим способом отримання даних є опитування. При цьому опитуваними можуть стати як пересічні громадяни, так і експерти у будь-якій галузі.

Специфіка вибору методики

Перелік показників, необхідні проведення аналізу, залежить від специфіки досліджуваного явища. Наприклад, якщо вивчається рівень добробуту населення, пріоритетними вважаються дані про якість життя громадян, прожитковий мінімум на даній території, розмір МРОТ, пенсії, стипендії, споживчого кошика. При дослідженні демографічної ситуації важливі показники смертності та народжуваності, кількість мігрантів. Якщо вивчається сфера промислового виробництва, важливі відомості для статистичного аналізу – це кількість підприємств, їх види, обсяг продукції, рівень продуктивності праці тощо.

Середні показники

Як правило, при описі тих чи інших явищ використовують середні арифметичні величини. Для отримання числа складають один з одним, а отриманий результат ділять на їх кількість.

Наприклад, встановлено, що до одного держоргану надходить 5 тисяч листів щомісяця, а до іншого - 1 000. Виходить, що перша структура отримує в 5 разів більше звернень. При порівнянні середніх показників може бути виражена у відсотках. Наприклад, середній заробітокфармацевта становить 70% від пор. з/п інженера.

Підсумкові зведення

Вони є систематизацію ознак досліджуваного події виявлення динаміки його розвитку. Наприклад, встановлено, що 1997 р. річковий транспорт усіх відомств і управлінь перевіз 52,4 млн тонн вантажу, а 2007 р. - 101,2 млн т. Щоб зрозуміти зміни характеру транспортувань у період із 1997 по 2007 р., можна згрупувати підсумкові показники за видами об'єктів, та був порівняти групи друг з одним. У результаті можна отримати повніші відомості про розвиток вантажообігу.

Індекси

Їх досить широко застосовують щодо динаміки подій. Індекс у статистичному аналізі - це середній показник, що відображає зміну явища під впливом іншої події, абсолютні показникиякого визнані незмінними.

Наприклад, в демографії як специфічний індекс може виступати величина природних втрат (приросту) населення. Її визначають при порівнянні рівня народжуваності та смертності.

Графіки

Вони використовують для відображення динаміки розвитку події. Для цього застосовують фігури, крапки, лінії, що мають умовні значення. Графіки, з допомогою яких виражаються кількісні співвідношення, називаються діаграмами чи динамічними кривими. Завдяки їм можна наочно побачити динаміку розвитку якогось явища.

Графік, що показує збільшення кількості осіб, які страждають на остеохондроз, являє собою криву, що йде вгору. Відповідно, нею можна наочно побачити тенденцію захворюваності. Люди, навіть не прочитавши текстовий матеріал, можуть сформулювати висновки про динаміку і спрогнозувати розвиток ситуації в подальшому.

Статистичні таблиці

Вони часто використовуються для відображення даних. За допомогою статистичних таблиць можна зіставляти інформацію за показниками, що змінюються з часом, що різняться залежно від країни та ін. Вони являють собою наочну статистику, якій часто не потрібні коментарі.

Методи

В основі статистичного аналізу лежать прийоми та способи збору, обробки та узагальнення відомостей. Залежно від природи методи можуть бути кількісними та категоріальними.

За допомогою перших одержують метричні дані, які за своєю структурою є безперервними. Їх можна виміряти за допомогою інтервальної шкали. Вона є системою чисел, рівні проміжки між якими відбивають періодичність значень досліджуваних показників. Також використовується шкала стосунків. У ньому, крім відстані, визначається порядок значень.

Неметричні (категоріальні) дані є якісними відомостями, кількість унікальних категорій і значень яких обмежена. Вони можуть бути представлені у вигляді номінальних чи порядкових показників. Перші використовують із нумерації об'єктів. Для других передбачається природний порядок.

Одновимірні методи

Вони застосовуються в тому випадку, якщо для оцінки всіх елементів вибірки використовується єдиний вимірювач або якщо останніх декілька для кожного компонента, але змінні досліджуються окремо один від одного.

p align="justify"> Одновимірні методи різняться в залежності від типу даних: метричні або неметричні. Перші вимірюють за відносною або інтервальною шкалою, другі - за номінальною або порядковою. Крім цього, розподіл методів здійснюється на класи в залежності від кількості досліджуваних вибірок. При цьому необхідно враховувати, що це число визначають, як здійснюється робота з інформацією для конкретного аналізу, а не за способом збору даних.

Однофакторне дисперсійне дослідження

Мета статистичного аналізу може полягати у вивченні впливу однієї чи кількох чинників на конкретний ознака об'єкта. Однофакторний дисперсійний метод застосовується тоді, коли дослідник має 3 і більше незалежні вибірки. При цьому вони мають бути отримані з генеральної сукупності шляхом зміни незалежного фактора, для якого відсутні кількісні виміри з якихось причин. Передбачається, що є різні та однакові вибіркові дисперсії. У зв'язку з цим слід визначити, чи вплинув на цей фактор значний вплив на розкид чи він став наслідком випадковостей, що виникли внаслідок невеликих обсягів вибірок.

Варіаційний ряд

Він являє собою упорядкований розподіл одиниць генеральної сукупності, як правило, за зростаючими (у рідкісних випадках за спадаючими) показниками ознаки та підрахунок їх числа з тим чи іншим значенням ознаки.

Варіація є різницею у показнику будь-якого ознаки в різних одиниць конкретної сукупності, що у той самий момент чи період. Наприклад, співробітники компанії відрізняються один від одного за віком, зростанням, доходами, вагою та ін. Виникає варіація внаслідок того, що індивідуальні показники ознаки формуються під комплексним впливом різних факторів. У кожному даному випадку вони поєднуються по-різному.

Варіаційний ряд буває:

  1. Ранжованим. Він представлений у вигляді переліку окремих одиниць генеральної сукупності, розміщених у порядку спадання чи зростання досліджуваного ознаки.
  2. Дискретним. Він представлений у формі таблиці, що включає конкретні показники змінюється ознаки х і кількості одиниць сукупності з заданою величиною f ознаки частот.
  3. Інтервальним. У цьому випадку показник безперервної ознаки визначається за допомогою інтервалів. Вони характеризуються частотою t.

Багатовимірний статистичний аналіз

Він проводиться, якщо для оцінки елементів вибірки застосовується 2 і більше вимірювача, і вивчаються змінні одночасно. Така форма статистичного аналізу відрізняється від одномірного способу насамперед тим, що з її використанні увагу зосереджується лише на рівні взаємозв'язку між явищами, а чи не на середніх показниках і розподілах (дисперсіях).

Серед основних методів багатовимірного статистичного дослідження виділяють:

  1. Крос-табуляцію. З її використанням одночасно характеризують значення двох і більше змінних.
  2. Дисперсійний статистичний аналіз. Цей метод орієнтований на пошук залежностей серед експериментальних даних за допомогою вивчення суттєвості відмінностей у середніх показниках.
  3. Коваріаційний аналіз. Він тісно пов'язаний із дисперсійним методом. При ковариационном дослідженні залежна змінна коригується відповідно до інформацією, що з нею. Це забезпечує можливість усунення мінливості, що вноситься ззовні, і відповідно підвищити ефективність дослідження.

Також існує дискримінантний аналіз. Він застосовується, якщо залежна змінна є категоріальною, а незалежні (предиктори) – інтервальними.

ТОЛЬЯТТИНСЬКИЙ ДЕРЖАВНИЙ ІНСТИТУТ

АВТОМЕХАНІЧНИЙ ІНСТИТУТ

Кафедра Технологія машинобудування

СТАТИСТИЧНІ МЕТОДИ АНАЛІЗУ ЯКОСТІ

Методичний посібник для студентів машинобудівних спеціальностей

Тольятті 2003


У методичному посібникунаведено огляд методів статистичного забезпечення якості. Докладно розглянуто застосування 7 традиційних японських методів аналізу якості. Включено матеріали, які розглядають ідею статистичного приймального контролю. В окремому розділі викладено необхідний розуміння статистичних методів математичний апарат.


СПИСОК ПОЗНАЧЕНЬ

ВСТУП

2. МЕТОДИ КОНТРОЛЮ ЯКОСТІ

2.1 Контрольні листки

2.2 Діаграми Парето

2.2.2 Аналіз діаграм Парето

2.3 Діаграми Ісікави

2.4 Гістограми

2.4.1 Побудова гістограми

2.4.2 Аналіз гістограм

2.5 Діаграми розсіювання

2.6 Контрольні карти

2.6.3 Аналіз контрольних карток

2.7 Розшарування

3.2 Розрахунок індексів відтворюваності

4.2 Використання діаграм Парето

5.2 Числові характеристики випадкових величин

5.3 Типові теоретичні розподіли випадкових величин


СПИСОК ПОЗНАЧЕНЬ

ВГД - верхня межа поля допуску:

НГД – нижня межа поля допуску;

ВКГ – верхня контрольна межа на контрольній карті;

НКГ – нижня контрольна межа на контрольній карті;

Ср, Срк - індекси відтворюваності:

n-обсяг вибірки;

Р(А) – ймовірність випадкової події А;

R - розмах (довжина інтервалу, в який потрапляють всі значення параметра, що спостерігається);

s – стандартне відхилення;

 - середнє квадратичне відхилення;

х- вибіркове середнє (середнє арифметичне всіх значень параметра, що спостерігається);

х – медіана.


ВСТУП

Статистичні методи - важливий інструмент підвищення якості в будь-якому сучасному виробництві, тим більше серійному виробництві. Всі провідні автомобільні компанії застосовують статистичні методи практично на всіх стадіях життєвого циклу, як для аналізу та контролю якості виробничих процесів та виробленої продукції, так і для розробок нових технологій та прийняття правильних управлінських рішень.

В даний час у міжнародному стандарті ISO 9001 одним з елементів системи якості є елемент «Статистичні методи», а в комплекс міжнародних стандартів QS-9000 входить керівництво «Статистичне управління процесами».

Даний посібник містить опис основних прийомів та методів статистичного управління якістю.

Глава 1 присвячена загальним питанням статистичного управління процесами. У розділах 2 і 3 розглядаються статистичні методи контролю якості процесу виробництва (так звані «сім простих японських методів якості») і можливі управляючі впливи. У розділі 4 застосування методів аналізу якості виробничих процесів ілюструється на конкретних прикладах, притаманних виробничої діяльності АТ «АВТОВАЗ». У розділі 5 викладено необхідний мінімум математичного апарату розуміння статистичних методів.


1. СТАТИСТИЧНЕ УПРАВЛІННЯ ПРОЦЕСАМИ

Процес - це сукупність взаємозалежних ресурсів та діяльності, яка перетворює вхідні елементи у вихідні. В результаті процесу відбувається перетворення вихідних елементів (матеріалів, інформації), що збільшує їхню цінність за рахунок застосування кваліфікованої праці та знань.

В автомобілебудуванні під процесом розуміється створення та експлуатація автомобіля. Тут елементами є поєднання постачальників (вхідні матеріали), виробників, устаткування, методів, довкілля, споживачів.

У заводських виробничих умовах поширений термін технологічний процес як процес виготовлення деякого продукту за наявності певних ресурсів із спостеріганим (контрольованим) результатом діяльності.

Здатність деякого об'єкта задовольняти споживчим запитам покупців пов'язують із поняттям якість. Розрізняють якість процесів та якість продукції. Якість продукції зумовлено ефективністю вивчення попиту, проектування, виготовлення, супроводу експлуатації.

Якість процесу визначається тим, наскільки споживчі властивості продукту задовольняються на заводі вимогами конструкторської та технологічної документації.

Ефективність процесу оцінюється як висока якість продукції і забезпечується за допомогою системи управління.

Система управління процесом будується як замкнута система з допомогою принципу зворотний зв'язок. Саме управління процесом ґрунтується на активному аналізі інформації про продукцію.

Інформація про продукцію - показники якості виробів, а також параметри, що описують умови протікання процесу (такі як температура, циклічність тощо); збирається з урахуванням аналізу фактичної якості виготовленої продукції. Якщо ця інформація зібрана і правильно інтерпретована, то вона може показати, чи потребує процес я коригування чи ні.

Реалізація управління процесом здійснюється за допомогою різних заходів, що розпадаються на дві групи за ознакою функціональної спрямованості.

Заходи, створені задля продукцію - заходи, орієнтовані пошук дефектів у вже виготовленої продукції. Якщо в процесі виробництва не витримуються технологічні умови, то завжди буде потреба сортувати продукцію, виправляти невідповідності у виробах. Це буде продовжуватися доти, доки не будуть вжиті необхідні заходи щодо покращення процесу. Заходи з виявлення та усунення шлюбу орієнтовані на минуле.

Заходи, спрямовані на покращення процесу - заходи, пов'язані зі структурною перебудовою процесу, спрямовані на покращення процесу (тобто дозволяють уникнути шлюбу). Такими заходами є, наприклад, навчання співробітників, зміни у сировині, переналагодження обладнання чи навіть зміна технології. Важливо, що ці заходи орієнтовані на майбутнє.

Очевидно, що контроль якості у виробництві, за яким слідують лише заходи щодо продукції, є поганою заміною для заходів щодо дійсного покращення якості процесу.

При виробництві будь-якої продукції якість готового виробу залежить від безлічі різних факторів. Наприклад, на розміри оброблюваної деталі впливають властивості та стан:

a) верстата (знос підшипника, знос елементів позиціонування),

b) інструменту (міцність, знос),

c) матеріал (твердість).

d) персоналу (ефективність навчання),

e) робочого середовища (температура, безперебійне електроживлення) тощо.

В результаті, навіть в умовах автоматизованого виробництва неможливо отримати два абсолютно однакові вироби.

Відмінності у кінцевих результатах процесу називають мінливістю. Мінливість як готовий продукт пов'язується з мінливістю в процесі виробництва, яка обумовлює появу дефектних (невідповідних) виробів навіть при налагодженому виробничому процесі. Виявлення факторів, що впливають на якість, і зменшення мінливості процесу дозволяє підвищити якість виробів, що випускаються, і зменшити кількість шлюбу.

Слід розпізнавати два види джерел мінливості:

Звичайні причини мінливості,

Особливі причини мінливості.

Звичайні причини мінливості є стабільною системою випадкових факторів. І тут результати процесу статистично передбачувані.

Наведемо приклади групи факторів випадкового характеру:

Випадкові розкиди характеристик матеріалів, напівфабрикатів та комплектуючих виробів;

Випадкові розкиди параметрів технологічних процесів (довкілля та робоче тіло);

Випадкові розкиди характеристик та параметрів засобів технологічного оснащення, вимірювальних приладів, різального та вимірювального інструменту, стендового випробувального обладнання тощо;

Випадкові несприятливі поєднання допусків у розмірних технологічних ланцюжках під час виготовлення продукції тощо.

Мінливість, обумовлена ​​факторами випадкового характеру, може бути зменшена шляхом проведення відповідних організаційно-технічних заходів на основі дослідження результатів їхнього статистичного аналізу та опису їх прояву статистичними закономірностями.

Особливі причини мінливості є невипадковими факторами, що порушують стабільний перебіг процесу.

Наведемо приклади групи факторів невипадкового характеру:

Застосування матеріалів, напівфабрикатів та комплектуючих виробів, що не передбачені технологічними процесами, у тому числі з простроченими термінами придатності;

Недотримання встановлених нормативно-технічною документацією прийомів, методів та режимів обробки виробів та їх випробувань;

використання не атестованих під час засобів контролю та засобів технологічного оснащення з простроченими термінами придатності;

Незадовільний стан засобів технологічного обладнання, ремонтної бази, випробувального обладнання тощо:

Відсутність закріплення конкретних видів робіт (операцій) за певними виконавцями:

Неповне завершення попередніх операцій:

Недотримання послідовності виконання робіт (операцій), заданих за технологічними маршрутними картами:


2. МЕТОДИ КОНТРОЛЮ ЯКОСТІ

Прагнучи найефективніше використовувати статистичні методи управління якістю, японські фахівці розробили такі процедури, які досить прості для застосування, тобто не вимагають спеціальних знань, але водночас дають результати, що дозволяють професіоналам оперативно аналізувати та вдосконалювати виробничий процес.

Сукупність використовуваних методів отримала назву «сім простих методівконтролю якості» і містить:

Контрольні листки,

Діаграми Парето,

Діаграми Ісікави.

Гістограми,

Діаграми розсіювання,

Контрольні карти,

Розшарування (стратифікація).

Розглянемо кожен із цих методів.

2.1 Контрольні листки

Аналіз будь-якого виду діяльності можливий лише на підставі наявної інформації, тому застосування кожного з методів контролю якості має починатися зі збору необхідних даних. Насамперед, необхідно чітко сформулювати мету збору цікавих для нас відомостей (контроль і регулювання виробничого процесу; аналіз відхилень від встановлених вимог; контроль продукції). Потім продумують, які типи даних потрібно зібрати, їх характер, частоту та способи вимірювання, надійність одержуваних результатів тощо. Оскільки аналізу даних використовуються різні статистичні методи, то процесі збору інформації слід подбати про впорядкування одержуваних результатів, щоб полегшити їх подальшу обробку. Результати спостережень найзручніше заносити до контрольних листків.

Контрольний листок - це паперовий бланк для первинного зборуінформації.

Контрольний листок призначений для фіксації контрольованих параметрів:

Полегшення процесу збирання даних;

Автоматичне впорядкування збору даних для спрощення подальшої обробки.

Основні вимоги до контрольного листка:

Простота фіксації результатів спостережень;

Наочність одержаних результатів;

Повнота даних.

Для досягнення цих вимог необхідно заздалегідь продумати форму контрольних листків та постійно вдосконалювати цю форму з урахуванням зауважень та побажань тих, хто заповнює контрольні листки. Слід прагнути до того, щоб при фіксації результатів потрібно робити мінімум записів, наприклад, просто робити позначки в потрібних графах. Добре, коли автоматично виходить гістограма (див. розділ 2.4) або діаграма розсіювання (розділ 2.5). Але при цьому контрольний листок повинен містити максимум вихідної інформації (не просто діаметр валика, а верстат, на якому виготовлялася деталь, зміна, час, партія, що обробляється і т.п.)

Так як отримана інформація необхідна для подальшого аналізу причин дефектів, пов'язаних як з недосконалістю технологічного процесу, так і з іншими факторами, слід вимагати дуже ретельного заповнення всіх граф контрольного листка. Нехтування будь-якими даними, наприклад, про номер партії або час вимірювання досліджуваного параметра, може вимагати подальшого додаткового збору інформації, що ускладнить роботу.

Приклади контрольних листків наведено на рисунках 2.1.1. - 2.1.4.

На рис. 2.1.1 показаний контрольний листок для реєстрації розподілу параметра, що вимірюється в ході виробничого процесу. В даному випадку фіксуються зміни в розмірах деякої деталі, що піддається механічній обробці, причому в кресленні було вказано розмір 8300 0008. При заповненні контрольного листка після кожного виміру у відповідній клітині ставився хрест. В результаті до кінця вимірювань на контрольному листку виявилася готова гістограма.

На рис. 2.1.2. показаний контрольний листок для реєстрації видів невідповідностей, що використовується під час приймального контролю деякої деталі. Тут фіксуються певні невідповідності, що виявляються контролером і наприкінці робочого дня можна швидко підрахувати число та різновиди виявлених невідповідностей. Такий контрольний лист зручний для подальшої побудови діаграми Парето, але він не дає можливості розшарування даних, тобто розбивки їх на групи, наприклад, за часом або місцем виготовлення деталі.

Якщо передбачається подальший додатковий аналіз інформації, краще використовувати аркуш, наведений малюнку 2.1.3. На цьому листку реєструються невідповідності в деталях (вал КПП), виготовлених на верстатах 003.716.33 та 003.718.33 фірми FISCHER з урахуванням верстатів, робочих, днів виготовлення та типів дефектів. Тут відразу видно, що найбільше шлюбу допускає робітник, а найневдалішим днем ​​виявилося середовище. Подальше дослідження показало, що в середу змащувально-охолоджувальна рідина була низькою якістю.

Для виявлення причин невідповідностей буває зручно не просто фіксувати кількість та види невідповідностей, а й відстежувати місце їх локалізації. Приклад відповідного контрольного листка наведено малюнку 2.1.4. При контролі виливків фіксуються не тільки наявність, а й місце розташування раковин. Внаслідок аналізу такого контрольного листка простіше виявляти можливі причини виникнення досліджуваного дефекту.

2.2 Діаграми Парето

При виробництві продукції неминуче доводиться стикатися з втратами (неякісні вироби та витрати, пов'язані з їх виробництвом). У більшості випадків переважна кількість невідповідностей та пов'язаних з ними втрат виникає через відносно невелику кількість причин. Цей постулат покладено основою аналізу Парето, який призначений поділу проблем якості на нечисленні істотно важливі і численні несуттєві.

Для визначення небагатьох істотно важливих факторів будують діаграми Парето.

Діаграма Парето - це графічне уявлення ступеня важливості причин чи чинників, які впливають досліджувану проблему.

Діаграми Парето бувають двох видів:

1) Діаграма Парето за результатами діяльності допомагає виявити головну проблему та відображає небажані результати діяльності

У сфері якості: - дефекти, поломки, помилки, відмови, рекламації, ремонти, повернення продукції;

У сфері собівартості: - обсяг втрат, витрати;

У сфері постачання: брак запасів, помилки у складанні рахунків, зриви строків постачання:

У безпеці: нещасні випадки, аварії.

2) Діаграма Парето з причин відображає причини проблем, що виникають у ході виробництва, та допомагає виявити головну

З кадрів: зміна, бригада, вік, досвід роботи, кваліфікація, індивідуальні характеристики працівника;

По устаткуванню: верстати, агрегати, інструментальне оснащення, моделі, штампи, технологія;

По сировині: виробник, вид сировини, постачальник, партія:

За способами роботи: умови виробництва, прийоми роботи, послідовність операцій.

2.2.1 Метод побудови діаграми Парето

1) Визначити проблему, яку слід дослідити.

2) Виділити чинники, які можуть спричинити сформульовану проблему.

3) Перерахувати дані, які треба зібрати.

4) Встановити метод та період збору даних. Примітка. На цьому етапі корисно залучати експертів, у тому числі найбільш досвідчених працівників, які стикаються з цією проблемою

Етап 2: Розробити контрольні листки для реєстрації даних з переліком видів інформації, що збирається.

Примітка Результати діяльності бажано представляти в грошах, оскільки витрати є важливим критеріємвимірі та управлінні

Етап 3: Заповнити аркуші реєстрації даних, зібрати всю отриману інформацію та підрахувати підсумки.

Етап 4: Скласти загальну таблицю даних, в якій відобразити всі ознаки (фактори), що перевіряються, підсумки по кожній ознакі окремо, накопичену суму, відсотки до загального підсумку для кожної ознаки і накопичені відсотки.

Приклад 2.2.1.

Типи Число Накопичена % числа дефект Накопичений

дефектів дефектів сума тов до загального відсотка

Деформація

Подряпини Раковини 104

Тріщини Плями 10

Інші 4

При цьому досліджувані ознаки (фактори) розташовують у порядку значимості, що вийшла, є за зменшенням загальної кількості зареєстрованих даних, але групу "інші" завжди записують в останній рядок.

Етап 5: Побудувати стовпчикову діаграму, орієнтуючись на ліву вертикальну вісь (тобто над інтервалом, що відповідає ознакі А, зобразити прямокутник (стовпчик), висота якого дорівнює числу появи цієї ознаки).

Етап 6: На вертикалях, що відповідають правим кінцям кожного інтервалу, нанести крапки накопичених сум відсотків, орієнтуючись на праву шкалу. Поєднати ці точки відрізками прямих. Отримана ламана називається кривою Парето (кумулятивною кривою).

Етап 7: Нанести на діаграму всі необхідні написи (назва, найменування контрольованого виробу, ім'я укладача діаграми, період збору інформації, об'єкт дослідження та місце його проведення, загальна кількість об'єктів контролю, а також розмітку числових значень на осях та розшифрування кодових позначень).

Діаграма Парето, що відповідає прикладу 2.2.1, наведено малюнку 2.2.1.

2.2.2 Аналіз діаграм Парето

p align="justify"> Значимість фактора визначається частотою його реєстрації, найбільша частота вказує найбільш істотний фактор. Тому на діаграмі Парето висоти шпальт вказують ступінь впливу кожного фактора на всю проблему в цілому, а крива Парето дозволяє оцінити зміну результату при усуненні кількох найбільш суттєвих факторів.

Після виявлення проблеми шляхом складання діаграми Парето за результатами корисно скласти діаграму Парето та причин. Тоді з'являється можливість визначити причини виникнення проблеми. отже, намітити шляхи усунення виявленої головної причини. Таким чином, виділяється найефективніший шлях вирішення проблеми.

Слід зазначити, проте, якщо будь-який небажаний чинник можна усунути відразу з допомогою простого рішення, це треба зробити негайно (хоч би яким незначним цей чинник був). При цьому з розгляду виключається несуттєвий чинник, який перестає впливати.

Якщо група " інші " чинники становить великий відсоток, треба спробувати використати якийсь інший спосіб класифікації (угруповання) ознак. При цьому може виникнути потреба у додаткових дослідженнях. Цього не слід боятися. Взагалі для виявлення суті проблеми має сенс будувати багато різних діаграм Парето, досліджуючи різні чинники і способи їх взаємодії. Тільки в цьому випадку стає зрозуміло, які з факторів найбільш суттєві та які можливі шляхи їхнього перетворення.

2.3 Діаграми Ісікави

Результат процесу залежить від численних факторів, причому деякі з них можуть впливати на інші, тобто пов'язаними відносинами "причина - результат". Знання структури цих відносин, тобто виявлення ланцюжка причин і результатів, дозволяє успішно вирішувати проблеми управління, зокрема проблеми управління якістю. Для зручності аналізу структури причин та результатів використовують діаграми Ісікави – діаграми причин та результатів.

В області контролю якості діаграма Ісікави - це діаграма, яка показує відношення між показником якості та факторами, що впливають на нього.

Діаграму причин і результатів іноді називають діаграмою "риб'ячий скелет" в силу її специфічного виду (див. рис. 2.3.1). Досліджуючи певний показник якості, прагнуть сформулювати основні чинники, що впливають цей показник. Потім виділяють вторинні фактори, що впливають на головні причини, а також дрібніші причини, що впливають на вторинні фактори, і т. д. Таким чином, для складання діаграми Ісікави треба проранжувати фактори їхньої значущості та встановити структуру взаємовпливів.

Діаграма причин і результатів графічно відображає встановлені зв'язки наступним чином: посередині листа проводиться горизонтальна пряма ("хребет"), що закінчується прямокутником, в якому зазначений показник якості, що розглядається. Головні причини, що впливають на цей показник, записуються вище і нижче за пряму і з'єднуються з хребтом стрілками. Вторинні причини записують між прямою та відповідною головною причиною і з'єднують із цією причиною стрілками. Потім діаграмі показують чинники, що впливають вторинні причини. Щоб діаграма була придатна для подальшого використання, на ній необхідно вказати всю супутню інформацію (назва, назва виробу, процесу або групи процесів, учасників процесу тощо).

Після того, як всі фактори, що впливають на цей показник якості, виявилися відбитими на діаграмі, неважко встановити рівень їх важливості. Найбільш значущі, що надають найсильніший вплив, слід зазначити, щоб саме їм приділити найбільшу увагу при подальшій роботі.

Часто діаграми Ісікави використовують для систематизації списку причин. У цьому випадку при дослідженні певного показника якості намагаються знайти максимальну кількість причин, що впливають на цей показник, а вже потім мають у своєму розпорядженні їх у діаграму причин - результатів, пов'язуючи всі фактори в єдину ієрархічну структуру.

При побудові діаграм Ісікави важливо якомога точніше сформулювати показник, тоді діаграма буде більш конкретною. Щоб силу зв'язків причина - результат можна було оцінити об'єктивно, бажано формулювати показник якості та фактори, що на нього впливають так, щоб їх можна було виміряти, тобто оцінити чисельно. У деяких випадках для цього доводиться вводити числові параметри, що характеризують показник, що досліджується. Наприклад, якість забарвлення буде характеризуватись кількістю незабарвлених місць, або товщиною барвистого шару, або бур'яном.

Після виявлення найважливіших причин треба постаратися знайти ті чинники, якими можна вжити заходів. Якщо з виявленої причини не можна вжити жодних дій, проблема не вирішена, і тому слід спробувати розбити її на причини. Використання діаграми допомагає виявити елементи, які потрібно перевірити, усунути або модифікувати, а також елементи, які потрібно додати. Якщо прагнути вдосконалити діаграму, то можна не тільки краще розібратися в досліджуваному процесі, а й знайти шляхи покращення технології виготовлення виробу.

2.4 Гістограми

Більшість факторів, що впливають на виробничий процес, не залишаються незмінними. Тому числові дані, зібрані в результаті спостереження, не можуть бути однаковими, але обов'язково підкоряються певним закономірностям, які називають розподілом (див. гл. 6).

Якщо вимірювати контрольований параметр безперервно, можна побудувати його графік густини розподілу (див. розділ 6.3). Однак на практиці проводять вимірювання тільки у певні проміжки часу та не всіх виробів, а лише деяких. Тому за результатами вимірювань будують зазвичай гістограму - ступінчасту фігуру, контури якої дають приблизне уявлення про графік щільності, тобто про характер розподілу параметра, що вивчається.

Гістограма - це стовпчикова діаграма, що служить для графічного представлення наявної кількісної інформації.

Зазвичай основою для побудови гістограми служить інтервальна таблиця частот, в якій весь діапазон виміряних значень випадкової величини розбитий на деяке число інтервалів, і для кожного інтервалу вказано кількість значень, що потрапили на інтервал (частота).

2.4.1 Побудова гістограми

Відзначити на осі абсцис максимальне та мінімальне значення випадкової величини та межі інтервалів - точки a1, ..., an, . Для зручності розрахунків та подальшого аналізу можна трохи розширити діапазон значень випадкової величини, наприклад, до меж поля допуску.

Довжина кожного інтервалу h = (an+1 – an)/k.

Над кожним інтервалом збудувати прямокутник заввишки n/h (його площа н,). Східчаста фігура, що вийшла, називається гістограмою частот. При цьому площа гістограми частот дорівнює обсягу вибірки n:

Відрізок назвемо основою гістограми.

Аналогічно будується і гістограма відносних частот - ступінчаста фігура, що складається з прямокутників, площі яких дорівнюють n/h, тобто Загальна площагістограми відносних частот дорівнює 1.

2.4.2 Аналіз гістограм

При побудові гістограм можуть трапитися такі випадки (рис. 2.4.)-2.4.7):

1) Звичайний тип (симетричний або дзвоноподібний). Найвища частота виявляється в середині основи гістограми (і поступово знижується до обох кінців). Форма симетрична (рис. 2.4.1). Така гістограма на вигляд наближається до нормальної (гауссівської) кривої, і можна припускати, що жоден з факторів, що впливають на досліджуваний процес, не переважає над іншими.

Примітка. Ця форма зустрічається найчастіше. У цьому випадку середнє значення випадкової величини (стосовно технологічної операції – це показник рівня налаштованості) близько до середини основи гістограми, а ступінь її розсіювання щодо середнього значення (для технологічних операцій – це показник точності) характеризується крутістю зниження стовпців

2) Гребінки (мультимодальний тип). Класи через один мають нижчі частоти (рис. 2.4.2).

Примітка. Така форма зустрічається, коли кількість одиничних спостережень, що потрапляють у клас, коливається від класу до класу або коли діє певне правило округлення даних Можливо потрібно здійснити розшарування даних, тобто визначити додаткові ознаки для групування значень, що спостерігаються.

3) позитивно скошений розподіл (негативно скошений розподіл). Середнє значення гістограми локалізується праворуч (ліворуч) від середини основи гістограми. Частоти досить різко спадають

під час руху вліво (вправо) і, навпаки, повільно вправо (вліво). Форма асиметрична (рис. 2.4.3).

Примітка. Така форма зустрічається, коли нижня (верхня) межа регулюється або теоретично, або за значенням допуску або коли ліве (праве) значення недосяжно. У цьому випадку також можна припускати, що на процес переважає будь-який фактор, зокрема, подібна форма зустрічається, коли має місце уповільнений (прискорений) знос ріжучого інструменту.

Така гістограма й у розподілу Релея (розділ 6.3), яке характеризує форму чи несиметричність вироби.

4) Розподіл з урвищем зліва (розподіл з урвищем праворуч). Середня арифметична гістограма локалізується далеко зліва (справа) від середини основи. Частоти різко спадають під час руху вліво (вправо) і навпаки, повільно вправо (вліво). Форма асиметрична (рис. 2.4.4).

Примітка. Це одна з тих форм, які часто зустрічаються при 100% просіювання виробів через погану відтворюваність процесу, а також коли проявляється різко виражена позитивна (негативна) асиметрія.

5) Плато (рівномірний та прямокутний розподіл). Частоти в різних класах утворюють плато, оскільки всі класи мають більш менш однакові очікувані частоти (рис. 2.4.5).

Примітка. Така форма зустрічається в суміші декількох розподілів, що мають різні середні, але може також вказувати на будь-який переважний фактор, наприклад, рівномірне зношування ріжучого інструменту.

6) Двопіковий тип (бімодальний тип). На околицях середини основи частота низька, зате є по піку з кожного боку (рис. 2.4.6).

Примітка. Така форма зустрічається, коли поєднуються два розподіли з далеко віддаленими середніми значеннями, тобто має сенс провести розшарування даних. Таку ж форму гістограми можна спостерігати і у випадку, коли який-небудь переважний фактор змінює свої характеристики, наприклад, якщо різальний інструмент має спочатку прискорене, а потім уповільнене зношування.

7) Розподіл із ізольованим піком. Поряд із розподілом звичайного типу з'являється маленький ізольований пік (рис. 2.4.7)

Примітка. Така форма з'являється за наявності малих включень даних з іншого розподілу чи помилки виміру. При отриманні подібної гістограми слід передусім перевірити достовірність даних, а в тому випадку, коли результати вимірювань не викликають сумніву, продумати обґрунтованість обраного способу розбиття значень, що спостерігаються на інтервали

2.4.3 Оцінка процесу з гістограм

При використанні гістограм для оцінки якості процесу на шкалі значень параметра, що спостерігається, відзначають нижню і верхню межі поля допуску (поля специфікації) і через ці точки проводять дві прямі паралельні стовпцям гістограми.

Якщо вся гістограма виявляється в межах кордонів поля допуску (рис. 2.4.8), процес статистично стійкий і вимагає ніякого втручання.

Якщо ліва і права межі гістограми збігаються з межами поля допуску (рис. 2.4.9), то бажано зменшити розкид процесу, оскільки будь-яка дія може призвести до появи виробів, що не задовольняють допуск.

Якщо частина стовпців гістограми виявляється за межами поля допуску (рис. 2.4.10 - 2.4.12), необхідно провести регулювання процесу так, щоб змістити середнє ближче до центру поля допуску (рис. 2.4.10, 2.4.12) або зменшити варіації , щоб досягти меншого розкиду (рис. 2.4.11, 2.4.12).

2.5 Діаграми розсіювання

Часто доводиться з'ясовувати, чи існує залежність між двома різними параметрами процесу. Наприклад, чи залежать зміни в діаметрі отвору від змін швидкості обертання свердла.

Зазвичай передбачається, що досліджувані параметри відображають характеристики якості та фактори, що впливають на них. Щоб зрозуміти, чи є зв'язок між аналізованими параметрами, використовують діаграми розсіювання.

Діаграма розсіювання - це графічне уявлення пар досліджуваних даних як безлічі точок на координатної площині.

Діаграма розсіювання дає можливість висунути гіпотезу про наявність або відсутність кореляційного зв'язку між двома випадковими величинами. При цьому зазвичай вивчаються величини, що описують

Характеристику якості та фактор, що впливає на неї;

Дві різні характеристикиякості;

Два чинники, що впливають одну характеристику якості.

2.5.1 Побудова діаграми розсіювання (поля кореляції)

1) Зібрати парні дані (х,у) про досліджувані випадкові величини. Для зручності ці дані записують як таблиці. Бажано, щоб кількість спостережень була не меншою за 30, тому що в іншому випадку результати кореляційного та регресійного аналізу (див. розділ 6.5) недостатньо достовірні.

2) Ввести на площині систему координат Оху, причому шкали на горизонтальній та вертикальній осях підбираються таким чином, щоб обидві довжини робочих частин вийшли приблизно однаковими. У цьому випадку діаграма розсіювання зручніша для візуального аналізу.

3) Кожну пару даних відзначити на координатній площині крапкою з координатами (х, у). Якщо якісь пари повторюються, то відповідні їм точки треба або ставити поряд, або використовувати умовні позначення, наприклад концентричні кружки.

4) Зробити пояснювальні написи, тобто назву діаграми; інтервал часу, що відбивається на діаграмі; кількість пар даних; назви та одиниці виміру для кожної осі; дані про упорядника діаграми.

2.5.2 Аналіз діаграми розсіювання

Якщо діаграмі розсіювання є далеко віддалені точки (викиди), необхідно досліджувати причини їх появи (помилки виміру чи запису даних, чи зміни у умовах роботи). При цьому можна отримати несподівану, але іноді дуже корисну інформацію, проте з подальшого кореляційного аналізу ці точки зазвичай виключають.

Якщо точки розташовані хаотично (рис. 2.5.3), то вважають, що між випадковими величинами, що розглядаються, немає кореляції.

Якщо точки групуються таким чином, що явно виражена деяка тенденція (рис. 2.5.1, 2.5.2), то говорять про позитивну (рис. 2.5.1) або негативну (рис. 2.5.2) кореляцію.

Якщо точки розташовані так, що можна припустити нелінійну залежність (рис. 2.5.4), то корисно здійснити розшарування (стратифікацію) даних, тобто поділ даних за якоюсь додатковою ознакою. (Наприклад, при дослідженні залежності рівномірності забарвлення від марки барвника, що застосовується, можна окремо врахувати ступінь завантаження резервуара для фарби)

Так як завжди може виявитися, що потрібно провести розшарування або здійснити угруповання зібраних даних будь-яким іншим способом, необхідно дуже ретельно підходити до вихідної інформації. Крім того, ставати зрозумілою вимога повноти написів, що пояснюють, на діаграмі розсіювання. Будь-які висновки, зроблені на підставі діаграми розсіювання, повинні супроводжуватись докладним перерахуванням умов збору даних та складання цієї діаграми.

У всіх випадках після візуального аналізу діаграми розсіювання необхідно обчислити коефіцієнт кореляції за формулами (6.6.1)-(6.6.4). Це дозволить підтвердити чи спростувати висунуту гіпотезу про наявність чи відсутність кореляційного зв'язку та встановити силу цього зв'язку.

Якщо діаграма розсіювання дозволяє припустити лінійну кореляцію між величинами, що вивчаються, то будуються лінії регресії, рівняння яких отримують за формулами (6.6.7) - (6.6.9).

Прямі регресії наносять зазвичай на діаграму розсіювання, що дозволяє наочно уявити тенденцію впливу однієї випадкової величини в іншу. При проведенні регресійного аналізу попередня побудова діаграми розсіювання є необхідним етапом, оскільки аналіз цієї діаграми дозволяє висунути гіпотезу про лінійну або нелінійну залежність, ступінь довіри до оброблюваних результатів вимірювань і навіть надійність методики проведення експериментів.

Наприклад, під час обробки чотирьох різних множин вихідних даних, наведених малюнку 2.5.5, формули (6.6.7) - (6.6.9) дають однакові прямі регресії. Однак за діаграмами розсіювання можна припустити, що у випадку: а) дійсно має місце лінійна кореляція; у випадку b) - нелінійна залежність, у випадку с) є одна крапка, що випала, у випадку d) спостерігається «дивне» угруповання точок. Звідси випливає, що у випадку с) треба повторити виміри або обґрунтувати можливість нехтування цим результатом; у разі d) необхідно отримати додаткові дані.

2.6 Контрольні карти

2.6.1 Види контрольних карт та сфера їх застосування

Оскільки будь-який процес відчуває велику кількість незначних випадкових впливів, то результати вимірювань, отримані під час нормального перебігу процесу, непостійні, тобто будь-який процес має певну мінливість (розкид).

Вважається, що процес перебуває у статистично керованому стані, якщо у ньому відсутні систематичні зрушення. У цьому стані можна передбачати перебіг процесу. Але як тільки на процес впливатимуть невипадкові (особливі) причини, він стане статистично некерованим, а результат процесу виявиться непередбачуваним. Якщо процес виведений зі статистично керованого стану, потрібно певне втручання, щоб зробити його знову статистично керованим.

Щоб судити про стан процесу, здійснюють відбір одиниць продукції та вимірюють контрольовані параметри. Сукупність відібраних об'єктів (значень, що спостерігаються) утворюють вибірку (див. розділ 6.1.).

Для порівняння інформації про поточний стан процесу, отриманої за вибіркою, з контрольними межами, що є межами власного розкиду, застосовують контрольні картки.

Контрольна карта - це графічне уявлення характеристики процесу, що складається з центральної лінії, контрольних кордонів та конкретних значень наявних статистичних даних, що дозволяє оцінити ступінь статистичної керованості процесу.

Існує багато різних типів контрольних карток залежно від природи даних, виду статистичної обробки даних та методів прийняття рішень.

Залежно від сфери застосування виділяють три основні види контрольних карток (рис. 2.6.1):

Контрольні карти Шухарта та аналогічні їм, що дозволяють оцінити, чи знаходиться процес у статистично керованому стані;

Приймальні контрольні картки, призначені визначення критерію приймання процесу;

Адаптивні контрольні карти, за допомогою яких регулюють процес за допомогою планування його тренду (тенденції зміни процесу з плином часу) та проведення запобіжного коригування на підставі прогнозів.

Дані для контрольних карток поділяють на "кількісні" та "якісні".

Кількісні дані - це результати спостережень, які проводяться за допомогою вимірювання та запису числових значень цього показника (при цьому використовується безперервна шкала значень).

Якісні (альтернативні) дані – це результати спостережень наявності (або відсутності) певної ознаки. Зазвичай підраховують, скільки елементів вибірки мають цю ознаку (наприклад, скільки деталей із контрольованої партії мають зовнішні дефекти). Іноді вважають кількість таких ознак, що є у вибірці певного обсягу (наприклад, кількість різних дефектів, зазначених в одному виробі).

Залежно від видів даних та методів їхньої статистичної обробки виділяють різні типи контрольних карт, основні з яких представлені на рис. 2.6.2.

При використанні кількісних даних застосовують контрольні картки двох видів:

Контрольні карти розташування, що характеризують міру розташування (центр) даних, що вивчаються, наприклад, вибіркове середнє х або медіану У;

Контрольні карти розкиду, що характеризують міру розкиду (розсіювання) окремих вибіркових даних у вибірці або підгрупі, наприклад, розмах R або стандартне вибіркове відхилення s.

Для аналізу та управління процесами, показники якості яких є безперервними величинами (довжина, вага, концентрація, температура тощо), зазвичай використовують парні контрольні карти, наприклад, карту для вибіркового середнього значення та карту розмаху: х - карту та R - картку.

Контрольні карти за якісною ознакою використовують, коли якість процесу оцінюють за кількістю невідповідностей.

Якщо враховується кількість невідповідних одиниць продукції вибірці, то застосовують пр-карту (для вибірок постійного обсягу) чи р-карту (для вибірок мінливого обсягу; у разі підраховують частку невідповідних одиниць); якщо враховується кількість невідповідностей у досліджуваному виробі чи процесі, зазвичай застосовують с-карту і и- карту.

Для вибору відповідної контрольної картки за альтернативною ознакою зручно використовувати таблицю 2.6.1.

Таблиця 2.6.1.

Число на одиницю вибірки (обсяг вибірки змінний*) Загальна кількість у вибірці (об'єм вибірки постійний)

Невідповідні одиниці Р "Р

Невідповідності та з

*0б'єми вибірок відрізняються не більше ніж у 1.6 разів

У контрольних картах для кількісних даних припускають, що має місце нормальний розподіл. Параметри цього розподілу використовують для встановлення контрольних кордонів, які зазвичай фіксуються на рівні ±3s від центральної лінії (тут х - вибіркове середнє даних, що вивчаються).

У контрольних картах для альтернативних даних використовують або біноміальний (пр-карти, р-карти), або пуассонівські розподіли (с-карти, м-карти).

2.6.2 Побудова контрольних карток

Для початкової побудови X-і R-карт обчислюють середні значення та розмах для кожної вибірки R

X=(x1+x2+….Xn)/n (2.6.1)

R=Xmax-Xmin (2.6.2) Потім обчислюють середній процес і середній розмах процесу

Xcp=(Xi+X2+...+Xk)/k (2.6.3)

Rcp=(R1+R2+...+Rk)/k (2.6.4)

де x, Ri - середнє і розмах i-ої (i = l, ..., k) вибірки. Ці величини визначають положення центральних ліній на Х карті і R - карті відповідно.

Положення верхніх (ВКГ) та нижніх (НКГ) контрольних кордонів для розмахів та середніх розраховується за формулами:

ВКГr=DrRср (2.6.5)

НКГr = D1, R, p; (2.6.6) BKГ x = x + A2, Rcp; (2.6.7)

НКГ x = x-A2Rср (2.6.8)

де -А2, D1, D4-константи, що залежать від обсягу вибірки та наведені в таблиці 2.6.2.

n 2 3 4 5 6 7 8 9 10

D4 3.27 2.57 2.28 2.11 2.00 1.92 1.86 1.82 1.78

Di * *. * * * 0.08 0.14 0.18 0.22

A2 1.88 1.02 0.73 0.58 0.48 0.42 0.37 0.34 0.31

Для обсягів вибірки менше 7 значення D„ а також значення НКГ є негативними. У разі не будується.

Після цього готують бланки контрольних карт, на яких зліва наносять вертикальну вісь зі шкалою можливих значень вимірюваного параметра (x або R) суцільну горизонтальну лінію, що відповідає значенню обчисленого за формулами 2.6.3 або 2.6.4 і горизонтальні контрольні межі, розраховані за формулами. .5 - 2.6.8). Якщо при розрахунку нижня контрольна межа виходить негативною, її зазвичай не розглядають, тобто не вказують на відповідну картку. На підготовлених таким чином бланках точками відзначають значення характеристики, що вивчається (показника якості), одержувані в результаті спостережень. Приклади контрольних карток наведено на рис. 2.6.3. Для зручності подальшого аналізу зазвичай х-карту і R-карту будують одну під іншою з однаковим масштабом горизонтальних осей.

Якщо показник якості представлений числом невідповідних виробів або відсотків (часток) невідповідностей застосовують пр-карти (для вибірок постійного обсягу) або р-карти (для вибірок мінливого обсягу). Ці карти засновані на біноміальному розподілі (див. розділ 6.3), який визначається лише одним параметром р, тому тут немає необхідності будувати пару карток. На бланку р - карти відзначають горизонтальну вісь з номерами підгруп, що розглядаються, і вертикальну вісь, де вказані можливі відсоткові значення невідповідностей, що зустрічаються в підгрупах (або кількість невідповідних виробів - для пр - карти). Обчислюють середнє значення частки невідповідностей р (або середнє число невідповідних виробів п ~р) і відзначають його суцільною горизонтальною лінією.

Якщо аналіз та управління процесом ведуться за невідповідностями, але при цьому величина р мала, то застосовують с - карти (карти числа невідповідностей) або u = с / п - карти (карти числа невідповідностей, що припадають на одиницю продукції).

2.6.3 Аналіз контрольних карток

Керований стан процесу - стан, коли процес стабільний, яке середнє і розкид не змінюються. Визначити, чи вийшов процес із цього стану, можна за контрольними картами на підставі наступних критеріїв:

1) Вихід контрольні межі. На карті є точки, що лежать поза контрольними межами (рис 2.6.5).

2) Серія. Декілька (7 і більше) точок поспіль виявляються по одну сторону від центральної лінії (число таких точок називається довжиною серії); або 10 з 11 послідовних точок знаходяться по одну сторону від центру (рис2.6.6).

3) Тренд. Крапки утворюють криву, що безперервно підвищується або знижується (рис.2.6.7).

4) Наближення до контрольних меж. Є точки, які наближаються до контрольних кордонів, причому 2 чи більше точок виявляються з відривом понад 2о від центральної лінії (рис.2.6.8).

5) Наближення до центральної лінії. Більшість точок виявляється усередині центральної третини смуги між контрольними межами (рис.2.6.9).

6) Періодичність Крива повторює структуру «підйом, то спад» з приблизно однаковими інтервалами часу (рис.2.6.10).

Порядок дослідження контрольних x-карти та R-карти задається наступним алгоритмом:

Якщо зустрілася одна із ситуацій, яка вказує на небезпеку виходу процесу з керованого стану (рис. 2.6.5 – 2.6.10), то необхідно

Перевірити координати "небезпечних точок";

Перевірити розрахунок меж;

Провести аналіз вимірювальної системи;

Перевірити достовірність даних вимірів;

і наостанок,

Почати пошук особливих причин(тобто будь-яких невипадкових впливів на процес) з метою їх усунення.

У ситуаціях 4-6 (рис. 2.6.8 – 2.6.10) буває корисно побудувати гістограму та провести розшарування процесу на підгрупи.

Приклад 2.6.1. Для контролю процесу обробки зовнішнього валу коробки передач (модель 2108) на одношпиндельному токарному верстаті (фірми FISCHER) замірявся контрольний параметр (лінійний розмір) оброблених деталей (див. рис. 4.1.1). За специфікацією процес повинен мати такі характеристики:

Лінійний розмір 274.5±0.1

Верхня межа допуску 274.6

Нижня межа допуску 274.4

За результатами вимірювань 80 виробів були побудовані х-карта та R-карта (рис. 2.6.11) з наступних

х = 274.464; ВКГх = 274.493; НКГх = 274.435;

R = 0.016; ВКГR = 0.05; HKFR негативна, тому на малюнку не вказано Х-карту

При аналізі R-карти видно, що на ділянці 3-9 спостерігається тренд, що знижує, на ділянці 11 -24 - підвищує тренд, багато точок, що вийшли за контрольні кордони (9-15,17,27,30,36), а точки 9 -10 знаходяться на межі поля допуску. Таким чином, по-перше, процес не є статистично стійким. У силу того, що межі поля допуску в даному випадку ширші за контрольні кордони, може скластися враження, що на ділянці 25 - 36 процес є стабільним, проте вихід за контрольні кордони свідчить про наявність особливих (невипадкових) впливів. Необхідно провести технологічний аналіз умов перебігу процесу обробки. Так, наприклад, знижуючий тренд може бути обумовлений утворенням наклепу на інструменті або впливом температурних деформацій в кінематиці та гідравліці верстата.

Наближення до центральної лінії на R - карті може свідчити про систематичне (невипадкове) торцеве биття базового центру, що дорівнює Rp=0.016.

Через війну аналізу контрольних карт можна дійти невтішного висновку у тому, що у разі технологічна точність не забезпечується, технологічний процес вимагає доопрацювання.

2.6.4 Використання контрольних карток для оцінки кореляції

Якщо потрібно встановити, чи кореляційна залежність між двома досліджуваними параметрами Х і Y, замість побудови діаграми розсіювання можна використовувати контрольні карти.

Значення параметрів Х і Y заміряють в одні й самі моменти часу і будують R-карту і X-карту. Центральна лінія цих картах відповідає значенню медіани, тобто. Кількість точок на обох картах однакова.

Потім на кожній з цих карт точки, що знаходяться вище центральної лінії, відзначають знаком "-", точки нижче центральної лінії - знаком "-", точки, що потрапили на центральну лінію, - знаком "О". Після цього складають таблицю знаків, що відповідають кожній парі (X, Y). До цієї таблиці додають ще один рядок, у якому ставиться «код» пари за такими правилами:

Х + - 0 + - 0 + -

Y + - 0 - + + - 0

Код (X,Y) + + + - - 0 0

В останньому рядку таблиці підраховують число "+" - М(+); число "-" - N(-); число «Про» - М(0), і навіть загальна кількість кодів - До.

Якщо min > kmin то кореляційної залежності немає, якщо min М – позитивна (пряма) кореляція, при Р< М - отрицательная (обратная) корреляция.

Таблиця 2.6.3.

11 37-39 12 40-41

2.7 Розшарування

При аналізі стану процесу за допомогою контрольних карт чи гістограм може виявитися, що потрібні будь-які керуючі дії з метою усунення причин статистичної нестійкості процесу. Однак, якщо на процес впливають кілька різних факторів, то корисно розглянути дію кожного з цих факторів окремо. Наприклад, якщо збирання виробу проводиться на кількох потокових лініях, то має сенс згрупувати дані щодо відповідних ліній і будувати контрольні карти (або гістограми) для кожної групи даних окремо.

Розшарування - це поділ та угруповання досліджуваних даних відповідно до різних факторів.

Зазвичай при дослідженні виробничої проблеми проводять угруповання даних за такими ознаками:

Окремо по кожному верстаті;

за різним типамвихідної сировини;

За денною та нічною зміною;

З різних бригад і т.д.

При проведенні розшарування по верстатах зазвичай з кожного верстата здійснюють вибірку (об'ємом не менше 30 деталей), за отриманими даними будують для кожного верстата гістограму, потім порівнюють ці гістограми і виявляють верстат, продукція якого має підвищену дефектність.

Приклад 2.7.1. Обробка валиків відбувається на двох шліфувальних верстатах. Технологічний процес має бути налаштований на діаметр 8.5±0.25 (мм). За результатами контрольних вимірів валиків після шліфування було отримано гістограму, зображену на рис. 2.7.1. Так як ця гістограма має явно виражений двопіковий тип (див. Розділ 2.4.2), було проведено розшарування, тобто розгляд даних по кожному верстату окремо. В результаті одержано гістограми, представлені на рис. 2.7.2, 2.7.3. Таким чином було виявлено, що на першому верстаті середнє значення та розкид менше, ніж на другому. З рис. 2.7.2 та 2.7.3 видно, що на другому верстаті необхідна переналагодження, оскільки процес вийшов за праву межу поля допуску. Тут потрібно провести налаштування на центр поля допуску та постаратися зменшити розкид. На другому верстаті результати задовільні, але при налаштуванні бажано змістити середнє ближче до центру поля допуску.

Розшарування застосовують і в оцінці якості процесу виробництва з допомогою контрольних карт. Так, у разі виготовлення продукції на багатошпиндельному верстаті виробляють розшарування по кожному шпинделю. Для кожного шпинделя будують х-карту або х-карту; за ними відстежують зміну налаштування в часі, виявляють правильність налаштування кожного шпинделя, будують криві розподіли та роблять висновок. також приклад 4.1.2.


3. ОЦІНКА ВІДТВОРЕННОСТІ ПРОЦЕСУ

3.1 Поняття відтворюваності процесу

Метою системи управління процесом є прийняття економічно вірних рішень, пов'язаних із виробленням оптимальних впливів. Це вимагає запровадження критеріїв, що дозволяють кількісно оцінити корисність заходів.

На рис. 3.1.а процес перебуває у статистично некерованому стані (послідовним тимчасовим відлікам відповідають розподілу випадкової величини з різними параметрами). Внаслідок організаційних заходів (усунення особливих причин) процес наведено у статистично керований стан (рис. 3.1.b). Проте продукція відповідає запитам споживача, оскільки частина виробів лежить поза поля допуску. Положення процесу, показане на рис. 3.1.с має задовольнити і виробника, і споживача: процес статистично керований і перебуває у полі допуску.

Кількісно охарактеризувати якість виробництва у загальному випадку можливо шляхом розрахунку за допомогою формул для обчислення ймовірності відсотка невідповідностей, що опинилися поза полем допуску.

Досить часто у виробництві спостерігаються процеси, статистичні властивості яких відповідають нормальному закону розподілу випадкових величин.

Однак на практиці для оцінки якості виробництва користуються поняттям відтворюваність. Так як 99,7% значень нормальної випадкової величини потрапляє в інтервал 6σ, частка невідповідних виробів тісно пов'язана з взаємним розташуванням цього інтервалу і поля допуску. Коефіцієнти, що характеризують це розташування, називаються індексами відтворюваності.

Відтворюваність процесу визначається як повний розмах властивої стабільному процесу мінливості, що оцінюється як інтервал, довжиною шість стандартних відхилень (6s). Кількісно прив'язка даного поняття до конкретних умов налаштування процесу (розкид і центрованість щодо поля допуску) оцінюється індексами відтворюваності Ср, Cpk.

При інтерпретації відтворюваності процесу за допомогою зазначених індексів приймемо такі припущення:

Індивідуальні виміри відповідають нормальному розподілу;

Процес статистично керований;

Конструкторською метою є центр поля допуску (тут розглядається варіант двостороннього симетричного допуску).

3.2 Розрахунок індексів відтворюваності

Визначимо структуру індексів та порядок їх обчислення.

Індекс відтворюваності Ср показує, як співвідносяться ширина поля допуску та мінливість статистично стійкого процесу, тобто, можна очікувати, що розкид контрольованого параметра виявиться в межах поля допуску.

Індекс Ср дорівнює відношенню ширини поля допуску до повного розмаху властивої стабільному процесу мінливості.

Введемо позначення:

НГД - нижня межа поля допуску,

ВГД - верхня межа поля допуску,

Д – ширина поля допуску.

Обчислення індексу відтворюваності Ср проводиться за такою формулою:

Ср = Д/6? Тут А = ВГД – НГД.

Ілюстрація введених позначень показано на рис. 3.3.

Випадок 1 (базовий). Показано на рис. 3.3.а. У фіксоване поле допуску укладається 6s процесу, тобто. Д = 6s (Ср = 1). При цьому налаштований центр поля допуску процес містить 0,27% невідповідностей.

Випадок 2 (рис. З.З.Ь). Нехай 6s,< Д. Тогда Ср >1 і кількість невідповідностей виявиться дуже малим.

Випадок 3 (рис. З.З.Ь). Нехай 6s > Д відповідно С< 1. Изменчивость процесса велика и число несоответствий превзойдет порог 0,27%.

а)З,=1; Ь)Ср<1,Ср>1

Отже, при зафіксованому полі допуску ефективність дій з управління процесом, спрямованих на зниження мінливості (зменшення s), ясно та зрозуміло характеризується зростанням індексу Порівн. Вважаються загальноприйнятими такі оцінки процесу за допомогою Ср:1)< 1 - неудовлетворительно,

2) 1,00 < Ср < 1,33 - удовлетворительно,

3) Ср > 1,33 - добре.

Індекс відтворюваності Срк характеризує налаштованість процесу на центр поля допуску.

Індекс дорівнює відношенню різниці між середнім процесом і найближчою межею поля допуску до половини властивої стабільному процесу мінливості.

Введемо позначення:

Dвгд=ВГД-(ХСР)СР

Dнгд=(Хср)СР-НГД

Dmin = min (Dвгд, Dнгд)

Zвгд=Dвгд/s

Zнгд = Dнгд / s

Zmin = min (Zвгд, Zнгд)

Тоді індекс відтворюваності Срк обчислюється за такою формулою:

Зауважимо, що для одностороннього поля допуску формули визначення індексу подібні, але при цьому Zmin дорівнює Zвгд або Zнгд, залежно від випадку розташування кордону поля допуску.

Проміжний розрахунок величин Z при обчисленні Срk зручний тим, що дозволяє при необхідності оперативно оцінити за таблицями стандартного нормального розподілу кількість одиниць продукції, які можуть опинитися поза допуском.

Найпростіший аналіз формули для обчислення Cpk показує, що при постійному стандартному відхиленні процесу якість процесу покращується зі зростанням індексу. Тим часом для управління процесом недостатня оцінка лише цього індексу.

На рис. 3.4 показані варіанти розташування керованого процесу у полі симетричного допуску.

Введемо до розгляду параметр , що пов'язує відхилення центру налаштування процесу від центру поля допуску і характеризує цим ефективність керування налаштуванням. Згідно зі схемою на рис. 3.4

Управління процесом має бути спрямоване на зменшення 5. При цьому кількість невідповідних виробів зменшиться, якість процесу покращиться, досягаючи оптимального значенняпри =0.

Індекси Ср і Cpк зручно розглянути спільно, враховуючи їх зв'язок за допомогою відношення Cpк=Cp-D/3s. З виразу видно:

Розмір Срk не перевищує величини Ср

При d == Про отримаємо Cpk = Ср

Область можливих значень Срk лежить нижче за пряму Срk = Ср. Звідси випливають прості міркування. При оптимальній налаштованості процесу на середину допуску кількість екземплярів невідповідної продукції пов'язується з величиною Ср і не може бути зменшена.

Таким чином, загальний алгоритм управління процесом при заданому полі допуску реалізується у вигляді ітераційного процесу, що складається з послідовно реалізованих кроків, що задовольняють напряму:

s → 0, Cpk -> Порівн.


4. ВИКОРИСТАННЯ СТАТИСТИЧНИХ МЕТОДІВ АНАЛІЗУ ВИРОБНИЧИХ ПРОЦЕСІВ

Розглянемо застосування викладених вище статистичних методів контролю якості виробничих процесів на декількох прикладах.

4.1 Контроль технологічної точності

Приклад 4.1.1. Здійснюється контроль технологічної точності верстата після середнього ремонту.

Тип верстата: одношпиндельний токарний верстат (фірми FICSHER).

Вигляд обробки деталі: обробка зовнішнього діаметра валу коробки (модель 2108).

Ескіз, що пояснює схему обробки: див. рис. 4.1.1.

Діаметр 25.3;

Допуск на опрацювання 0.1;

Верхня межа допуску 25.35;

Нижня межа допуску 25.25.

Первинне уявлення результатів: таблиця, що містить масив даних, отриманих в результаті вимірювання 70 оброблених деталей.

Результати вимірів:

25.297 25.300 25.279 25.282 25.294 25.300 25.301 25.304 25.282 25.292 25.292 25.298 25.294 25.300 25.284 25.290 25.285 25.290 25.284 25.290 25.286 25.292 25.288 25.296 25.290 25.300 25.298 25.303 25.292 25.300 25.289 25.300 25.282 25.288 25.290 25.294 25.287 25.292 25.283 25.288 25.290 25.294 25.280 25.288 25.279 25.282 25.300 25.301 25.274 25.285 25.290 25.280 25.292 25.294 25.300 25.290 25.296 25.280 25.283 25.278 25.288 25.280 25.288 25.284 25.296 25.280 25.290 25.288 25.302 25.284

n=70; max = 25.304; min = 25.274; R = 0.03.

Вторинне представлення результатів: інтервальна таблиця частот (у верхньому рядку вказані ліві межі інтервалів, у нижньому рядку - кількість деталей, діаметр яких потрапляє у цей інтервал):

25.272 25.276 25.280 25.284 25.288 25.292 25.296 25.300 25.304 25.308
0 2 11 9 9 15 9 12 3 0

Розрахунок статистичних характеристикпроцесу:

х = 25.2902; σ = 0.0073; поле розсіювання" 0.0469. Контрольна Х-карта: див. рис. 4.1.3: НКГ = 25.268; ВКГ = 25.312.

Розрахунок індексів відтворюваності: Ср = 2.13.

Поле розсіювання значень згідно з СТП 37.101.9504 3-96 приймається рівним w = k x s,

де х - результат вимірів. s – стандартне відхилення.

k - поправочний коефіцієнт залежить від обсягу вибірки причому його величина така, що поле розсіювання виявляється в більшості випадків дещо ширше, ніж 6s

Контрольна x-карта діаметра оброблених деталей, розташування гістограми показують, що процес статистично керований; це підтверджує і значення індексу відтворюваності Ср =2.13, що свідчить про практичну відсутність невідповідностей при обробці продукції;

Контрольна х-карта та розташування гістограми щодо поля допуску показують, що процес зміщений від центру поля допуску у напрямку нижньої межі допуску, отже, є можливість покращення процесу за допомогою зміщення налагодження на 0.0098 до середини поля допуску.

Висновки: можливий шлюб дорівнює 0%; технологічна точність забезпечується; потрібно зміщення налагодження, що дорівнює 0.0098.

Висновок: верстат в роботу затверджується за умови підналагодження. Примітка. Оскільки контрольна карта не показує критичної ситуації, можна обійтися без налагодження. Змістовий аналіз технологічного процесу показує, що в результаті зношування інструмента відбудеться необхідна корекція розміру.

Приклад 4.1.2. Здійснюється контроль технологічної точності верстата з метою аудиту.

Тип верстата: спеціальний круглошліфувальний однокам'яний верстат (фірми TOYOТA).

Вигляд обробки деталі: обробка зовнішніх діаметрів шатунних шийок колінвала (модель 2108).

Ескіз, що пояснює схему обробки: див. рис.4.1.4.

Особливості перебігу технологічного процесу з погляду особливих причин: стабільна ділянка роботи.

Конкретні числові характеристики технологічного процесу (за специфікацією):

Хід (шатунної шийки колінвала) 71 мм;

Допуск на обробку 0,15 мм;

Верхня межа допуску 71.05;

Нижня межа допуску 70.90.

Первинне уявлення результатів: таблиця, що містить загальний масив даних, отриманих в результаті 80 вимірів чотирьох шатунних шийок за параметром ходу.

Результати вимірів:

70.900 70.900 70.880 70.880 70.900 70.900 70.870 70.880 70.900 70.880

70.880 70.900 70.890 70.870 70.900 70.910 70.890 70.880 70.880 70.900

70.940 70.930 70.900 70.930 70.900 70.890 70.900 70.940 70.950 70.930

70.900 70.930 70.940 70.900 70.930 70.940 70.920 70.900 70.910 70.930

70.950 70.960 70.930 70.940 70.940 70.930 70.940 70.930 70.980 70.960

70.930 70.950 70.970 70.940 70.960 70.940 70.930 70.940 70.930 70.970

70.960 70.920 70.890 70.910 70.910 70.920 70.910 70.900 70.870 70.890

70.870 70.910 70.900 70.890 70.920 70.930 70.900 70.900 70.890 70.940

n=80; max = 70.98; min = 70.87; R=0.11

Вторинне представлення результатів: інтервальна таблиця частот (у верхньому рядку вказані ліві межі інтервалів, у нижньому рядку - кількість виміряних значень, що потрапляють у цей інтервал):

70.860 70.870 70.880 70.890 70.900 70.910 70.920
0 4 7 7 18 6 4
70.930 70.940 70.950 70.960 70.970 70.980 70.990
13 11 3 4 2 1 0

Розрахунок статистичних характеристик процесу :

до = 70.916; поле розсіювання 0.117; усунення налагодження 0.059. В даному випадку не розраховується, оскільки розглядаються відразу 4 параметри ходу чотирьох шатунних шийок.

Розрахунок індексів відтворюваності: Ср = 1.28; Ср, = 0.27. Контрольна х-картка: див. рис. 4.1.6: НКГ = 70.857; ВКГ = 70.975.

Аналіз експериментального та розрахункового матеріалу:

Контрольна карта, а також розташування гістограми показують, що процес не є статистично керованим, оскільки є вихід за верхню контрольну межу (49 точка). Крім того, має місце вихід процесу за межі поля допуску, що говорить про великої ймовірностішлюбу (22,5%). Двопіковий тип гістограми, а особливо вид контрольної карти вказують на необхідність розшарування даних, тобто розгляду ходу кожної шийки окремо.

Велика різниця в індексах відтворюваності процесу (Ср = 0.27< Ср = 1.28) свидетельствует о том, что процесс смещен относительно центра поля допуска (по расчетам на 0.059 мм в направлении нижнего предела допуска) и, следовательно, может быть улучшен.

Розшарування даних дало такі результати.

1-а шия:

Інтервальна таблиця

n=20; max = 70.95; min = 70.89; R = 0.06. х = 70.921; σ = 0.018; поле розсіювання 0.118; усунення налагодження 0.055;

3-я шия:

Інтервальна таблиця

n=20; max = 70.96; min = 70.87; R = 0.09.

х = 70.907; про = 0.022; поле розсіювання 0.139; зміщення налагодження 0.069 Ср = 1.075.

1. Порівняння статистичних показників для окремих шийок показує, що найгірші параметри має четверта шия (поле розсіювання 0.139; С-= 1.075). Це свідчить про необхідність проведення профілактичного ремонту лівого затискного патрона.

2. Так як центральна лінія на контрольній карті зміщена щодо заданого номінального значення ходу 71 мм, потрібно налагодження верстата, так, щоб центр налаштування збігався з номінальним (або серединою поля допуску).

3. З гістограм і контрольної карти видно, що в даний час найкраща налагодження за досліджуваним параметром на третій шийці, тому на ній потрібна найменша підналагодження.

4. Необхідно домогтися, щоб усі статистичні параметри всім чотирьох шийок були близькі за своїм значенням, тобто перебували однією лінії, а поля розсіювання відрізнялися незначно.

4.2. Використання діаграм Парето

Для найбільш успішного усунення невідповідностей готової продукції за результатами контролю будуються діаграми Парето. Наведемо приклад такої діаграми, що показує розподіл дефектів у цеху 46 за період із 01.01.95 no31.12.95.

Група деталей - Генератор

Код дефекту Найменування дефекту Кількість Сума

1 Не працює регулятор 852 42

2 Немає ланцюга обм. воз 291 56

3 Шум, магнітний шум 249 68

5 Втоплено клему 61. 155 75

12 Немає ланцюга центру ев. 107 79

8 Клініт ротор 88 84

6 Замикання діодів 52 86

4 Пробиті діоди 41 88

13 Замикає 11 89

7 Не закріплений шків 8 90

11 Інші дефекти 196 100

Усунення дефектів 1, 2, 3 дасть змогу суттєво підвищити якість даного вузла, отже, перш за все треба зосередити зусилля на виявленні причин цих невідповідностей та впровадженні заходів щодо їх подолання.


5. МАТЕМАТИЧНІ ОСНОВИ СТАТИСТИЧНИХ МЕТОДІВ

5.1 Випадкова величина. Загальні визначення

Випадкова величина - це величина, що вимірюється в досліджуваних експериментах, результати яких заздалегідь не відомі та залежать від випадкових причин.

Розрізняють два види випадкових величин:

Дискретна - випадкова величина, що приймає кінцеве або лічильне безліч значень х, ... , хn кожне з деякою ймовірністю pi, ..., р,. Дискретна випадкова величина визначається законом розподілу, що встановлює однозначну відповідність між можливими значеннями випадкової величини та їх ймовірностями;

Безперервна - випадкова величина, яка може набувати всіх значень з деякого кінцевого або нескінченного проміжку. Безперервна випадкова величина характеризується щільністю імовірності -Безперервною функцією, Такий що ймовірність попадання випадкової величини Х в інтервал (а; Ь) дорівнює

Приклад 6.1. На контроль надійшло кілька партій деталей. Контролюється розмір отвору. Діаметр отвору – це безперервна випадкова величина, кількість нестандартних деталей у кожній партії – дискретна випадкова величина.

Генеральною сукупністю називається весь набір однорідних об'єктів, що вивчаються щодо деякої якісної чи кількісної ознаки. Число всіх об'єктів N, що вивчаються, називається обсягом генеральної сукупності.

Вибірка - це частина генеральної сукупності, елементи якої піддаються статистичного обстеження. Число n елементів, що увійшли вибірку, називається обсягом вибірки.

Вибірки бувають безповторні, коли відібраний (і статистично обстежений) об'єкт у генеральну сукупність повертається, і повторні, коли відібраний елемент після обстеження повертається у генеральну сукупність.

Щоб результати, отримані щодо вибірки, можна було досить впевнено поширити на всю генеральну сукупність, вибірка має бути репрезентативної (представницької). При статистичному контролі досягається шляхом правильного вибору методу відбору досліджуваних об'єктів. Залежно від поставленої мети застосовують такі способи збору даних:

Простий випадковий відбір, коли вибір об'єктів здійснюється з усієї генеральної сукупності випадковим чином. Цей спосіб застосовується, наприклад, при вибірковому контролі партії деталей відповідність деякому стандарту.

Типовий відбір, коли об'єкти відбираються не з усієї генеральної сукупності, та якщо з кожної її " типової " частини. Наприклад, якщо однотипні деталі виготовляються на кількох верстатах, відбір проводиться з продукції кожного верстата окремо.

Механічний відбір, коли генеральну сукупність ділять стільки груп, скільки об'єктів має увійти вибірку, і з кожної групи обирають один об'єкт. При цьому слід уважно стежити, щоб не порушувалася репрезентативність вибірки. Наприклад, якщо відбирають кожен двадцятий валик, що обточується, причому відразу ж після виміру проводять заміну різця, то відібрані виявляться всі валики, обточені затупленими різцями. Якщо досліджуваний параметр залежить від гостроти різця, слід усунути збіг ритму відбору з ритмом заміни різця, наприклад, відбирати кожен десятий валик з двадцяти обточених.

Серійний відбір, коли об'єкти відбирають із генеральної сукупності за одним, а " серіями " , і обстежуються всі елементи кожної серії. Цей вид відбору застосовують тоді, коли обстежувана ознака коливається в різних серіях незначно, наприклад, якщо вироби виготовляються великою групою верстатів-автоматів, суцільному обстеженню піддають продукцію лише кількох верстатів. Для отримання більш достовірних результатів при цьому можна змінювати набори серій, тобто в різні дніобстежити різні групи верстатів.

При застосуванні статистичних методів управління якістю для побудови контрольних карток зазвичай використовують миттєві вибірки.

Миттєва вибірка - це вибірка, взята з технічних міркувань в такий спосіб, що у ній варіації (тобто зміни) можуть з'являтися лише як наслідок випадкових (загальних) причин. Можливі варіації між такими вибірками зазвичай визначаються невипадковими (спеціальними) причинами. У виробництві миттєва вибірка повинна бути сформована з даних, зібраних у короткий відрізок часу в однорідних умовах (матеріал, інструмент, навколишнє середовище, один і той же верстат або оператор тощо).

При збиранні даних застосовують різні форми реєстрації інформації. Найчастіше використовують варіаційні ряди, таблиці, і навіть контрольні листки.

Варіаційний ряд - запис результатів вимірів будь-якої випадкової величини як послідовності чисел. Таким чином, виходить одновимірний масив чисел, обробка якого зазвичай починається з його впорядкування та передбачає використання обчислювальної техніки. Ця форма реєстрації інформації найменш зручна для отримання оперативних результатів і найчастіше застосовується при використанні автоматичних датчиків, які безпосередньо з'єднані з ЕОМ.

Таблиця - подання даних у вигляді двовимірного масиву чисел, в якому елементи рядка або стовпця відображають стан досліджуваної ознаки за певних умов. Наприклад, нехай деякий параметр вимірюється чотири рази на день упродовж робочого тижня. Тоді результати зручно занести до таблиці

День тижня 9.00 11.00 14.00 16.00

понеділок

Контрольний листок – стандартний бланк, на якому заздалегідь надруковані контрольні параметри, щоб можна було легко та точно записати дані вимірювань. При правильно розробленому типі контрольного листа дані не тільки дуже просто фіксуються, але й автоматично впорядковуються для подальшої обробки та необхідних висновків. Для обробки результатів статистичних спостережень їх зручно оформляти як таблиці частот.

Статистичне розподіл - таблиця частот, у якій зазначені значення випадкової величини n, і відповідні частоти, що показують, скільки разів у вибірці зустрілося це значення випадкової величини.

Для отримання інтервальної таблиці частот (інтервального варіаційного ряду) весь діапазон виміряних значень випадкової величини Х ділять на k рівних інтервалів(а, tt,) та підраховують кількість (і) значень випадкової величини, що потрапили на відповідний інтервал. Крім того, в таблиці вказують також величину х - середину i"-oro інтервалу.


Інтервальна таблиця частот

Номер інтервалу / Інтервал (а,а,) Середина інтервалу

X, Частота п,

1 (а, а,) X1 N1

2 (а, а,) X2 N2

Тут n1, + n2 ... + ni = n – обсягу вибірки.

Первинна обробка результатів статистичних спостережень полягає у графічному поданні зібраної інформації. Зазвичай для цього будують гістограми.

Для побудови гістограми осі абсцис відзначають межі інтервалів - точки а, ..., ai-1 . Над кожним інтервалом будується прямокутник площею п (очевидно, якщо довжина кожного інтервалу h, то висота цього прямокутника n/h). Східчаста фігура, що вийшла, називається гістограмою частот. При цьому площа гістограми частот дорівнює обсягу вибірки п. Відрізок [а, аn,] назвемо основою гістограми.

Аналогічно будується гістограма відносних частот - ступінчаста фігура, що складається з прямокутників, площі яких дорівнюють n/h, тобто загальна площа гістограми відносних частот дорівнює 1.

6.2 Числові характеристики випадкових величин

Поведінка будь-якої випадкової величини визначається її розподілом, середнім значенням та розкидом щодо цього середнього значення.

Середні значення випадкової величини є її

Математичне очікування - середнє арифметичне всіх значень випадкової величини;

Мода – значення випадкової величини, яке зустрічається найчастіше, тобто має найбільшу частоту;

Медіана - таке значення випадкової величини, яке виявляється точно в середині впорядкованого варіаційного ряду, тобто якщо всі

зафіксовані значення випадкової величини розташувати у порядку зростання, то ліворуч і праворуч від медіани виявиться однакова кількість точок. При цьому, якщо кількість спостережень непарна (n=2k+l), то як медіана беруть середню точку хk-1, а якщо кількість спостережень парна (n=2k), то медіана - це центр середнього інтервалу (хi.хk-1 ,), тобто; X = (xi + Xk + 1) / 2.

Розкид випадкової величини щодо середніх значень характеризується дисперсією чи середнім квадратичним відхиленням (с.к.о.) – мірою розсіювання розподілу щодо математичного очікування. При цьому п.к.о. - це корінь квадратний із дисперсії. Найбільший розкид випадкової величини визначається розмахом вибірки, тобто величиною інтервалу, який потрапляють всі можливі значення випадкової величини.

У математичній статистиці говорять про статистичні оцінки параметрів розподілу. Статистичні оцінкибувають точкові (визначаються одним числом) та інтервальні (визначаються двома числами-кінцями інтервалу). Точкові оцінки дають уявлення про величину відповідного параметра, а інтервальні характеризують точність та достовірність оцінки.

Припустимо, що результаті спостережень отримані n значень випадкової величини Х: x1; , ..., xn. Для обчислення точкових оцінок параметрів розподілу користуються формулами:

середнє квадратичне відхилення s = v/5; (6.2.8)

Приклад 6.2. Нехай у результаті спостережень отримані такі значення випадкової величини X: (5; 6; 3; 6; 4; 5; 3; 7; 6; 7; 5; 6).


Впорядкований варіаційний ряд: 3, 3,4, 5, 5, 5, 6, 6, 6, 6, 7, 7.

Таблиця частот статистичний розподіл:

Обчислимо всі числові показники випадкової величини хmin = 3; xmax = 7; медіана 5-x = (X6 + X7) / 2 = (5 + 6) / 2 = 5,5;

мода Х = 6, оскільки це значення зустрічалося найчастіше (n = 4);

вибіркове середнє х = (2 3+1 4+3 5+4 6+2 7)/12 = 5,25;

розмах R = 7 - 3 = 4;

вибіркова дисперсія. S = D = (1/11) (2 (3 - 5,25) 2+ 1 (4-5,25) 2+ + 3 (5 - 5.25) 2 + 4 (6 - 5,25) 2 +2 (7 - 5,25) 2) = 15/11 = 1,84;

середнє квадратичне відхиленням s = 1,36.

Зауваження. Сучасна обчислювальна техніка, використовуючи спеціальні пакети прикладних програм, дозволяє отримати значення вибіркової середньої та дисперсії відразу ж після введення даних вибірки (значень досліджуваної випадкової величини, що спостерігаються)

6.3 Типові теоретичні розподіли випадкових величин

Характер поведінки випадкової величини визначається її розподілом. Знаючи тип розподілу випадкової величини та його числові характеристики, можна прогнозувати, які значення прийматиме випадкова величина в результаті спостережень, тобто можна робити певні висновки про всю генеральну сукупність.

Найчастіше зустрічається нормальний (гауссівський) розподіл. Це з тим, що розкид характеристик якості обумовлений сумою великої кількості незалежних помилок, викликаних різними чинниками, а відповідно до центральної граничної теоремі Ляпунова у разі випадкова величина має розподіл, близьке до нормального.

Нормальний розподіл визначає безперервну випадкову величину, тому його задають густиною ймовірності/С.^. Щільність ймовірності нормального розподілу має вигляд:

Параметр і визначає точку максимуму, через яку проходить вісь симетрії графіка функції, і вказує середнє арифметичне значення випадкової величини, показує розкид розподілу щодо середнього значення, тобто визначає "ширину" дзвона (відстань від осі симетрії до точки перегину графіка

Для зручності підрахунку ймовірностей будь-який нормальний розподіл з параметрами а та σ перетворять до стандартного (нормованого) нормального розподілу, параметри якого а = 0, s = 1, тобто щільність

Значення функції f(х) можна знайти в довідкових таблицяхабо отримати за допомогою готових комп'ютерних програм.

Іншим розподілом безперервної випадкової величини, що часто зустрічається в техніці, є закон Релея. Він описує розподіл похибок форми і розташування поверхонь (биття, ексцентриситет, непаралельність, неперпендикулярність і т.п.), коли ці похибки визначаються радіусом кругового розсіювання на площині.

Якщо на площині задана система координат Оху, то точка з координатами (х, у; відстоює від початку координат на відстань координат х і у – нормально розподілена випадкова величина, то г – випадкова величина, що має розподіл Релея. Щільність ймовірності цього розподілу:

Для дискретних випадкових величин найпоширенішим є біномний розподіл. Біноміальний закон розподілу визначає ймовірність того, що у вибірці обсягу п деяка ознака зустрінеться рівно k разів. Точніше, нехай проводиться п незалежних випробувань("дослідів"), у кожному з яких ознака може проявитися ("успіх досвіду") з ймовірністю р. Розглянемо випадкову величину Х - число "успіхів" у цій серії випробувань. Це дискретна випадкова величина, що приймає значення Про, 1,... , п, причому ймовірність того, що Х прийме значення, що дорівнює k, тобто що рівно в k випробуваннях буде зафіксований досліджуваний ознака, обчислюється за формулою

Формула (6.3.13) називається формулою Бернуллі, а закон розподілу випадкової величини X, що задається цією формулою, називається біномним, Параметрами біномного розподілу є число дослідів n і ймовірність "успіху" р. Але оскільки нас цікавлять середнє значення та розкид випадкової величини щодо свого середнього значення, то зазначимо, що для біномного розподілу математичне очікування т → up . а дисперсія →прц.

Біноміальний закон визначає у найзагальнішій формі здійснення ознаки у повторній вибірці (зокрема, поява невідповідностей).

Наприклад, нехай партії з N деталей рівно М мають зовнішній дефект (нерівномірність забарвлення). При контролі з партії витягується деталь, фіксується наявність чи відсутність дефекту, після чого деталь перекручується назад. Якщо ці дії виконані n разів, то ймовірність того, що при цьому k разів буде зареєстрований дефект, обчислюється за формулою:

Якщо витягнута деталь не повертається назад (або всі п деталей виймаються одночасно), то ймовірність того, що серед вийнятих п деталей виявиться рівно k з дефектом дорівнює

І тут випадкова величина Х - кількість невідповідних деталей у вибірці задається гипергеометрическим законом розподілу. Цей закон визначає здійснення ознаки у безповторній вибірці.

Коли N дуже велике в порівнянні з п (тобто обсяг генеральної сукупності принаймні на два порядки більше обсягу вибірки), то несуттєво, яка проводиться вибірка - безповторна або повторна, тобто в цьому випадку замість формули (6.3.16) можна використовувати формулу (6.3.15).

При великих значеннях формула Бернуллі (6.3.13) замінюється формулою

яка фактично збігається з формулою (6.3.1), тобто нормальним законом розподілу, параметри якого а = пр. s = npq.

Для розподілу Пуассона математичне очікування дорівнює l, Дисперсія також дорівнює l.

На малюнку 6.4 представлені два біноміальні розподіли P^(k). В одного п = 30; р = 0,3 - воно близьке до нормального розподілу з математичним очікуваннямт, = пр = - 9. У іншого п = 30; р = 0,05 - воно близьке до розподілу Пуассона з математичним очікуванням mk = пр = 1,5.


1. Статистичні методи підвищення якості (Пер. з англ. / За ред. С. Куме).-М.: Фінанси та статистика, 1990.-304с.

2. Статистичне управління процесами (SPC). Посібник. Пров. з англ. (З додатком.). - Н.Новгород: АТ НДЦ КД, СМЦ «Пріоритет», 1997р.

3. Статистичний контроль якості продукції з урахуванням принципу розподілу пріоритетів/В.А. Лапідус, М.І. Розно, А.В. Глазунов та ін.-ВЙ.: Фінанси та статистика, 1991.-224с.

4. Міттаг Х.-І.. Рінне X. Статистичні методи забезпечення якості М: Машинобудування, 1995.-616с.

5. ГОСТ Р 50779.0-95 Статистичні методи. Основні положення.

6. ГОСТ Р 50779.30-95 Статистичні методи. Приймальний контроль якості. Загальні вимоги.

7. ГОСТ Р 50779.50-95 Статистичні методи. Приймальний контроль якості за кількісною ознакою. Загальні вимоги.

8. ГОСТ Р 50779.51-95 Статистичні методи. Безперервний приймальний контроль якості за альтернативною ознакою.

9. ГОСТ Р 50779.52-95 Статистичні методи. Приймальний контроль якості за альтернативною ознакою.

10. ІСО 9000-ІСО 9004. ІСО 8402. Управління якістю продукції (пер. з англ.).-М.: Вид-во стандартів, 1988.-96с.

11. ISO 9000. Міжнародні стандарти.

Діяльність людей у ​​більшості випадків передбачає роботу з даними, а вона у свою чергу може мати на увазі не тільки оперування ними, а й їх вивчення, обробку та аналіз. Наприклад, коли потрібно ущільнити інформацію, знайти якісь взаємозв'язки чи визначити структури. І саме для аналітики в цьому випадку дуже зручно користуватися не тільки, але й застосовувати статистичні методи.

Особливістю методів статистичного аналізу є їхня комплексність, обумовлена ​​різноманіттям форм статистичних закономірностей, а також складністю процесу статистичних досліджень. Однак ми хочемо поговорити саме про такі методи, які може застосовувати кожен, причому робити це ефективно та із задоволенням.

Статистичне дослідження може проводитись за допомогою таких методик:

  • Статистичне спостереження;
  • Зведення та угруповання матеріалів статистичного спостереження;
  • Абсолютні та відносні статистичні величини;
  • Варіаційні лави;
  • Вибірка;
  • Кореляційний та регресійний аналіз;
  • Ряди динаміки.

Статистичне спостереження

Статистичне спостереження є планомірним, організованим і найчастіше систематичним збором інформації, спрямованим, переважно, на явища соціального життя. Реалізується даний методчерез реєстрацію попередньо визначених найбільш яскравих ознак, мета якої полягає в подальшому отриманні характеристик явищ, що вивчаються.

Статистичне спостереження має виконуватися з урахуванням важливих вимог:

  • Воно має повністю охоплювати явища, що вивчаються;
  • Отримані дані повинні бути точними та достовірними;
  • Отримані дані мають бути одноманітними і легкопорівняними.

Також статистичне спостереження може мати дві форми:

  • Звітність – це така форма статистичного спостереження, де інформація надходить у конкретні статистичні підрозділи організацій, установ чи підприємств. У цьому випадку дані вносяться до спеціальних звітів.
  • Спеціально організоване спостереження – спостереження, яке організується з певною метою, щоб отримати відомості, яких немає у звітах, або для уточнення та встановлення достовірності інформації звітів. До цієї форми належать опитування (наприклад, опитування думок людей), перепис населення тощо.

Крім того, статистичне спостереження може бути категоризовано на основі двох ознак: або на основі характеру реєстрації даних або на основі охоплення одиниць спостереження. До першої категорії відносяться опитування, документування та пряме спостереження, а до другої – спостереження суцільне та несплошне, тобто. вибіркове.

Для отримання даних за допомогою статистичного спостереження можна застосовувати такі способи як анкетування, кореспондентська діяльність, самочислення (коли спостережувані, наприклад, самі заповнюють відповідні документи), експедиції та складання звітів.

Зведення та угруповання матеріалів статистичного спостереження

Говорячи про другий метод, насамперед слід сказати про зведення. Зведення є процесом обробки певних одиничних фактів, які утворюють загальну сукупність даних, зібраних при спостереженні. Якщо зведення проводиться грамотно, дуже багато одиничних даних про окремих об'єктах спостереження може перетворитися на цілий комплекс статистичних таблиць і результатів. Також таке дослідження сприяє визначенню загальних риста закономірностей досліджуваних явищ.

З урахуванням показників точності та глибини вивчення можна виділити просте та складне зведення, але будь-яка з них повинна ґрунтуватися на конкретних етапах:

  • Вибирається групувальна ознака;
  • Визначається порядок формування груп;
  • Розробляється система показників, що дозволяють охарактеризувати групу та об'єкт чи явище загалом;
  • Розробляються макети таблиць, де буде представлено результати зведення.

Існують і різні форми зведення:

  • Централізоване зведення, що вимагає передачі отриманого первинного матеріалу до вищого центру для подальшої обробки;
  • Децентралізоване зведення, де вивчення даних відбувається на декількох щаблях по висхідній.

Виконуватися зведення може за допомогою спеціалізованого обладнання, наприклад, з використанням комп'ютерного ПЗ або вручну.

Що ж до угруповання, цей процес відрізняється поділом досліджуваних даних на групи за ознаками. Особливості поставлених статистичним аналізом завдань впливають на те, яким саме буде угруповання: типологічним, структурним чи аналітичним. Саме тому для зведення та угруповання або вдаються до послуг вузькопрофільних фахівців, або застосовують .

Абсолютні та відносні статистичні величини

Абсолютні величини вважаються найпершою формою подання статистичних даних. З її допомогою вдається надати явищам розмірні характеристики, наприклад, за часом, за довжиною, за обсягом, площею, масою і т.д.

Якщо потрібно дізнатися про індивідуальні абсолютні статистичні величини, можна вдатися до вимірів, оцінки, підрахунку або зважування. А якщо потрібно отримати підсумкові об'ємні показники, слід використати зведення та угруповання. Потрібно пам'ятати, що абсолютні статистичні величини відрізняються наявністю одиниць виміру. До таких одиниць відносять вартісні, трудові та натуральні.

А відносні величини виражають кількісні співвідношення щодо явищ соціального життя. Щоб їх отримати, одні величини завжди поділяються на інші. Показник, з яким порівнюють (це знаменник), називають основою порівняння, а показник якої порівнюють (це чисельник), називають звітною величиною.

Відносні величини можуть бути різними, що залежить від їхньої змістовної частини. Наприклад, є величини порівняння, величини рівня розвитку, величини інтенсивності конкретного процесу, величини координації, структури, динаміки і т.д. і т.п.

Щоб вивчити якусь сукупність за ознаками, що диференціюються, в статистичному аналізі застосовуються середні величини - узагальнюючі якісні характеристики сукупності однорідних явищ за якою-небудь диференціюється ознакою.

Вкрай важливою властивістю середніх величин є те, що вони говорять про значення конкретних ознак у всьому їхньому комплексі єдиним числом. Незважаючи на те, що в окремих одиниць може спостерігатися кількісна різниця, середні величини виражають загальні значення, властиві всім одиницям досліджуваного комплексу Виходить, що за допомогою характеристики чогось одного можна отримати характеристику цілого.

Слід пам'ятати, що з найважливіших умов застосування середніх величин, якщо проводиться статистичний аналіз соціальних явищ, вважається однорідність їхнього комплексу, котрій і треба дізнатися середню величину. А від того, як саме будуть представлені початкові дані для обчислення середньої величини, залежатиме і формула її визначення.

Варіаційні ряди

У деяких випадках даних про середні показники тих чи інших величин, що вивчаються, може бути недостатньо, щоб провести обробку, оцінку і глибокий аналіз якогось явища або процесу. Тоді до уваги слід брати варіацію або розкид показників окремих одиниць, який теж є важливою характеристикою досліджуваної сукупності.

На індивідуальні значення величин можуть впливати багато чинників, а самі досліджувані явища чи процеси може бути дуже різноманітні, тобто. мати варіацію (це різноманіття і є варіаційні ряди), причини якої слід шукати по суті того, що вивчається.

Вищеназвані абсолютні величини перебувають у безпосередньої залежності від одиниць виміру ознак, отже, роблять процес вивчення, оцінки та порівняння двох і більше варіаційних рядів складнішим. А відносні показники потрібно обчислювати як співвідношення абсолютних та середніх показників.

Вибірка

Сенс вибіркового методу (чи простіше – вибірки) у тому, що з властивостям однієї частини визначаються чисельні характеристики цілого (це називається генеральної сукупністю). Основний вибірковий метод є внутрішній зв'язок, що об'єднує частини і ціле, одиничне та загальне.

Метод вибірки відрізняється низкою істотних переваг перед іншими, т.к. завдяки зменшенню кількості спостережень дозволяє скоротити обсяги роботи, кошти та зусилля, що витрачаються, а також успішно отримувати дані про такі процеси і явища, де або недоцільно, або просто неможливо досліджувати їх повністю.

Відповідність характеристик вибірки характеристикам досліджуваного явища чи процесу залежатиме від комплексу умов, й у першу чергу від цього, як взагалі реалізовуватиметься вибірковий метод практично. Це може бути як планомірний відбір, що йде за підготовленою схемою, так і непланомірний, коли вибірка проводиться з генеральної сукупності.

Але у всіх випадках вибірковий метод має бути типовим та відповідати критеріям об'єктивності. Ці вимоги необхідно виконувати завжди, т.к. саме від них залежатиме відповідність характеристик методу та характеристик того, що піддається статистичному аналізу.

Таким чином, перед обробкою вибіркового матеріалу необхідно провести його ретельну перевірку, позбавившись цим всього непотрібного і другорядного. Водночас, складаючи вибірку, обов'язково потрібно обходити стороною будь-яку самодіяльність. Це означає, що в жодному разі не слід робити вибірку тільки з варіантів, що здаються типовими, а всі інші – відкидати.

Ефективна та якісна вибірка має складатися об'єктивно, тобто. робити її потрібно так, щоб були виключені будь-які суб'єктивні впливи та упереджені спонукання. І щоб ця умова була дотримана належним чином, потрібно вдатися до принципу рандомізації або, простіше кажучи, до принципу випадкового відбору варіантів із усієї їхньої генеральної сукупності.

Поданий принцип служить основою теорії вибіркового методу, і слідувати йому потрібно завжди, коли потрібно створити ефективну вибіркову сукупність, причому випадки планомірного відбору винятком не є.

Кореляційний та регресійний аналіз

Кореляційний аналіз та регресійний аналіз – це два високоефективні методи, що дозволяють проводити аналіз великих обсягів даних для вивчення можливого взаємозв'язку двох або більшої кількостіпоказників.

У разі кореляційного аналізу завданнями є:

  • Виміряти тісноту наявного зв'язку ознак, що диференціюються;
  • Визначити невідомі причинні зв'язки;
  • Оцінити фактори, які найбільше впливають на остаточну ознаку.

А у випадку з регресійним аналізом завдання такі:

  • Визначити форму зв'язку;
  • встановити ступінь впливу незалежних показників на залежний;
  • Визначити розрахункові значення залежного показника.

Щоб вирішити всі вищезгадані завдання, практично завжди потрібно застосовувати кореляційний і регресійний аналіз в комплексі.

Ряди динаміки

За допомогою цього методу статистичного аналізу дуже зручно визначати інтенсивність або швидкість, з якою розвиваються явища, знаходити тенденцію їх розвитку, виділяти коливання, порівнювати динаміку розвитку, знаходити взаємозв'язок явищ, що розвиваються в часі.

Ряд динаміки – це ряд, у якому у часі послідовно розташовані статистичні показники, зміни яких характеризують процес розвитку досліджуваного об'єкта чи явища.

Ряд динаміки включає два компоненти:

  • Період або час, пов'язаний з наявними даними;
  • Рівень чи статистичний показник.

У сукупності ці компоненти є двома членами низки динаміки, де перший член (тимчасовий період) позначається буквою «t», а другий (рівень) – буквою «y».

Виходячи з тривалості часових проміжків, з якими взаємопов'язані рівні, ряди динаміки можуть бути моментними та інтервальними. Інтервальні ряди дозволяють складати рівні для отримання загальної величини періодів, що йдуть один за одним, а в моментних такої можливості немає, але цього там і не потрібно.

Ряди динаміки також існують з рівними та різними інтервалами. Суть інтервалів у моментних і інтервальних рядах завжди різна. У першому випадку інтервалом є часовий проміжок між датами, до яких прив'язані дані для аналізу (зручно використовувати такий ряд, наприклад, визначення кількості дій за місяць, рік і т.д.). А в другому випадку – тимчасовий проміжок, до якого прив'язана сукупність узагальнених даних (такий ряд можна використовувати для визначення якості тих самих дій за місяць, рік тощо). Інтервали можуть бути рівними та різними, незалежно від типу ряду.

Звичайно, щоб навчитися грамотно застосовувати кожен із методів статистичного аналізу, недостатньо просто знати про них, адже, по суті, статистика – це ціла наука, яка потребує ще й певних навичок та умінь. Але щоб вона давалася простіше, можна і потрібно тренувати своє мислення.

В іншому ж дослідження, оцінка, обробка та аналіз інформації – дуже цікаві процеси. І навіть у тих випадках, коли це не призводить до якогось конкретного результату, за час дослідження можна дізнатися багато цікавих речей. Статистичний аналіз знайшов своє застосування у величезній кількості сфер діяльності людини, а ви можете використовувати його у навчанні, роботі, бізнесі та інших галузях, включаючи розвиток дітей та самоосвіту.