Προσέγγιση πειραματικών δεδομένων. Μέθοδος ελάχιστου τετραγώνου

Η μέθοδος των ελαχίστων τετραγώνων (OLS) σάς επιτρέπει να υπολογίζετε διάφορες ποσότητες χρησιμοποιώντας τα αποτελέσματα πολλών μετρήσεων που περιέχουν τυχαία σφάλματα.

Χαρακτηριστικό OLS

Η κύρια ιδέα αυτής της μεθόδου είναι ότι το άθροισμα των τετραγώνων των σφαλμάτων θεωρείται ως κριτήριο για την ακρίβεια επίλυσης ενός προβλήματος, το οποίο επιδιώκεται να ελαχιστοποιηθεί. Κατά τη χρήση αυτής της μεθόδου, μπορούν να εφαρμοστούν τόσο αριθμητικές όσο και αναλυτικές προσεγγίσεις.

Συγκεκριμένα, ως αριθμητική υλοποίηση, η μέθοδος των ελαχίστων τετραγώνων συνεπάγεται τη διενέργεια όσο το δυνατόν περισσότερων μετρήσεων μιας άγνωστης τυχαίας μεταβλητής. Επιπλέον, όσο περισσότεροι υπολογισμοί, τόσο πιο ακριβής θα είναι η λύση. Σε αυτό το σύνολο υπολογισμών (αρχικά δεδομένα), προκύπτει ένα άλλο σύνολο προτεινόμενων λύσεων, από το οποίο στη συνέχεια επιλέγεται η καλύτερη. Εάν το σύνολο των λύσεων είναι παραμετροποιημένο, τότε η μέθοδος των ελαχίστων τετραγώνων θα μειωθεί στην εύρεση της βέλτιστης τιμής των παραμέτρων.

Ως αναλυτική προσέγγιση για την υλοποίηση του OLS σε ένα σύνολο αρχικών δεδομένων (μετρήσεις) και ένα υποθετικό σύνολο λύσεων, προσδιορίζεται ένα συγκεκριμένο (λειτουργικό), το οποίο μπορεί να εκφραστεί με έναν τύπο που λαμβάνεται ως κάποια υπόθεση που απαιτεί επιβεβαίωση. Σε αυτήν την περίπτωση, η μέθοδος των ελάχιστων τετραγώνων μειώνεται στην εύρεση του ελάχιστου αυτής της συνάρτησης στο σύνολο των τετραγώνων των αρχικών σφαλμάτων δεδομένων.

Σημειώστε ότι όχι τα ίδια τα σφάλματα, αλλά τα τετράγωνα των σφαλμάτων. Γιατί; Το γεγονός είναι ότι συχνά οι αποκλίσεις των μετρήσεων από την ακριβή τιμή είναι θετικές και αρνητικές. Κατά τον προσδιορισμό του μέσου όρου, η απλή άθροιση μπορεί να οδηγήσει σε εσφαλμένο συμπέρασμα σχετικά με την ποιότητα της εκτίμησης, καθώς η αμοιβαία ακύρωση θετικών και αρνητικών τιμών θα μειώσει τη δειγματοληπτική ισχύ του συνόλου των διαστάσεων. Και, κατά συνέπεια, η ακρίβεια της αξιολόγησης.

Για να μην συμβεί αυτό, αθροίζονται τα τετράγωνα των αποκλίσεων. Ακόμη περισσότερο, για να ευθυγραμμιστεί η διάσταση της μετρούμενης τιμής και η τελική εκτίμηση, εξάγεται το άθροισμα των τετραγώνων των σφαλμάτων

Μερικές εφαρμογές MNC

Το OLS χρησιμοποιείται ευρέως σε διάφορους τομείς. Για παράδειγμα, στη θεωρία πιθανοτήτων και στη μαθηματική στατιστική, η μέθοδος χρησιμοποιείται για τον προσδιορισμό ενός τέτοιου χαρακτηριστικού μιας τυχαίας μεταβλητής όπως η τυπική απόκλιση, η οποία καθορίζει το πλάτος του εύρους τιμών της τυχαίας μεταβλητής.

Έχει πολλές εφαρμογές, αφού επιτρέπει μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης από άλλες απλούστερες. Το OLS μπορεί να είναι εξαιρετικά χρήσιμο στην επεξεργασία των παρατηρήσεων και χρησιμοποιείται ενεργά για την εκτίμηση ορισμένων ποσοτήτων από τα αποτελέσματα μετρήσεων άλλων που περιέχουν τυχαία σφάλματα. Αυτό το άρθρο θα σας δείξει πώς να εφαρμόσετε υπολογισμούς ελάχιστων τετραγώνων στο Excel.

Δήλωση του προβλήματος χρησιμοποιώντας ένα συγκεκριμένο παράδειγμα

Ας υποθέσουμε ότι υπάρχουν δύο δείκτες X και Y. Και το Y εξαρτάται από το X. Δεδομένου ότι το OLS μας ενδιαφέρει από την άποψη της ανάλυσης παλινδρόμησης (στο Excel, οι μέθοδοί του υλοποιούνται χρησιμοποιώντας ενσωματωμένες συναρτήσεις), τότε θα πρέπει να πάτε αμέσως για να εξετάσει ένα συγκεκριμένο πρόβλημα.

Έτσι, έστω Χ είναι ο χώρος λιανικής ενός παντοπωλείου, μετρημένος σε τετραγωνικά μέτρα, και Y - ο ετήσιος κύκλος εργασιών, μετρημένος σε εκατομμύρια ρούβλια.

Απαιτείται να γίνει πρόβλεψη για το τι τζίρο (Υ) θα έχει το κατάστημα αν έχει τον έναν ή τον άλλο χώρο λιανικής. Προφανώς, η συνάρτηση Y = f (X) αυξάνεται, αφού η υπεραγορά πουλάει περισσότερα αγαθά από το περίπτερο.

Λίγα λόγια για την ορθότητα των αρχικών δεδομένων που χρησιμοποιούνται για την πρόβλεψη

Ας υποθέσουμε ότι έχουμε έναν πίνακα κατασκευασμένο από δεδομένα για n καταστήματα.

Σύμφωνα με τις μαθηματικές στατιστικές, τα αποτελέσματα θα είναι λίγο πολύ σωστά εάν εξεταστούν τα δεδομένα για τουλάχιστον 5-6 αντικείμενα. Επιπλέον, δεν μπορείτε να χρησιμοποιήσετε "μη φυσιολογικά" αποτελέσματα. Συγκεκριμένα, μια ελίτ μικρή μπουτίκ μπορεί να έχει τζίρο πολλαπλάσιο από τον τζίρο των μεγάλων καταστημάτων λιανικής της κατηγορίας των «masmarket».

Η ουσία της μεθόδου

Τα δεδομένα του πίνακα μπορούν να εμφανιστούν στο καρτεσιανό επίπεδο ως σημεία M 1 (x 1, y 1),… M n (x n, y n). Τώρα η λύση του προβλήματος θα περιοριστεί στην επιλογή της προσεγγιστικής συνάρτησης y = f (x), η οποία έχει μια γραφική παράσταση που περνά όσο το δυνατόν πιο κοντά στα σημεία M 1, M 2, .. M n.

Φυσικά, μπορείτε να χρησιμοποιήσετε ένα πολυώνυμο υψηλού βαθμού, αλλά μια τέτοια επιλογή δεν είναι μόνο δύσκολη στην εφαρμογή, αλλά και απλά λανθασμένη, καθώς δεν θα αντικατοπτρίζει την κύρια τάση που πρέπει να εντοπιστεί. Η πιο λογική λύση είναι να βρεθεί η ευθεία γραμμή y = ax + b, η οποία προσεγγίζει καλύτερα τα πειραματικά δεδομένα, ή μάλλον, τους συντελεστές - a και b.

Αξιολόγηση ακρίβειας

Για οποιαδήποτε προσέγγιση, η αξιολόγηση της ακρίβειάς της έχει ιδιαίτερη σημασία. Ας συμβολίσουμε με e i τη διαφορά (απόκλιση) μεταξύ των λειτουργικών και πειραματικών τιμών για το σημείο x i, δηλαδή e i = y i - f (x i).

Προφανώς, για να εκτιμηθεί η ακρίβεια της προσέγγισης, μπορεί να χρησιμοποιηθεί το άθροισμα των αποκλίσεων, δηλαδή, κατά την επιλογή μιας ευθείας γραμμής για μια κατά προσέγγιση αναπαράσταση της εξάρτησης του X από το Y, θα πρέπει να προτιμάται αυτή με τη μικρότερη τιμή του άθροισμα ei σε όλα τα υπό εξέταση σημεία. Ωστόσο, δεν είναι όλα τόσο απλά, αφού μαζί με τις θετικές αποκλίσεις, πρακτικά θα υπάρχουν και αρνητικές αποκλίσεις.

Το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας τους συντελεστές των αποκλίσεων ή τα τετράγωνά τους. Η τελευταία μέθοδος είναι η πιο ευρέως χρησιμοποιούμενη. Χρησιμοποιείται σε πολλούς τομείς, συμπεριλαμβανομένης της ανάλυσης παλινδρόμησης (το Excel υλοποιεί δύο ενσωματωμένες λειτουργίες) και έχει αποδείξει εδώ και καιρό την αξία του.

Μέθοδος ελάχιστου τετραγώνου

Στο Excel, όπως γνωρίζετε, υπάρχει μια ενσωματωμένη λειτουργία αυτόματης άθροισης που σας επιτρέπει να υπολογίσετε τις τιμές όλων των τιμών που βρίσκονται στην επιλεγμένη περιοχή. Έτσι, τίποτα δεν μας εμποδίζει να υπολογίσουμε την τιμή της παράστασης (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Στη μαθηματική σημειογραφία, μοιάζει με:

Δεδομένου ότι αρχικά ελήφθη η απόφαση να γίνει προσέγγιση χρησιμοποιώντας μια ευθεία γραμμή, έχουμε:

Έτσι, το πρόβλημα της εύρεσης της ευθείας γραμμής που περιγράφει καλύτερα τη συγκεκριμένη εξάρτηση των μεγεθών X και Y ανάγεται στον υπολογισμό του ελάχιστου συνάρτησης δύο μεταβλητών:

Αυτό απαιτεί την εξίσωση με το μηδέν των μερικών παραγώγων σε σχέση με τις νέες μεταβλητές a και b και την επίλυση ενός αρχέγονου συστήματος που αποτελείται από δύο εξισώσεις με 2 άγνωστα της μορφής:

Μετά από μερικούς απλούς μετασχηματισμούς, συμπεριλαμβανομένης της διαίρεσης με το 2 και του χειρισμού των αθροισμάτων, έχουμε:

Λύνοντάς το, για παράδειγμα, με τη μέθοδο του Cramer, παίρνουμε ένα ακίνητο σημείο με κάποιους συντελεστές a * και b *. Αυτό είναι το ελάχιστο, δηλαδή για να προβλέψουμε τι τζίρο θα έχει το κατάστημα για μια συγκεκριμένη περιοχή, είναι κατάλληλη η ευθεία y = a * x + b *, που είναι ένα μοντέλο παλινδρόμησης για το εν λόγω παράδειγμα. Φυσικά, δεν θα σας επιτρέψει να βρείτε το ακριβές αποτέλεσμα, αλλά θα σας βοηθήσει να πάρετε μια ιδέα για το εάν η αγορά με πίστωση για ένα κατάστημα μιας συγκεκριμένης περιοχής θα αποδώσει.

Πώς να εφαρμόσετε τη μέθοδο ελαχίστων τετραγώνων στο Excel

Το Excel έχει μια συνάρτηση για τον υπολογισμό της τιμής OLS. Έχει την ακόλουθη μορφή: "TREND" (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, συνεχ.). Ας εφαρμόσουμε τον τύπο για τον υπολογισμό του OLS στο Excel στον πίνακά μας.

Για να το κάνετε αυτό, στο κελί στο οποίο θα πρέπει να εμφανίζεται το αποτέλεσμα του υπολογισμού με τη μέθοδο των ελαχίστων τετραγώνων στο Excel, πληκτρολογήστε το σύμβολο "=" και επιλέξτε τη συνάρτηση "TREND". Στο παράθυρο που ανοίγει, συμπληρώστε τα κατάλληλα πεδία, επισημαίνοντας:

  • το εύρος των γνωστών τιμών για το Y (σε αυτήν την περίπτωση, δεδομένα για τον κύκλο εργασιών).
  • εύρος x 1,… x n, δηλαδή το μέγεθος του χώρου λιανικής.
  • γνωστές και άγνωστες τιμές του x, για τις οποίες πρέπει να μάθετε το μέγεθος του κύκλου εργασιών (δείτε παρακάτω για πληροφορίες σχετικά με τη θέση τους στο φύλλο εργασίας).

Επιπλέον, ο τύπος περιέχει τη μεταβλητή Boolean "Const". Εάν εισαγάγετε 1 στο αντίστοιχο πεδίο, αυτό θα σημαίνει ότι πρέπει να γίνουν υπολογισμοί, με την προϋπόθεση ότι b = 0.

Εάν πρέπει να γνωρίζετε την πρόβλεψη για περισσότερες από μία τιμές του x, τότε αφού εισαγάγετε τον τύπο, δεν πρέπει να πατήσετε "Enter", αλλά πρέπει να πληκτρολογήσετε στο πληκτρολόγιο τον συνδυασμό "Shift" + "Control" + "Enter" ("Εισαγω").

Κάποια χαρακτηριστικά

Η ανάλυση παλινδρόμησης μπορεί ακόμη και να είναι διαθέσιμη σε ανδρείκελα. Ο τύπος του Excel για την πρόβλεψη της τιμής ενός πίνακα άγνωστων μεταβλητών - "TREND" - μπορεί να χρησιμοποιηθεί ακόμη και από όσους δεν έχουν ακούσει ποτέ για τη μέθοδο των ελαχίστων τετραγώνων. Αρκεί μόνο να γνωρίζουμε μερικά από τα χαρακτηριστικά της δουλειάς της. Συγκεκριμένα:

  • Εάν τακτοποιήσετε το εύρος των γνωστών τιμών της μεταβλητής y σε μία γραμμή ή στήλη, τότε κάθε γραμμή (στήλη) με γνωστές τιμές x θα γίνεται αντιληπτή από το πρόγραμμα ως ξεχωριστή μεταβλητή.
  • Εάν το παράθυρο "TREND" δεν περιέχει εύρος με γνωστό x, τότε εάν η συνάρτηση χρησιμοποιείται στο Excel, το πρόγραμμα θα τη θεωρήσει ως πίνακα που αποτελείται από ακέραιους αριθμούς, ο αριθμός των οποίων αντιστοιχεί στην περιοχή με τις δεδομένες τιμές της μεταβλητής y.
  • Για να λάβετε έναν πίνακα "προβλεπόμενων" τιμών ως έξοδο, η έκφραση τάσης πρέπει να εισαχθεί ως τύπος πίνακα.
  • Εάν δεν καθορίζονται νέες τιμές x, τότε η συνάρτηση TREND τις θεωρεί ίσες με τις γνωστές. Εάν δεν καθορίζονται, τότε ο πίνακας 1 λαμβάνεται ως όρισμα. 2; 3; 4;…, το οποίο είναι ανάλογο με το εύρος με τις ήδη δεδομένες παραμέτρους y.
  • Το εύρος που περιέχει τις νέες τιμές x πρέπει να είναι το ίδιο ή περισσότερες σειρές ή στήλες με το εύρος με τις δεδομένες τιμές y. Με άλλα λόγια, θα πρέπει να είναι ανάλογο με τις ανεξάρτητες μεταβλητές.
  • Ένας πίνακας με γνωστές τιμές x μπορεί να περιέχει πολλές μεταβλητές. Ωστόσο, εάν μιλάμε μόνο για ένα, τότε οι περιοχές με τις δεδομένες τιμές των x και y απαιτείται να είναι ανάλογες. Στην περίπτωση πολλαπλών μεταβλητών, θέλετε το εύρος με τις δεδομένες τιμές y να χωράει σε μία στήλη ή μία γραμμή.

Λειτουργία FORECAST

Υλοποιείται με πολλές λειτουργίες. Ένα από αυτά ονομάζεται "ΠΡΟΒΛΕΨΗ". Είναι παρόμοιο με το "TREND", δηλαδή δίνει το αποτέλεσμα των υπολογισμών με τη μέθοδο των ελαχίστων τετραγώνων. Ωστόσο, μόνο για ένα Χ, για το οποίο η τιμή Υ είναι άγνωστη.

Τώρα γνωρίζετε τους τύπους στο Excel για ανδρείκελα που σας επιτρέπουν να προβλέψετε τη μελλοντική τιμή ενός δεδομένου δείκτη σύμφωνα με μια γραμμική τάση.

Έχοντας επιλέξει τον τύπο της συνάρτησης παλινδρόμησης, π.χ. ο τύπος του εξεταζόμενου μοντέλου εξάρτησης του Y από το X (ή το X από το Y), για παράδειγμα, ένα γραμμικό μοντέλο y x = a + bx, είναι απαραίτητο να προσδιοριστούν οι συγκεκριμένες τιμές των συντελεστών του μοντέλου.

Για διαφορετικές τιμές των a και b, μπορεί να κατασκευαστεί άπειρος αριθμός εξαρτήσεων της μορφής yx = a + bx, δηλαδή υπάρχει άπειρος αριθμός ευθειών στο επίπεδο συντεταγμένων, αλλά χρειαζόμαστε μια τέτοια εξάρτηση που αντιστοιχεί στις παρατηρούμενες τιμές με τον καλύτερο τρόπο. Έτσι, η εργασία περιορίζεται στην επιλογή των καλύτερων συντελεστών.

Αναζητούμε τη γραμμική συνάρτηση a + bx, προχωρώντας μόνο από συγκεκριμένο αριθμό διαθέσιμων παρατηρήσεων. Για να βρούμε τη συνάρτηση με την καλύτερη προσαρμογή στις παρατηρούμενες τιμές, χρησιμοποιούμε τη μέθοδο των ελαχίστων τετραγώνων.

Σημειώστε: Y i - η τιμή που υπολογίζεται σύμφωνα με την εξίσωση Y i = a + bx i. y i είναι η μετρούμενη τιμή, ε i = y i -Y i είναι η διαφορά μεταξύ των μετρούμενων και των υπολογισμένων τιμών σύμφωνα με την εξίσωση, ε i = y i -a-bx i.

Η μέθοδος των ελαχίστων τετραγώνων απαιτεί το ε i, η διαφορά μεταξύ των μετρούμενων y i και των υπολογισμένων τιμών Y i, να είναι ελάχιστη. Επομένως, βρίσκουμε τους συντελεστές a και b έτσι ώστε το άθροισμα των τετραγώνων των αποκλίσεων των παρατηρούμενων τιμών από τις τιμές στην ευθεία γραμμή της παλινδρόμησης να είναι το μικρότερο:

Εξερευνώντας αυτή τη συνάρτηση των ορισμάτων a και για το άκρο με τη βοήθεια παραγώγων, μπορεί κανείς να αποδείξει ότι η συνάρτηση παίρνει μια ελάχιστη τιμή εάν οι συντελεστές a και b είναι λύσεις του συστήματος:

(2)

Αν διαιρέσουμε και τις δύο πλευρές των κανονικών εξισώσεων με n, παίρνουμε:

Λαμβάνοντας υπ 'όψιν ότι (3)

Παίρνουμε , από εδώ, αντικαθιστώντας την τιμή του a στην πρώτη εξίσωση, παίρνουμε:

Στην περίπτωση αυτή, το b ονομάζεται συντελεστής παλινδρόμησης. Το α ονομάζεται ελεύθερος όρος της εξίσωσης παλινδρόμησης και υπολογίζεται από τον τύπο:

Η προκύπτουσα ευθεία είναι μια εκτίμηση για τη θεωρητική γραμμή παλινδρόμησης. Εχουμε:

Ετσι, είναι μια εξίσωση γραμμικής παλινδρόμησης.

Η παλινδρόμηση μπορεί να είναι άμεση (b> 0) και αντίστροφη (b Παράδειγμα 1. Τα αποτελέσματα της μέτρησης των τιμών X και Y δίνονται στον πίνακα:

x i -2 0 1 2 4
y i 0.5 1 1.5 2 3

Υποθέτοντας ότι υπάρχει γραμμική σχέση y = a + bx μεταξύ των X και Y, προσδιορίστε τους συντελεστές a και b χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Λύση. Εδώ n = 5
x i = -2 + 0 + 1 + 2 + 4 = 5;
x i 2 = 4 + 0 + 1 + 4 + 16 = 25
x i y i = -2 0,5 + 0 1 + 1 1,5 + 2 2 + 4 3 = 16,5
y i = 0,5 + 1 + 1,5 + 2 + 3 = 8

και το κανονικό σύστημα (2) έχει τη μορφή

Λύνοντας αυτό το σύστημα, παίρνουμε: b = 0,425, a = 1,175. Επομένως, y = 1,175 + 0,425x.

Παράδειγμα 2. Υπάρχει δείγμα 10 παρατηρήσεων οικονομικών δεικτών (Χ) και (Υ).

x i 180 172 173 169 175 170 179 170 167 174
y i 186 180 176 171 182 166 182 172 169 177

Απαιτείται η εύρεση του δείγματος της εξίσωσης παλινδρόμησης Υ-Χ. Σχεδιάστε τη γραμμή παλινδρόμησης του δείγματος Υ-Χ.

Λύση. 1. Ας ταξινομήσουμε τα δεδομένα κατά τις τιμές x i και y i. Παίρνουμε έναν νέο πίνακα:

x i 167 169 170 170 172 173 174 175 179 180
y i 169 171 166 172 180 176 177 182 182 186

Για να απλοποιήσουμε τους υπολογισμούς, θα συντάξουμε έναν πίνακα υπολογισμών στον οποίο θα εισάγουμε τις απαραίτητες αριθμητικές τιμές.

x i y i x i 2 x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i = 1729 ∑y i = 1761 ∑x i 2 299105 ∑x i y i = 304696
x = 172,9 y = 176,1 x i 2 = 29910,5 xy = 30469,6

Σύμφωνα με τον τύπο (4), υπολογίζουμε τον συντελεστή παλινδρόμησης

και σύμφωνα με τον τύπο (5)

Έτσι, η εξίσωση παλινδρόμησης του δείγματος είναι y = -59,34 + 1,3804x.
Ας σχεδιάσουμε σημεία (x i; y i) στο επίπεδο συντεταγμένων και ας σημειώσουμε τη γραμμή παλινδρόμησης.


Εικ. 4

Το σχήμα 4 δείχνει πώς εντοπίζονται οι παρατηρούμενες τιμές σε σχέση με τη γραμμή παλινδρόμησης. Για μια αριθμητική εκτίμηση των αποκλίσεων του y i από το Y i, όπου παρατηρείται το y i, και το Y i είναι οι τιμές που καθορίζονται από την παλινδρόμηση, συντάσσουμε έναν πίνακα:

x i y i Y i Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Οι τιμές Y i υπολογίζονται σύμφωνα με την εξίσωση παλινδρόμησης.

Η αξιοσημείωτη απόκλιση ορισμένων από τις παρατηρούμενες τιμές από τη γραμμή παλινδρόμησης εξηγείται από τον μικρό αριθμό παρατηρήσεων. Κατά τη μελέτη του βαθμού γραμμικής εξάρτησης του Υ από το Χ λαμβάνεται υπόψη ο αριθμός των παρατηρήσεων. Η ισχύς της εξάρτησης καθορίζεται από την τιμή του συντελεστή συσχέτισης.

Το οποίο βρίσκει την ευρύτερη εφαρμογή σε διάφορους τομείς της επιστήμης και της πρακτικής. Μπορεί να είναι η φυσική, η χημεία, η βιολογία, η οικονομία, η κοινωνιολογία, η ψυχολογία, και ούτω καθεξής, και ούτω καθεξής. Με τη θέληση της μοίρας, έχω συχνά να ασχοληθώ με την οικονομία, και ως εκ τούτου σήμερα θα σας εκδόσω ένα εισιτήριο για μια καταπληκτική χώρα που ονομάζεται Οικονομετρία=) ... Πώς δεν το θέλεις;! Είναι πολύ καλά εκεί - απλά πρέπει να αποφασίσετε! ... Αλλά αυτό που πιθανώς σίγουρα θέλετε είναι να μάθετε πώς να λύνετε προβλήματα μέθοδος ελαχίστων τετραγώνων... Και ιδιαίτερα οι επιμελείς αναγνώστες θα μάθουν πώς να τα λύνουν όχι μόνο άψογα, αλλά και ΠΟΛΥ ΓΡΗΓΟΡΑ ;-) Αλλά πρώτα γενική δήλωση προβλήματος+ σχετικό παράδειγμα:

Ας διερευνηθούν σε κάποια θεματική περιοχή οι δείκτες που έχουν ποσοτική έκφραση. Ταυτόχρονα, υπάρχει κάθε λόγος να πιστεύουμε ότι ο δείκτης εξαρτάται από τον δείκτη. Αυτή η υπόθεση μπορεί να είναι και μια επιστημονική υπόθεση και να βασίζεται σε στοιχειώδη κοινή λογική. Αφήνοντας στην άκρη την επιστήμη, ωστόσο, και εξερευνώντας πιο λαχταριστές περιοχές - συγκεκριμένα τα παντοπωλεία. Ας χαρακτηρίσουμε με:

- Χώρος λιανικής παντοπωλείου, τ.μ.,
- ετήσιος κύκλος εργασιών του παντοπωλείου, εκατ. ρούβλια.

Είναι απολύτως σαφές ότι όσο μεγαλύτερη είναι η έκταση του καταστήματος, τόσο μεγαλύτερος θα είναι ο τζίρος του στις περισσότερες περιπτώσεις.

Ας υποθέσουμε ότι μετά από παρατήρηση / πειραματισμό / υπολογισμό / χορό με ένα ντέφι, έχουμε αριθμητικά δεδομένα στη διάθεσή μας:

Με τα παντοπωλεία, νομίζω ότι όλα είναι ξεκάθαρα: - αυτή είναι η περιοχή του 1ου καταστήματος, - ο ετήσιος τζίρος του, - η περιοχή του 2ου καταστήματος, - ο ετήσιος τζίρος του κ.λπ. Παρεμπιπτόντως, δεν είναι καθόλου απαραίτητο να έχετε πρόσβαση σε ταξινομημένα υλικά - μια αρκετά ακριβής εκτίμηση του κύκλου εργασιών μπορεί να ληφθεί μέσω μαθηματικές στατιστικές... Ωστόσο, ας μην αποσπάται η προσοχή, η πορεία της εμπορικής κατασκοπείας - είναι ήδη πληρωμένη =)

Τα δεδομένα σε πίνακα μπορούν επίσης να γραφτούν με τη μορφή κουκκίδων και να απεικονιστούν με το συνηθισμένο για εμάς Καρτεσιανό σύστημα .

Ας απαντήσουμε σε μια σημαντική ερώτηση: πόσους βαθμούς χρειάζεστε για μια ποιοτική μελέτη;

Οσο μεγαλύτερο τόσο καλύτερα. Το ελάχιστο επιτρεπόμενο σετ αποτελείται από 5-6 πόντους. Επιπλέον, με μικρό όγκο δεδομένων, το δείγμα δεν μπορεί να περιλαμβάνει «ανώμαλα» αποτελέσματα. Έτσι, για παράδειγμα, ένα μικρό κατάστημα ελίτ μπορεί να βοηθήσει κατά τάξεις μεγέθους περισσότερο «τους συναδέλφους του», παραμορφώνοντας έτσι το γενικό μοτίβο που πρέπει να βρεθεί!

Για να το θέσω πολύ απλά - πρέπει να επιλέξουμε μια συνάρτηση, πρόγραμμαπου περνά όσο πιο κοντά στα σημεία ... Αυτή η συνάρτηση καλείται προσεγγίζοντας (προσέγγιση - προσέγγιση)ή θεωρητική λειτουργία ... Σε γενικές γραμμές, εμφανίζεται αμέσως ένας προφανής "προκλητής" - ένα πολυώνυμο υψηλού βαθμού του οποίου η γραφική παράσταση διέρχεται από ΟΛΑ τα σημεία. Αλλά αυτή η επιλογή είναι δύσκολη και συχνά απλά λανθασμένη. (δεδομένου ότι το γράφημα θα «στρέβει» όλη την ώρα και θα αντικατοπτρίζει άσχημα την κύρια τάση).

Έτσι, η αναζητούμενη συνάρτηση θα πρέπει να είναι αρκετά απλή και ταυτόχρονα να αντικατοπτρίζει επαρκώς την εξάρτηση. Όπως μπορείτε να μαντέψετε, ονομάζεται μία από τις μεθόδους εύρεσης τέτοιων συναρτήσεων μέθοδος ελαχίστων τετραγώνων... Αρχικά, ας ρίξουμε μια ματιά στην ουσία του σε γενικούς όρους. Αφήστε κάποια συνάρτηση να προσεγγίσει τα πειραματικά δεδομένα:


Πώς να αξιολογήσετε την ακρίβεια αυτής της προσέγγισης; Ας υπολογίσουμε τις διαφορές (αποκλίσεις) μεταξύ των πειραματικών και των λειτουργικών τιμών (μελετώντας το σχέδιο)... Η πρώτη σκέψη που έρχεται στο μυαλό είναι να υπολογίσουμε πόσο μεγάλο είναι το άθροισμα, αλλά το πρόβλημα είναι ότι οι διαφορές μπορεί να είναι αρνητικές. (Για παράδειγμα, ) και οι αποκλίσεις ως αποτέλεσμα μιας τέτοιας άθροισης θα αλληλοεξουδετερωθούν. Επομένως, ως εκτίμηση της ακρίβειας της προσέγγισης, ζητά να γίνει αποδεκτό το άθροισμα ενότητεςαποκλίσεις:

ή κατέρρευσε: (ξαφνικά, ποιος δεν ξέρει: - αυτό είναι το εικονίδιο αθροίσματος και - μια βοηθητική μεταβλητή - "μετρητής", που παίρνει τιμές από 1 έως).

Προσεγγίζοντας τα πειραματικά σημεία με διαφορετικές συναρτήσεις, θα λάβουμε διαφορετικές τιμές, και είναι προφανές πού αυτό το άθροισμα είναι μικρότερο - αυτή η συνάρτηση είναι πιο ακριβής.

Μια τέτοια μέθοδος υπάρχει και λέγεται μέθοδος ελάχιστου συντελεστή... Ωστόσο, στην πράξη, έχει γίνει πολύ πιο διαδεδομένη. μέθοδος ελάχιστου τετραγώνου, στο οποίο οι πιθανές αρνητικές τιμές εξαλείφονται όχι από το μέτρο, αλλά με τον τετραγωνισμό των αποκλίσεων:

, μετά την οποία οι προσπάθειες κατευθύνονται στην επιλογή μιας τέτοιας συνάρτησης έτσι ώστε το άθροισμα των τετραγώνων των αποκλίσεων ήταν όσο το δυνατόν μικρότερο. Στην πραγματικότητα, εξ ου και το όνομα της μεθόδου.

Και τώρα επιστρέφουμε σε ένα άλλο σημαντικό σημείο: όπως σημειώθηκε παραπάνω, η επιλεγμένη συνάρτηση θα πρέπει να είναι αρκετά απλή - αλλά υπάρχουν και πολλές τέτοιες λειτουργίες: γραμμικός , υπερβολικός, εκθετικός, λογαριθμική, τετραγωνικός και τα λοιπά. Και, φυσικά, εδώ θα ήθελα αμέσως να «μειώσω το πεδίο δραστηριότητας». Ποια κατηγορία συναρτήσεων να επιλέξετε για έρευνα; Ένα πρωτόγονο αλλά αποτελεσματικό κόλπο:

- Ο ευκολότερος τρόπος για να τραβήξετε πόντους στο σχέδιο και αναλύστε τη θέση τους. Εάν τείνουν να είναι σε ευθεία γραμμή, τότε θα πρέπει να ψάξετε εξίσωση ευθείας γραμμής με βέλτιστες τιμές και. Με άλλα λόγια, το καθήκον είναι να βρούμε ΤΕΤΟΙΟΥΣ συντελεστές - έτσι ώστε το άθροισμα των τετραγώνων των αποκλίσεων να είναι το μικρότερο.

Εάν τα σημεία βρίσκονται, για παράδειγμα, κατά μήκος υπερβολή, τότε είναι a priori σαφές ότι μια γραμμική συνάρτηση θα δώσει κακή προσέγγιση. Σε αυτή την περίπτωση, αναζητούμε τους πιο «ευνοϊκούς» συντελεστές για την εξίσωση της υπερβολής - αυτά που δίνουν το ελάχιστο άθροισμα τετραγώνων .

Τώρα, σημειώστε ότι και στις δύο περιπτώσεις μιλάμε συναρτήσεις δύο μεταβλητώντων οποίων τα επιχειρήματα είναι παραμέτρους αναζητούμενων εξαρτήσεων:

Και στην ουσία, πρέπει να λύσουμε ένα τυπικό πρόβλημα - να βρούμε ελάχιστη συνάρτηση δύο μεταβλητών.

Ας θυμηθούμε το παράδειγμά μας: ας υποθέσουμε ότι τα σημεία «καταστήματος» τείνουν να βρίσκονται σε ευθεία γραμμή και υπάρχουν κάθε λόγοι να πιστεύουμε ότι γραμμική σχέσητζίρο από τον χώρο λιανικής. Ας βρούμε ΤΕΤΟΙΟΥΣ συντελεστές "a" και "bs" ώστε το άθροισμα των τετραγώνων των αποκλίσεων ήταν το μικρότερο. Όλα είναι όπως συνήθως - πρώτα Μερικά παράγωγα 1ης τάξης... Σύμφωνα με κανόνας γραμμικότηταςμπορείτε να διαφοροποιήσετε απευθείας κάτω από το εικονίδιο ποσού:

Εάν θέλετε να χρησιμοποιήσετε αυτές τις πληροφορίες για ένα δοκίμιο ή βιβλίο μαθημάτων, θα είμαι πολύ ευγνώμων για τον σύνδεσμο στη λίστα των πηγών, θα βρείτε τέτοιους λεπτομερείς υπολογισμούς σε λίγα σημεία:

Ας συνθέσουμε ένα τυπικό σύστημα:

Μειώνουμε κάθε εξίσωση κατά "δύο" και, επιπλέον, "διασπάμε" τα αθροίσματα:

Σημείωση : Αναλύστε μόνοι σας γιατί τα "a" και "bie" μπορούν να αφαιρεθούν για το εικονίδιο αθροίσματος. Παρεμπιπτόντως, τυπικά αυτό μπορεί να γίνει με το άθροισμα

Ας ξαναγράψουμε το σύστημα σε μια "εφαρμοσμένη" μορφή:

μετά από το οποίο αρχίζει να σχεδιάζεται ο αλγόριθμος για την επίλυση του προβλήματός μας:

Γνωρίζουμε τις συντεταγμένες των σημείων; Ξέρουμε. Ποσά μπορούμε να βρούμε; Ανετα. Συνθέτουμε τα πιο απλά σύστημα δύο γραμμικών εξισώσεων σε δύο αγνώστους("A" και "bh"). Λύνουμε το σύστημα, για παράδειγμα, Η μέθοδος του Cramer, με αποτέλεσμα να αποκτήσουμε ένα ακίνητο σημείο. Ελεγχος επαρκής συνθήκη για εξτρέμ, μπορεί κανείς να βεβαιωθεί ότι σε αυτό το σημείο η συνάρτηση πετυχαίνει ακριβώς ελάχιστο... Η επαλήθευση συνδέεται με πρόσθετους υπολογισμούς και επομένως θα την αφήσουμε στο παρασκήνιο. (εάν είναι απαραίτητο, μπορείτε να δείτε το πλαίσιο που λείπει)... Καταλήγουμε στο τελικό συμπέρασμα:

Λειτουργία ο καλύτερος τρόπος (τουλάχιστον σε σύγκριση με οποιαδήποτε άλλη γραμμική συνάρτηση)φέρνει πιο κοντά τα πειραματικά σημεία ... Σε γενικές γραμμές, το γράφημά του είναι όσο το δυνατόν πιο κοντά σε αυτά τα σημεία. Στην παράδοση οικονομετρίακαλείται επίσης η συνάρτηση προσέγγισης που προκύπτει ζευγαρωμένη γραμμική εξίσωση παλινδρόμησης .

Το πρόβλημα που εξετάζεται έχει μεγάλη πρακτική σημασία. Στην κατάσταση με το παράδειγμά μας, η εξίσωση σας επιτρέπει να προβλέψετε τι κύκλο εργασιών ("Παιχνίδι")θα βρίσκεται στο κατάστημα με τη μία ή την άλλη αξία του χώρου λιανικής (αυτή ή εκείνη η τιμή "x")... Ναι, η πρόβλεψη που λαμβάνεται θα είναι μόνο μια πρόβλεψη, αλλά σε πολλές περιπτώσεις θα είναι αρκετά ακριβής.

Θα αναλύσω μόνο ένα πρόβλημα με "πραγματικούς" αριθμούς, καθώς δεν υπάρχουν δυσκολίες - όλοι οι υπολογισμοί είναι στο επίπεδο του σχολικού προγράμματος 7-8 τάξης. Στο 95 τοις εκατό των περιπτώσεων, θα σας ζητηθεί να βρείτε μόνο μια γραμμική συνάρτηση, αλλά στο τέλος του άρθρου θα δείξω ότι δεν είναι πιο δύσκολο να βρείτε τις εξισώσεις της βέλτιστης υπερβολής, του εκθέτη και ορισμένων άλλων συναρτήσεων.

Στην πραγματικότητα, μένει να μοιράσουμε τα υποσχεμένα ψωμάκια - έτσι ώστε να μάθετε πώς να λύνετε τέτοια παραδείγματα όχι μόνο με ακρίβεια, αλλά και γρήγορα. Μελετάμε προσεκτικά το πρότυπο:

Εργο

Ως αποτέλεσμα της μελέτης της σχέσης μεταξύ των δύο δεικτών, προέκυψαν τα ακόλουθα ζεύγη αριθμών:

Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, βρείτε τη γραμμική συνάρτηση που προσεγγίζει καλύτερα την εμπειρική (έμπειρος)δεδομένα. Κάντε ένα σχέδιο στο οποίο, σε ένα καρτεσιανό ορθογώνιο σύστημα συντεταγμένων, σχεδιάστε πειραματικά σημεία και μια γραφική παράσταση της συνάρτησης κατά προσέγγιση ... Να βρείτε το άθροισμα των τετραγώνων των αποκλίσεων μεταξύ εμπειρικών και θεωρητικών τιμών. Μάθετε αν η λειτουργία θα ήταν καλύτερη (από την άποψη της μεθόδου των ελαχίστων τετραγώνων)μεγέθυνση σε πειραματικά σημεία.

Σημειώστε ότι οι έννοιες "x" είναι φυσικές, και αυτό έχει μια χαρακτηριστική σημασία, για την οποία θα μιλήσω λίγο αργότερα. αλλά φυσικά μπορεί να είναι κλασματικά. Επιπλέον, ανάλογα με το περιεχόμενο ενός συγκεκριμένου προβλήματος, τόσο οι τιμές "x" και "παιχνίδι" μπορεί να είναι πλήρως ή μερικώς αρνητικές. Λοιπόν, έχουμε ένα έργο «απρόσωπο» και το ξεκινάμε λύση:

Βρίσκουμε τους συντελεστές της βέλτιστης συνάρτησης ως λύση στο σύστημα:

Για λόγους πιο συμπαγούς συμβολισμού, η μεταβλητή "counter" μπορεί να παραλειφθεί, καθώς είναι ήδη σαφές ότι η άθροιση πραγματοποιείται από το 1 έως το.

Είναι πιο βολικό να υπολογίσετε τα απαιτούμενα ποσά σε μορφή πίνακα:


Οι υπολογισμοί μπορούν να πραγματοποιηθούν σε μικροϋπολογιστή, αλλά είναι πολύ καλύτερο να χρησιμοποιείτε το Excel - τόσο πιο γρήγορα όσο και χωρίς σφάλματα. δείτε ένα σύντομο βίντεο:

Έτσι, λαμβάνουμε τα ακόλουθα το σύστημα:

Εδώ μπορείτε να πολλαπλασιάσετε τη δεύτερη εξίσωση με 3 και αφαιρέστε τη 2η από την 1η εξίσωση ανά όρο... Αλλά αυτό είναι τύχη - στην πράξη, τα συστήματα συχνά δεν είναι δώρο, και σε τέτοιες περιπτώσεις εξοικονομεί Η μέθοδος του Cramer:
, πράγμα που σημαίνει ότι το σύστημα έχει μια μοναδική λύση.

Ας ελέγξουμε. Καταλαβαίνω ότι δεν θέλω, αλλά γιατί να παραλείψω τα σφάλματα όπου μπορούν να αποφευχθούν εντελώς; Αντικαθιστούμε τη λύση που βρέθηκε στην αριστερή πλευρά κάθε εξίσωσης του συστήματος:

Λαμβάνονται οι δεξιές πλευρές των αντίστοιχων εξισώσεων, που σημαίνει ότι το σύστημα έχει λυθεί σωστά.

Έτσι, η απαιτούμενη συνάρτηση προσέγγισης: - από όλων των γραμμικών συναρτήσεωνείναι αυτή που προσεγγίζει τα πειραματικά δεδομένα με τον καλύτερο τρόπο.

Διαφορετικός ευθεία εξάρτηση του τζίρου του καταστήματος από την περιοχή του, η εξάρτηση που διαπιστώθηκε είναι ΑΝΤΙΣΤΡΟΦΗ (η αρχή "όσο περισσότερο - τόσο λιγότερο"), και το γεγονός αυτό αποκαλύπτεται αμέσως από το αρνητικό κλίση... Λειτουργία μας πληροφορεί ότι με αύξηση ενός συγκεκριμένου δείκτη κατά 1 μονάδα, η τιμή του εξαρτημένου δείκτη μειώνεται μέση τιμήκατά 0,65 μονάδες. Όπως λέει και η παροιμία, όσο υψηλότερη είναι η τιμή του φαγόπυρου, τόσο λιγότερο πωλείται.

Για να σχεδιάσουμε τη γραφική παράσταση της συνάρτησης κατά προσέγγιση, βρίσκουμε δύο από τις τιμές της:

και εκτελέστε το σχέδιο:


Η κατασκευασμένη γραμμή ονομάζεται γραμμή τάσης (δηλαδή, μια γραμμική γραμμή τάσης, δηλαδή, στη γενική περίπτωση, μια τάση δεν είναι απαραίτητα μια ευθεία γραμμή)... Όλοι γνωρίζουν την έκφραση «be in trend», και νομίζω ότι αυτός ο όρος δεν χρειάζεται επιπλέον σχόλια.

Ας υπολογίσουμε το άθροισμα των τετραγώνων των αποκλίσεων μεταξύ εμπειρικών και θεωρητικών αξιών. Γεωμετρικά, είναι το άθροισμα των τετραγώνων των μηκών των «βυσσινί» τμημάτων (δύο από τα οποία είναι τόσο μικρά που δεν μπορείτε καν να τα δείτε).

Ας συνοψίσουμε τους υπολογισμούς σε έναν πίνακα:


Μπορούν πάλι να γίνουν χειροκίνητα, σε περίπτωση που θα δώσω ένα παράδειγμα για το 1ο σημείο:

αλλά είναι πολύ πιο αποτελεσματικό να ενεργείς με έναν πολύ γνωστό τρόπο:

Ας επαναλάβουμε: ποιο είναι το νόημα του ληφθέντος αποτελέσματος;Από όλων των γραμμικών συναρτήσεωνλειτουργία ο δείκτης είναι ο μικρότερος, δηλαδή στην οικογένειά του είναι η καλύτερη προσέγγιση. Και εδώ, παρεμπιπτόντως, το τελευταίο ερώτημα του προβλήματος δεν είναι τυχαίο: τι θα συμβεί αν η προτεινόμενη εκθετική συνάρτηση θα είναι καλύτερα να κάνουμε κατά προσέγγιση τα πειραματικά σημεία;

Ας βρούμε το αντίστοιχο άθροισμα των τετραγώνων των αποκλίσεων - για να τα ξεχωρίσω θα τα προσδιορίσω με το γράμμα «έψιλον». Η τεχνική είναι ακριβώς η ίδια:


Και πάλι, μόνο για κάθε πυροσβέστη, υπολογισμοί για τον 1ο βαθμό:

Στο Excel, χρησιμοποιούμε την τυπική συνάρτηση ΛΗΞΗ (δείτε τη Βοήθεια του Excel για τη σύνταξη).

συμπέρασμα:, που σημαίνει ότι η εκθετική συνάρτηση προσεγγίζει τα πειραματικά σημεία χειρότερα από την ευθεία .

Εδώ όμως πρέπει να σημειωθεί ότι το «χειρότερο» είναι δεν σημαίνει ακόμα, τι συμβαίνει. Τώρα έχω σχεδιάσει αυτήν την εκθετική συνάρτηση - και επίσης πλησιάζει τα σημεία - τόσο πολύ που χωρίς αναλυτική έρευνα είναι δύσκολο να πούμε ποια συνάρτηση είναι πιο ακριβής.

Αυτό ολοκληρώνει τη λύση και επιστρέφω στο ερώτημα των φυσικών αξιών του επιχειρήματος. Σε διάφορες μελέτες, κατά κανόνα, οικονομικές ή κοινωνιολογικές, οι φυσικοί «ξε» αριθμούν μήνες, έτη ή άλλα ίσα χρονικά διαστήματα. Σκεφτείτε, για παράδειγμα, ένα πρόβλημα όπως αυτό.

Το καθήκον είναι να βρεθούν οι συντελεστές της γραμμικής εξάρτησης για τις οποίες η συνάρτηση δύο μεταβλητών ένακαι σιπαίρνει τη μικρότερη τιμή. Δοσμένο δηλαδή ένακαι σιτο άθροισμα των τετραγώνων των αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η λύση του παραδείγματος ανάγεται στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Παραγωγή τύπων εύρεσης συντελεστών.Συντίθεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Να βρείτε τις μερικές παραγώγους της συνάρτησης κατά μεταβλητές ένακαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Λύνουμε το προκύπτον σύστημα εξισώσεων με οποιαδήποτε μέθοδο (για παράδειγμα, τη μέθοδο αντικατάστασης ή τη μέθοδο του Cramer) και λαμβάνουμε τύπους για την εύρεση των συντελεστών χρησιμοποιώντας τη μέθοδο ελαχίστων τετραγώνων (OLS).

Με δεδομένα ένακαι σιλειτουργία παίρνει τη μικρότερη τιμή.

Αυτή είναι η μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα,,, και την παράμετρο n- τον όγκο των πειραματικών δεδομένων. Συνιστούμε τον υπολογισμό των τιμών αυτών των ποσών χωριστά. Συντελεστής σιείναι μετά τον υπολογισμό ένα.

Ο κύριος τομέας εφαρμογής τέτοιων πολυωνύμων είναι η επεξεργασία πειραματικών δεδομένων (κατασκευή εμπειρικών τύπων). Το θέμα είναι ότι το πολυώνυμο παρεμβολής που κατασκευάζεται από τις τιμές της συνάρτησης που λαμβάνεται από το πείραμα θα έχει ισχυρή επίδραση του "πειραματικού θορύβου"· επιπλέον, κατά την παρεμβολή, οι κόμβοι παρεμβολής δεν μπορούν να επαναληφθούν, δηλ. τα αποτελέσματα επαναλαμβανόμενων πειραμάτων δεν μπορούν να χρησιμοποιηθούν υπό τις ίδιες συνθήκες. Το πολυώνυμο ρίζας μέσου τετραγώνου εξομαλύνει τον θόρυβο και σας επιτρέπει να χρησιμοποιείτε τα αποτελέσματα πολλαπλών πειραμάτων.

Αριθμητική ολοκλήρωση και διαφοροποίηση. Παράδειγμα.

Αριθμητική ολοκλήρωση- υπολογισμός της τιμής ενός ορισμένου ολοκληρώματος (κατά κανόνα, κατά προσέγγιση). Η αριθμητική ολοκλήρωση νοείται ως ένα σύνολο αριθμητικών μεθόδων για την εύρεση της τιμής ενός συγκεκριμένου ολοκληρώματος.

Αριθμητική διαφοροποίηση- ένα σύνολο μεθόδων για τον υπολογισμό της τιμής της παραγώγου μιας διακριτά δεδομένης συνάρτησης.

Ενσωμάτωση

Διατύπωση του προβλήματος.Μαθηματική διατύπωση του προβλήματος: είναι απαραίτητο να βρεθεί η τιμή ενός ορισμένου ολοκληρώματος

όπου τα a, b είναι πεπερασμένα, η f (x) είναι συνεχής στο [a, b].

Κατά την επίλυση πρακτικών προβλημάτων, συμβαίνει συχνά το ολοκλήρωμα να είναι άβολο ή αδύνατο να ληφθεί αναλυτικά: μπορεί να μην εκφράζεται σε στοιχειώδεις συναρτήσεις, το ολοκλήρωμα μπορεί να δοθεί με τη μορφή πίνακα κ.λπ. Σε τέτοιες περιπτώσεις, μέθοδοι αριθμητικής ολοκλήρωσης είναι μεταχειρισμένα. Οι μέθοδοι αριθμητικής ολοκλήρωσης χρησιμοποιούν την αντικατάσταση του εμβαδού ενός καμπύλου τραπεζοειδούς με ένα πεπερασμένο άθροισμα περιοχών απλούστερων γεωμετρικών σχημάτων που μπορούν να υπολογιστούν με ακρίβεια. Με αυτή την έννοια, μιλούν για τη χρήση τύπων τετραγωνισμού.

Οι περισσότερες μέθοδοι χρησιμοποιούν μια πεπερασμένη αναπαράσταση αθροίσματος του ολοκληρώματος (τύπος τετραγωνισμού):

Οι τύποι τετραγωνισμού βασίζονται στην ιδέα της αντικατάστασης του γραφήματος του ολοκληρώματος στο διάστημα ολοκλήρωσης με συναρτήσεις απλούστερης μορφής, οι οποίες μπορούν εύκολα να ενσωματωθούν αναλυτικά και, επομένως, να υπολογιστούν εύκολα. Η απλούστερη εργασία κατασκευής τύπων τετραγωνισμού πραγματοποιείται για πολυωνυμικά μαθηματικά μοντέλα.

Τρεις ομάδες μεθόδων μπορούν να διακριθούν:

1. Μέθοδος με διαίρεση του τμήματος ολοκλήρωσης σε ίσα διαστήματα. Η διαίρεση σε διαστήματα γίνεται εκ των προτέρων, συνήθως τα διαστήματα επιλέγονται ίσα (για να είναι ευκολότερος ο υπολογισμός της συνάρτησης στα άκρα των διαστημάτων). Υπολογίστε τα εμβαδά και αθροίστε τα (μέθοδοι ορθογώνιο, τραπεζοειδές, Simpson).

2. Μέθοδοι με διαίρεση του τμήματος ολοκλήρωσης με χρήση ειδικών σημείων (μέθοδος Gauss).

3. Υπολογισμός ολοκληρωμάτων με χρήση τυχαίων αριθμών (μέθοδος Monte Carlo).

Μέθοδος ορθογωνίων.Αφήστε τη συνάρτηση (σχήμα) να ενσωματωθεί αριθμητικά στο τμήμα. Διαιρέστε το τμήμα σε Ν ίσα διαστήματα. Η περιοχή καθενός από τα N καμπύλα τραπεζοειδή μπορεί να αντικατασταθεί με την περιοχή ενός ορθογωνίου.

Το πλάτος όλων των ορθογωνίων είναι το ίδιο και ίσο με:

Ως επιλογή του ύψους των ορθογωνίων, μπορείτε να επιλέξετε την τιμή της συνάρτησης στο αριστερό περίγραμμα. Σε αυτή την περίπτωση, το ύψος του πρώτου ορθογωνίου θα είναι f (a), του δεύτερου - f (x 1), ..., N-f (N-1).

Αν πάρουμε την τιμή της συνάρτησης στο δεξί περίγραμμα ως επιλογή του ύψους του ορθογωνίου, τότε στην περίπτωση αυτή το ύψος του πρώτου παραλληλογράμμου θα είναι f (x 1), του δεύτερου - f (x 2),… , N - f (x N).

Όπως μπορείτε να δείτε, σε αυτή την περίπτωση ένας από τους τύπους δίνει μια προσέγγιση στο ολοκλήρωμα με μια περίσσεια και ο δεύτερος με μια έλλειψη. Υπάρχει ένας άλλος τρόπος - να χρησιμοποιήσετε την τιμή της συνάρτησης στο μέσο του διαστήματος ολοκλήρωσης για προσέγγιση:

Εκτίμηση του απόλυτου σφάλματος της μεθόδου ορθογωνίου (μέση)

Εκτίμηση του απόλυτου σφάλματος των μεθόδων των αριστερών και δεξιών ορθογωνίων.

Παράδειγμα.Υπολογίστε για ολόκληρο το διάστημα και διαιρώντας το διάστημα σε τέσσερις ενότητες

Λύση.Ένας αναλυτικός υπολογισμός αυτού του ολοκληρώματος δίνει I = arstg (1) –agstg (0) = 0,7853981634. Στην περίπτωσή μας:

1) h = 1; xо = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Ας υπολογίσουμε με τη μέθοδο των αριστερών ορθογωνίων:

Ας υπολογίσουμε με τη μέθοδο των ορθογωνίων ορθογωνίων:

Ας υπολογίσουμε με τη μέθοδο των μεσαίων ορθογωνίων:

Τραπεζιακή μέθοδος.Η χρήση ενός πολυωνύμου πρώτου βαθμού για παρεμβολή (μια ευθεία γραμμή που διασχίζεται από δύο σημεία) οδηγεί σε έναν τραπεζοειδή τύπο. Τα άκρα του τμήματος ολοκλήρωσης λαμβάνονται ως κόμβοι παρεμβολής. Έτσι, το καμπύλο τραπεζοειδές αντικαθίσταται από ένα συνηθισμένο τραπεζοειδές, το εμβαδόν του οποίου μπορεί να βρεθεί ως το γινόμενο του μισού αθροίσματος των βάσεων και του ύψους

Στην περίπτωση των N τμημάτων ολοκλήρωσης για όλους τους κόμβους, εκτός από τα ακραία σημεία του τμήματος, η τιμή της συνάρτησης θα συμπεριληφθεί στο συνολικό άθροισμα δύο φορές (καθώς τα γειτονικά τραπεζοειδή έχουν μια κοινή πλευρά)

Ο τραπεζοειδής τύπος μπορεί να ληφθεί λαμβάνοντας το μισό άθροισμα των τύπων ορθογωνίου κατά μήκος της δεξιάς και της αριστερής ακμής του τμήματος:

Έλεγχος της σταθερότητας του διαλύματος.Κατά κανόνα, τόσο μικρότερο είναι το μήκος κάθε διαστήματος, δηλ. Όσο μεγαλύτερος είναι ο αριθμός αυτών των διαστημάτων, τόσο μικρότερη είναι η διαφορά μεταξύ των κατά προσέγγιση και των ακριβών τιμών του ολοκληρώματος. Αυτό ισχύει για τις περισσότερες λειτουργίες. Στην τραπεζοειδή μέθοδο, το σφάλμα στον υπολογισμό του ολοκληρώματος ϭ είναι περίπου ανάλογο με το τετράγωνο του βήματος ολοκλήρωσης (ϭ ~ h 2).Έτσι, για να υπολογιστεί το ολοκλήρωμα κάποιας συνάρτησης με όρους a, b, είναι απαραίτητο να διαιρεθεί το τμήμα σε διαστήματα N 0 και βρείτε το άθροισμα των εμβαδών του τραπεζοειδούς. Στη συνέχεια, πρέπει να αυξήσετε τον αριθμό των διαστημάτων N 1, να υπολογίσετε ξανά το άθροισμα του τραπεζοειδούς και να συγκρίνετε την τιμή που προκύπτει με το προηγούμενο αποτέλεσμα. Αυτό θα πρέπει να επαναληφθεί μέχρι το (N i), μέχρι να επιτευχθεί η καθορισμένη ακρίβεια του αποτελέσματος (κριτήριο σύγκλισης).

Για ορθογώνιες και τραπεζοειδείς μεθόδους, ο αριθμός των διαστημάτων συνήθως διπλασιάζεται σε κάθε βήμα επανάληψης (N i +1 = 2N i).

Κριτήριο σύγκλισης:

Το κύριο πλεονέκτημα του τραπεζοειδούς κανόνα είναι η απλότητά του. Ωστόσο, εάν απαιτείται υψηλή ακρίβεια κατά τον υπολογισμό του ολοκληρώματος, αυτή η μέθοδος μπορεί να απαιτεί πάρα πολλές επαναλήψεις.

Απόλυτο λάθος της τραπεζοειδούς μεθόδουαξιολογείται ως
.

Παράδειγμα.Υπολογίστε το κατά προσέγγιση ολοκλήρωμα χρησιμοποιώντας τον τραπεζοειδή τύπο.

α) Διαίρεση του τμήματος ολοκλήρωσης σε 3 μέρη.
β) Διαίρεση του τμήματος ολοκλήρωσης σε 5 μέρη.

Λύση:
α) Σύμφωνα με την προϋπόθεση, το τμήμα ολοκλήρωσης πρέπει να χωριστεί σε 3 μέρη, δηλαδή.
Ας υπολογίσουμε το μήκος κάθε τμήματος του διαμερίσματος: .

Έτσι, η γενική φόρμουλα των τραπεζίων μειώνεται σε ένα ευχάριστο μέγεθος:

Τελικά:

Επιτρέψτε μου να σας υπενθυμίσω ότι η τιμή που λαμβάνεται είναι μια κατά προσέγγιση τιμή για την περιοχή.

β) Διαιρέστε το τμήμα της ολοκλήρωσης σε 5 ίσα μέρη, δηλαδή. αυξάνοντας τον αριθμό των τμημάτων, αυξάνουμε την ακρίβεια των υπολογισμών.

Εάν, τότε ο τραπεζοειδής τύπος έχει την ακόλουθη μορφή:

Βρείτε το βήμα διαίρεσης:
δηλαδή το μήκος κάθε ενδιάμεσου τμήματος είναι 0,6.

Κατά την ολοκλήρωση της εργασίας, όλοι οι υπολογισμοί γίνονται εύκολα με έναν πίνακα υπολογισμών:

Στην πρώτη γραμμή γράφουμε "μετρητής"

Σαν άποτέλεσμα:

Λοιπόν, υπάρχει πραγματικά μια διευκρίνιση, και μάλιστα σοβαρή!
Αν για 3 τμήματα του διαμερίσματος, τότε για 5 τμήματα. Αν πάρουμε ακόμη περισσότερα με το τμήμα => θα είναι ακόμα πιο ακριβές.

Η φόρμουλα του Simpson.Ο τραπεζοειδής τύπος δίνει ένα αποτέλεσμα που εξαρτάται σε μεγάλο βαθμό από το μέγεθος του βήματος h, το οποίο επηρεάζει την ακρίβεια του υπολογισμού ενός ορισμένου ολοκληρώματος, ειδικά σε περιπτώσεις όπου η συνάρτηση είναι μη μονότονη. Είναι δυνατόν να υποθέσουμε μια αύξηση στην ακρίβεια των υπολογισμών, εάν αντί για ευθύγραμμα τμήματα που αντικαθιστούν τα καμπυλόγραμμα τμήματα της γραφικής παράστασης της συνάρτησης f (x), κάποιος χρησιμοποιεί, για παράδειγμα, θραύσματα παραβολών μειωμένα σε τρία γειτονικά σημεία του γραφήματος. Αυτή η γεωμετρική ερμηνεία βρίσκεται στο επίκεντρο της μεθόδου του Simpson για τον υπολογισμό ενός ορισμένου ολοκληρώματος. Ολόκληρο το διάστημα ολοκλήρωσης a, b χωρίζεται σε N τμήματα, το μήκος του τμήματος θα είναι επίσης ίσο με h = (b-a) / N.

Ο τύπος του Simpson είναι:

υπόλοιπο

Με την αύξηση του μήκους των τμημάτων, η ακρίβεια του τύπου μειώνεται, επομένως, για να αυξηθεί η ακρίβεια, χρησιμοποιείται ο σύνθετος τύπος Simpson. Ολόκληρο το διάστημα ολοκλήρωσης χωρίζεται σε ζυγό αριθμό πανομοιότυπων τμημάτων N, το μήκος του τμήματος θα είναι επίσης ίσο με h = (b-a) / N. Ο σύνθετος τύπος του Simpson είναι:

Στον τύπο, οι εκφράσεις στις παρενθέσεις αντιπροσωπεύουν τα αθροίσματα των τιμών του ολοκληρώματος στα άκρα των περιττών και ζυγών εσωτερικών τμημάτων, αντίστοιχα.

Το υπόλοιπο του τύπου Simpson είναι ανάλογο με την τέταρτη δύναμη του βήματος:

Παράδειγμα:Υπολογίστε το ολοκλήρωμα χρησιμοποιώντας τον κανόνα του Simpson. (Η ακριβής λύση είναι 0,2)

Μέθοδος Gauss

Τύπος τετραγωνισμού Gauss... Η βασική αρχή του δεύτερου είδους τύπων τετραγωνισμού φαίνεται από το σχήμα 1.12: είναι απαραίτητο να τοποθετηθούν τα σημεία με αυτόν τον τρόπο Χ 0 και Χ 1 μέσα στο τμήμα [ ένα;σι] έτσι ώστε τα συνολικά εμβαδά των "τριγώνων" να είναι ίσα με το εμβαδόν του "τμήματος". Όταν χρησιμοποιείται ο τύπος Gauss, το αρχικό τμήμα [ ένα;σιΤο ] ανάγεται στο τμήμα [-1; 1] αλλάζοντας τη μεταβλητή Χστο

0.5∙(σιένα)∙t+ 0.5∙(σι + ένα).

Τότε , που .

Μια τέτοια αντικατάσταση είναι δυνατή εάν ένακαι σιείναι πεπερασμένα και η συνάρτηση φά(Χ) είναι συνεχής στις [ ένα;σι]. τύπος Gauss για nσημεία x i, Εγώ=0,1,..,n-1 μέσα στο τμήμα [ ένα;σι]:

, (1.27)

που t iκαι A iγια διάφορα nδίνονται σε βιβλία αναφοράς. Για παράδειγμα, για n=2 ΕΝΑ 0 =ΕΝΑ 1 = 1; στο n=3: t 0 = t 2 "0,775, t 1 =0, ΕΝΑ 0 = Α 2 "0,555, ΕΝΑ 1 "0,889.

Τύπος τετραγωνισμού Gauss

λαμβάνεται με συνάρτηση βάρους ίση με ένα p (x) = 1 και κόμβοι x iπου είναι οι ρίζες των πολυωνύμων Legendre

Πιθανότητα A iυπολογίζεται εύκολα με τύπους

Εγώ=0,1,2,...n.

Οι τιμές των κόμβων και οι συντελεστές για n = 2,3,4,5 δίνονται στον πίνακα

Σειρά Κόμβοι Πιθανότητα
n=2 x 1=0 x 0 =-x 2=0.7745966692 Α'1=8/9 Α 0 = Α 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x 0=0.8611363116 Α 1 = Α 2=0.6521451549 Α 0 = Α 3=0.6521451549
n = 4 Χ 2 = 0 Χ 3 = -Χ 1 = 0.5384693101 Χ 4 =-Χ 0 =0.9061798459 ΕΝΑ 0 =0.568888899 ΕΝΑ 3 =ΕΝΑ 1 =0.4786286705 ΕΝΑ 0 =ΕΝΑ 4 =0.2869268851
n=5 Χ 5 = -Χ 0 =0.9324695142 Χ 4 = -Χ 1 =0.6612093865 Χ 3 = -Χ 2 =0.2386191861 ΕΝΑ 5 = Α 0 =0.1713244924 ΕΝΑ 4 = Α 1 =0.3607615730 ΕΝΑ 3 = Α 2 =0.4679139346

Παράδειγμα.Υπολογίστε την τιμή χρησιμοποιώντας τον τύπο Gaussian για n=2:

Ακριβής αξία: .

Ο αλγόριθμος για τον υπολογισμό του ολοκληρώματος με τον τύπο του Gauss δεν προβλέπει τον διπλασιασμό του αριθμού των μικροτομών, αλλά την αύξηση του αριθμού των τεταγμένων κατά 1 και τη σύγκριση των λαμβανόμενων τιμών του ολοκληρώματος. Το πλεονέκτημα του τύπου Gauss είναι η υψηλή ακρίβεια με σχετικά μικρό αριθμό τεταγμένων. Μειονεκτήματα: άβολο για χειροκίνητους υπολογισμούς. είναι απαραίτητο να διατηρηθούν στη μνήμη του υπολογιστή οι τιμές t i, A iγια διάφορα n.

Το σφάλμα του τύπου Gaussian τετράγωνο στο τμήμα θα είναι σε αυτήν την περίπτωση. Ο υπόλοιπος τύπος θα είναι, επιπλέον, ο συντελεστής α Νμειώνεται γρήγορα με την ανάπτυξη Ν... Εδώ

Οι τύποι Gauss παρέχουν υψηλή ακρίβεια ακόμη και με μικρό αριθμό κόμβων (από 4 έως 10) Σε αυτή την περίπτωση, σε πρακτικούς υπολογισμούς, ο αριθμός των κόμβων κυμαίνεται από αρκετές εκατοντάδες έως αρκετές χιλιάδες. Σημειώστε επίσης ότι τα βάρη των τεταρτημορίων Gauss είναι πάντα θετικά, γεγονός που εξασφαλίζει τη σταθερότητα του αλγορίθμου για τον υπολογισμό των αθροισμάτων