Προσέγγιση πειραματικών δεδομένων. Μέθοδος ελάχιστου τετραγώνου

Η μέθοδος των ελαχίστων τετραγώνων (LSM) σας επιτρέπει να υπολογίζετε διάφορες ποσότητες χρησιμοποιώντας τα αποτελέσματα πολλών μετρήσεων που περιέχουν τυχαία σφάλματα.

Χαρακτηριστικό MNC

Η κύρια ιδέα αυτής της μεθόδου είναι ότι το άθροισμα των τετραγώνων σφαλμάτων θεωρείται ως κριτήριο για την ακρίβεια της λύσης του προβλήματος, το οποίο επιδιώκεται να ελαχιστοποιηθεί. Κατά τη χρήση αυτής της μεθόδου, μπορούν να εφαρμοστούν τόσο αριθμητικές όσο και αναλυτικές προσεγγίσεις.

Ειδικότερα, ως αριθμητική υλοποίηση, η μέθοδος των ελαχίστων τετραγώνων συνεπάγεται την πραγματοποίηση όσο το δυνατόν περισσότερων μετρήσεων μιας άγνωστης τυχαίας μεταβλητής. Επιπλέον, όσο περισσότεροι υπολογισμοί, τόσο πιο ακριβής θα είναι η λύση. Σε αυτό το σύνολο υπολογισμών (αρχικά δεδομένα), προκύπτει ένα άλλο σύνολο προτεινόμενων λύσεων, από τις οποίες στη συνέχεια επιλέγεται η καλύτερη. Εάν το σύνολο των λύσεων παραμετροποιηθεί, τότε η μέθοδος των ελαχίστων τετραγώνων θα μειωθεί στην εύρεση της βέλτιστης τιμής των παραμέτρων.

Ως αναλυτική προσέγγιση για την υλοποίηση του LSM στο σύνολο των αρχικών δεδομένων (μετρήσεις) και στο προτεινόμενο σύνολο λύσεων, ορίζεται κάποια (λειτουργική), η οποία μπορεί να εκφραστεί με έναν τύπο που προκύπτει ως μια συγκεκριμένη υπόθεση που πρέπει να επιβεβαιωθεί . Σε αυτή την περίπτωση, η μέθοδος των ελαχίστων τετραγώνων μειώνεται στην εύρεση του ελάχιστου αυτής της συνάρτησης στο σύνολο των τετραγωνικών σφαλμάτων των αρχικών δεδομένων.

Σημειώστε ότι όχι τα ίδια τα σφάλματα, αλλά τα τετράγωνα των σφαλμάτων. Γιατί; Γεγονός είναι ότι συχνά οι αποκλίσεις των μετρήσεων από την ακριβή τιμή είναι θετικές και αρνητικές. Κατά τον προσδιορισμό του μέσου όρου, η απλή άθροιση μπορεί να οδηγήσει σε εσφαλμένο συμπέρασμα σχετικά με την ποιότητα της εκτίμησης, καθώς η αμοιβαία ακύρωση θετικών και αρνητικών τιμών θα μειώσει τη δειγματοληπτική ισχύ του συνόλου των μετρήσεων. Και, κατά συνέπεια, η ακρίβεια της αξιολόγησης.

Για να μην συμβεί αυτό, αθροίζονται οι τετραγωνικές αποκλίσεις. Ακόμη περισσότερο από αυτό, προκειμένου να εξισωθεί η διάσταση της μετρούμενης τιμής και η τελική εκτίμηση, χρησιμοποιείται το άθροισμα των τετραγωνικών σφαλμάτων για την εξαγωγή

Μερικές εφαρμογές των MNC

Το MNC χρησιμοποιείται ευρέως σε διάφορους τομείς. Για παράδειγμα, στη θεωρία πιθανοτήτων και στη μαθηματική στατιστική, η μέθοδος χρησιμοποιείται για τον προσδιορισμό ενός τέτοιου χαρακτηριστικού μιας τυχαίας μεταβλητής όπως η τυπική απόκλιση, η οποία καθορίζει το πλάτος του εύρους τιμών μιας τυχαίας μεταβλητής.

Έχει πολλές εφαρμογές, καθώς επιτρέπει μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης από άλλες απλούστερες. Το LSM μπορεί να είναι εξαιρετικά χρήσιμο στην επεξεργασία των παρατηρήσεων και χρησιμοποιείται ενεργά για την εκτίμηση ορισμένων ποσοτήτων από τα αποτελέσματα μετρήσεων άλλων που περιέχουν τυχαία σφάλματα. Σε αυτό το άρθρο, θα μάθετε πώς να εφαρμόζετε υπολογισμούς ελαχίστων τετραγώνων στο Excel.

Δήλωση του προβλήματος σε συγκεκριμένο παράδειγμα

Ας υποθέσουμε ότι υπάρχουν δύο δείκτες X και Y. Επιπλέον, το Y εξαρτάται από το X. Επειδή το OLS μας ενδιαφέρει από την άποψη της ανάλυσης παλινδρόμησης (στο Excel, οι μέθοδοί του υλοποιούνται χρησιμοποιώντας ενσωματωμένες συναρτήσεις), θα πρέπει να προχωρήσουμε αμέσως να εξετάσει ένα συγκεκριμένο πρόβλημα.

Έτσι, έστω X η περιοχή πώλησης ενός παντοπωλείου, μετρημένη σε τετραγωνικά μέτρα, και Y είναι ο ετήσιος κύκλος εργασιών, που ορίζεται σε εκατομμύρια ρούβλια.

Απαιτείται να γίνει πρόβλεψη για το τι τζίρο (Υ) θα έχει το κατάστημα αν έχει τον έναν ή τον άλλο χώρο λιανικής. Προφανώς, η συνάρτηση Y = f (X) αυξάνεται, αφού η υπεραγορά πουλάει περισσότερα αγαθά από το περίπτερο.

Λίγα λόγια για την ορθότητα των αρχικών δεδομένων που χρησιμοποιούνται για την πρόβλεψη

Ας υποθέσουμε ότι έχουμε έναν πίνακα κατασκευασμένο με δεδομένα για n καταστήματα.

Σύμφωνα με τις μαθηματικές στατιστικές, τα αποτελέσματα θα είναι λίγο πολύ σωστά εάν εξεταστούν τα δεδομένα για τουλάχιστον 5-6 αντικείμενα. Επίσης, δεν μπορούν να χρησιμοποιηθούν "ανώμαλα" αποτελέσματα. Συγκεκριμένα, μια ελίτ μικρή μπουτίκ μπορεί να έχει τζίρο πολλαπλάσιο από τον τζίρο μεγάλων καταστημάτων της κατηγορίας «masmarket».

Η ουσία της μεθόδου

Τα δεδομένα του πίνακα μπορούν να εμφανιστούν στο καρτεσιανό επίπεδο ως σημεία M 1 (x 1, y 1), ... M n (x n, y n). Τώρα η λύση του προβλήματος θα περιοριστεί στην επιλογή μιας προσεγγιστικής συνάρτησης y = f (x), η οποία έχει μια γραφική παράσταση που περνά όσο το δυνατόν πιο κοντά στα σημεία M 1, M 2, .. M n .

Φυσικά, μπορείτε να χρησιμοποιήσετε ένα πολυώνυμο υψηλού βαθμού, αλλά αυτή η επιλογή δεν είναι μόνο δύσκολη στην εφαρμογή, αλλά απλά λανθασμένη, καθώς δεν θα αντικατοπτρίζει την κύρια τάση που πρέπει να εντοπιστεί. Η πιο λογική λύση είναι να αναζητήσετε μια ευθεία γραμμή y = ax + b, η οποία προσεγγίζει καλύτερα τα πειραματικά δεδομένα, και πιο συγκεκριμένα, τους συντελεστές - a και b.

Βαθμολογία ακρίβειας

Για κάθε προσέγγιση, ιδιαίτερη σημασία έχει η εκτίμηση της ακρίβειάς της. Σημειώστε με e i τη διαφορά (απόκλιση) μεταξύ των λειτουργικών και πειραματικών τιμών για το σημείο x i , δηλαδή e i = y i - f (x i).

Προφανώς, για να αξιολογήσετε την ακρίβεια της προσέγγισης, μπορείτε να χρησιμοποιήσετε το άθροισμα των αποκλίσεων, δηλ., όταν επιλέγετε μια ευθεία γραμμή για μια κατά προσέγγιση αναπαράσταση της εξάρτησης του X από το Y, θα πρέπει να προτιμάτε αυτή που έχει τη μικρότερη τιμή το άθροισμα e i σε όλα τα υπό εξέταση σημεία. Ωστόσο, δεν είναι όλα τόσο απλά, αφού μαζί με τις θετικές αποκλίσεις, πρακτικά θα υπάρχουν και αρνητικές.

Μπορείτε να λύσετε το πρόβλημα χρησιμοποιώντας τις μονάδες απόκλισης ή τα τετράγωνά τους. Η τελευταία μέθοδος είναι η πιο ευρέως χρησιμοποιούμενη. Χρησιμοποιείται σε πολλούς τομείς, συμπεριλαμβανομένης της ανάλυσης παλινδρόμησης (στο Excel, η υλοποίησή του πραγματοποιείται χρησιμοποιώντας δύο ενσωματωμένες συναρτήσεις) και έχει αποδειχθεί από καιρό ότι είναι αποτελεσματική.

Μέθοδος ελάχιστου τετραγώνου

Στο Excel, όπως γνωρίζετε, υπάρχει μια ενσωματωμένη λειτουργία αυτόματης άθροισης που σας επιτρέπει να υπολογίσετε τις τιμές όλων των τιμών που βρίσκονται στην επιλεγμένη περιοχή. Έτσι, τίποτα δεν θα μας εμποδίσει να υπολογίσουμε την τιμή της παράστασης (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Στη μαθηματική σημειογραφία, αυτό μοιάζει με:

Δεδομένου ότι αρχικά ελήφθη η απόφαση να γίνει προσέγγιση χρησιμοποιώντας μια ευθεία γραμμή, έχουμε:

Έτσι, το έργο της εύρεσης μιας ευθείας γραμμής που περιγράφει καλύτερα μια συγκεκριμένη σχέση μεταξύ X και Y ισοδυναμεί με τον υπολογισμό του ελάχιστου συνάρτησης δύο μεταβλητών:

Αυτό απαιτεί την εξίσωση με μηδέν μερικών παραγώγων σε σχέση με τις νέες μεταβλητές a και b και την επίλυση ενός αρχέγονου συστήματος που αποτελείται από δύο εξισώσεις με 2 άγνωστα της μορφής:

Μετά από απλούς μετασχηματισμούς, συμπεριλαμβανομένης της διαίρεσης με το 2 και του χειρισμού των αθροισμάτων, παίρνουμε:

Λύνοντάς το, για παράδειγμα, με τη μέθοδο του Cramer, λαμβάνουμε ένα ακίνητο σημείο με ορισμένους συντελεστές a * και b * . Αυτό είναι το ελάχιστο, δηλαδή για να προβλέψουμε τι τζίρο θα έχει το κατάστημα για μια συγκεκριμένη περιοχή, η ευθεία γραμμή y = a * x + b * είναι κατάλληλη, η οποία είναι ένα μοντέλο παλινδρόμησης για το εν λόγω παράδειγμα. Φυσικά, δεν θα σας επιτρέψει να βρείτε το ακριβές αποτέλεσμα, αλλά θα σας βοηθήσει να πάρετε μια ιδέα για το εάν η αγορά ενός καταστήματος με πίστωση για μια συγκεκριμένη περιοχή θα αποδώσει.

Πώς να εφαρμόσετε τη μέθοδο ελαχίστων τετραγώνων στο Excel

Το Excel έχει μια συνάρτηση για τον υπολογισμό της τιμής των ελαχίστων τετραγώνων. Έχει την ακόλουθη μορφή: TREND (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, σταθερά). Ας εφαρμόσουμε τον τύπο για τον υπολογισμό του OLS στο Excel στον πίνακά μας.

Για να το κάνετε αυτό, στο κελί στο οποίο θα πρέπει να εμφανίζεται το αποτέλεσμα του υπολογισμού με τη μέθοδο των ελαχίστων τετραγώνων στο Excel, εισαγάγετε το σύμβολο "=" και επιλέξτε τη συνάρτηση "TREND". Στο παράθυρο που ανοίγει, συμπληρώστε τα κατάλληλα πεδία, επισημαίνοντας:

  • εύρος γνωστών τιμών για το Y (σε αυτήν την περίπτωση δεδομένα για τον κύκλο εργασιών).
  • εύρος x 1 , …x n , δηλαδή το μέγεθος του χώρου λιανικής.
  • και γνωστές και άγνωστες τιμές του x, για τις οποίες πρέπει να μάθετε το μέγεθος του κύκλου εργασιών (για πληροφορίες σχετικά με τη θέση τους στο φύλλο εργασίας, δείτε παρακάτω).

Επιπλέον, υπάρχει μια λογική μεταβλητή "Const" στον τύπο. Εάν εισαγάγετε 1 στο πεδίο που αντιστοιχεί σε αυτό, τότε αυτό θα σημαίνει ότι πρέπει να πραγματοποιηθούν υπολογισμοί, με την προϋπόθεση ότι b \u003d 0.

Εάν πρέπει να γνωρίζετε την πρόβλεψη για περισσότερες από μία τιμές x, τότε μετά την εισαγωγή του τύπου, δεν πρέπει να πατήσετε "Enter", αλλά πρέπει να πληκτρολογήσετε τον συνδυασμό "Shift" + "Control" + "Enter" ("Enter" ) στο πληκτρολόγιο.

Μερικά Χαρακτηριστικά

Η ανάλυση παλινδρόμησης μπορεί να είναι προσβάσιμη ακόμη και σε ανδρείκελα. Ο τύπος του Excel για την πρόβλεψη της τιμής ενός πίνακα άγνωστων μεταβλητών - "TREND" - μπορεί να χρησιμοποιηθεί ακόμη και από εκείνους που δεν έχουν ακούσει ποτέ για τη μέθοδο των ελαχίστων τετραγώνων. Αρκεί μόνο να γνωρίζουμε κάποια χαρακτηριστικά της δουλειάς του. Συγκεκριμένα:

  • Εάν τοποθετήσετε το εύρος των γνωστών τιμών της μεταβλητής y σε μία γραμμή ή στήλη, τότε κάθε γραμμή (στήλη) με γνωστές τιμές x θα γίνει αντιληπτή από το πρόγραμμα ως ξεχωριστή μεταβλητή.
  • Εάν η περιοχή με γνωστό x δεν καθορίζεται στο παράθυρο TREND, τότε στην περίπτωση χρήσης της συνάρτησης στο Excel, το πρόγραμμα θα τη θεωρήσει ως πίνακα που αποτελείται από ακέραιους αριθμούς, ο αριθμός των οποίων αντιστοιχεί στην περιοχή με τις δεδομένες τιμές ​της μεταβλητής y.
  • Για να εξάγετε έναν πίνακα "προβλεπόμενων" τιμών, η έκφραση τάσης πρέπει να εισαχθεί ως τύπος πίνακα.
  • Εάν δεν καθορίζονται νέες τιμές x, τότε η συνάρτηση TREND τις θεωρεί ίσες με τις γνωστές. Εάν δεν καθορίζονται, τότε ο πίνακας 1 λαμβάνεται ως όρισμα. 2; 3; 4;…, το οποίο είναι ανάλογο με το εύρος με τις ήδη δεδομένες παραμέτρους y.
  • Το εύρος που περιέχει τις νέες τιμές x πρέπει να έχει τις ίδιες ή περισσότερες σειρές ή στήλες με το εύρος με τις δεδομένες τιμές y. Με άλλα λόγια, πρέπει να είναι ανάλογη με τις ανεξάρτητες μεταβλητές.
  • Ένας πίνακας με γνωστές τιμές x μπορεί να περιέχει πολλές μεταβλητές. Ωστόσο, εάν μιλάμε μόνο για ένα, τότε απαιτείται οι περιοχές με τις δεδομένες τιμές των x και y να είναι ανάλογες. Στην περίπτωση πολλών μεταβλητών, είναι απαραίτητο το εύρος με τις δεδομένες τιμές y να ταιριάζει σε μία στήλη ή μία γραμμή.

Λειτουργία FORECAST

Υλοποιείται χρησιμοποιώντας διάφορες λειτουργίες. Ένα από αυτά ονομάζεται «ΠΡΟΒΛΕΨΗ». Είναι παρόμοιο με το TREND, δηλαδή δίνει το αποτέλεσμα των υπολογισμών με τη μέθοδο των ελαχίστων τετραγώνων. Ωστόσο, μόνο για ένα Χ, για το οποίο η τιμή του Υ είναι άγνωστη.

Τώρα γνωρίζετε τους τύπους του Excel για ανδρείκελα που σας επιτρέπουν να προβλέψετε την τιμή της μελλοντικής τιμής ενός δείκτη σύμφωνα με μια γραμμική τάση.

Επιλέγοντας τον τύπο της συνάρτησης παλινδρόμησης, π.χ. ο τύπος του εξεταζόμενου μοντέλου της εξάρτησης του Y από το X (ή το X από το Y), για παράδειγμα, ένα γραμμικό μοντέλο y x = a + bx, είναι απαραίτητο να προσδιοριστούν οι συγκεκριμένες τιμές των συντελεστών του μοντέλου.

Για διαφορετικές τιμές των a και b, είναι δυνατό να δημιουργηθεί ένας άπειρος αριθμός εξαρτήσεων της μορφής y x = a + bx, δηλαδή υπάρχει ένας άπειρος αριθμός γραμμών στο επίπεδο συντεταγμένων, αλλά χρειαζόμαστε μια τέτοια εξάρτηση που αντιστοιχεί στις παρατηρούμενες τιμές με τον καλύτερο τρόπο. Έτσι, το πρόβλημα περιορίζεται στην επιλογή των καλύτερων συντελεστών.

Αναζητούμε μια γραμμική συνάρτηση a + bx, βασισμένη μόνο σε συγκεκριμένο αριθμό διαθέσιμων παρατηρήσεων. Για να βρούμε τη συνάρτηση με την καλύτερη προσαρμογή στις παρατηρούμενες τιμές, χρησιμοποιούμε τη μέθοδο των ελαχίστων τετραγώνων.

Σημειώστε: Y i - η τιμή που υπολογίζεται από την εξίσωση Y i =a+bx i . y i - μετρούμενη τιμή, ε i =y i -Y i - διαφορά μεταξύ των μετρούμενων και των υπολογισμένων τιμών, ε i =y i -a-bx i .

Η μέθοδος των ελαχίστων τετραγώνων απαιτεί το ε i, η διαφορά μεταξύ του μετρούμενου y i και των τιμών του Y i που υπολογίζονται από την εξίσωση, να είναι ελάχιστη. Επομένως, βρίσκουμε τους συντελεστές a και b έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων των παρατηρούμενων τιμών από τις τιμές στην ευθεία γραμμή παλινδρόμησης είναι το μικρότερο:

Διερευνώντας αυτή τη συνάρτηση των ορισμάτων a και με τη βοήθεια παραγώγων σε ένα άκρο, μπορούμε να αποδείξουμε ότι η συνάρτηση παίρνει μια ελάχιστη τιμή εάν οι συντελεστές a και b είναι λύσεις του συστήματος:

(2)

Αν διαιρέσουμε και τις δύο πλευρές των κανονικών εξισώσεων με n, παίρνουμε:

Δεδομένου ότι (3)

Παίρνω , από εδώ, αντικαθιστώντας την τιμή του a στην πρώτη εξίσωση, παίρνουμε:

Στην περίπτωση αυτή, το b ονομάζεται συντελεστής παλινδρόμησης. Το a ονομάζεται ελεύθερο μέλος της εξίσωσης παλινδρόμησης και υπολογίζεται από τον τύπο:

Η προκύπτουσα ευθεία είναι μια εκτίμηση για τη θεωρητική γραμμή παλινδρόμησης. Εχουμε:

Ετσι, είναι μια εξίσωση γραμμικής παλινδρόμησης.

Η παλινδρόμηση μπορεί να είναι άμεση (b>0) και αντίστροφη (b Παράδειγμα 1. Τα αποτελέσματα της μέτρησης των τιμών X και Y δίνονται στον πίνακα:

x i -2 0 1 2 4
y i 0.5 1 1.5 2 3

Υποθέτοντας ότι υπάρχει γραμμική σχέση μεταξύ X και Y y=a+bx, προσδιορίστε τους συντελεστές a και b χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Απόφαση. Εδώ n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0,5+0 1+1 1,5+2 2+4 3=16,5
y i =0,5+1+1,5+2+3=8

και το κανονικό σύστημα (2) έχει τη μορφή

Λύνοντας αυτό το σύστημα, παίρνουμε: b=0,425, a=1,175. Επομένως y=1,175+0,425x.

Παράδειγμα 2. Υπάρχει δείγμα 10 παρατηρήσεων οικονομικών δεικτών (Χ) και (Υ).

x i 180 172 173 169 175 170 179 170 167 174
y i 186 180 176 171 182 166 182 172 169 177

Απαιτείται η εύρεση μιας δειγματικής εξίσωσης παλινδρόμησης Y στο X. Κατασκευάστε μια δειγματική γραμμή παλινδρόμησης Y στο X.

Απόφαση. 1. Ας ταξινομήσουμε τα δεδομένα κατά τιμές x i και y i . Παίρνουμε έναν νέο πίνακα:

x i 167 169 170 170 172 173 174 175 179 180
y i 169 171 166 172 180 176 177 182 182 186

Για να απλοποιήσουμε τους υπολογισμούς, θα συντάξουμε έναν πίνακα υπολογισμού στον οποίο θα εισάγουμε τις απαραίτητες αριθμητικές τιμές.

x i y i x i 2 x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x i =1729 ∑y i =1761 ∑x i 2 299105 ∑x i y i =304696
x=172,9 y=176,1 x i 2 =29910,5 xy=30469,6

Σύμφωνα με τον τύπο (4), υπολογίζουμε τον συντελεστή παλινδρόμησης

και με τον τύπο (5)

Έτσι, η εξίσωση παλινδρόμησης του δείγματος μοιάζει με y=-59,34+1,3804x.
Ας σχεδιάσουμε τα σημεία (x i ; y i) στο επίπεδο συντεταγμένων και ας σημειώσουμε τη γραμμή παλινδρόμησης.


Εικ. 4

Το σχήμα 4 δείχνει πώς εντοπίζονται οι παρατηρούμενες τιμές σε σχέση με τη γραμμή παλινδρόμησης. Για να υπολογίσουμε αριθμητικά τις αποκλίσεις του y i από το Y i, όπου το y i είναι παρατηρούμενες τιμές και το Y i είναι τιμές που καθορίζονται με παλινδρόμηση, θα φτιάξουμε έναν πίνακα:

x i y i Y i Y i -y i
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Οι τιμές Y i υπολογίζονται σύμφωνα με την εξίσωση παλινδρόμησης.

Η αισθητή απόκλιση ορισμένων παρατηρούμενων τιμών από τη γραμμή παλινδρόμησης εξηγείται από τον μικρό αριθμό παρατηρήσεων. Κατά τη μελέτη του βαθμού γραμμικής εξάρτησης του Υ από το Χ λαμβάνεται υπόψη ο αριθμός των παρατηρήσεων. Η ισχύς της εξάρτησης καθορίζεται από την τιμή του συντελεστή συσχέτισης.

Το οποίο βρίσκει την ευρύτερη εφαρμογή σε διάφορους τομείς της επιστήμης και της πρακτικής. Μπορεί να είναι φυσική, χημεία, βιολογία, οικονομία, κοινωνιολογία, ψυχολογία και ούτω καθεξής και ούτω καθεξής. Με τη θέληση της μοίρας, συχνά πρέπει να ασχοληθώ με την οικονομία, και ως εκ τούτου σήμερα θα κανονίσω για εσάς ένα εισιτήριο για μια καταπληκτική χώρα που ονομάζεται Οικονομετρία=) … Πώς δεν το θέλεις;! Είναι πολύ καλά εκεί - απλά πρέπει να αποφασίσετε! …Αλλά αυτό που πιθανώς σίγουρα θέλετε είναι να μάθετε πώς να λύνετε προβλήματα ελάχιστα τετράγωνα. Και ιδιαίτερα οι επιμελείς αναγνώστες θα μάθουν να τα λύνουν όχι μόνο με ακρίβεια, αλλά και ΠΟΛΥ ΓΡΗΓΟΡΑ ;-) Αλλά πρώτα γενική δήλωση του προβλήματος+ σχετικό παράδειγμα:

Αφήστε τους δείκτες να μελετηθούν σε κάποια θεματική περιοχή που έχουν ποσοτική έκφραση. Ταυτόχρονα, υπάρχει κάθε λόγος να πιστεύουμε ότι ο δείκτης εξαρτάται από τον δείκτη. Αυτή η υπόθεση μπορεί να είναι και μια επιστημονική υπόθεση και να βασίζεται σε στοιχειώδη κοινή λογική. Ας αφήσουμε, ωστόσο, την επιστήμη στην άκρη και ας εξερευνήσουμε πιο ορεκτικές περιοχές - συγκεκριμένα, τα παντοπωλεία. Σημειώστε με:

– χώρος λιανικής παντοπωλείου, τ.μ.,
- ετήσιος κύκλος εργασιών ενός παντοπωλείου, εκατομμύρια ρούβλια.

Είναι ξεκάθαρο ότι όσο μεγαλύτερη είναι η έκταση του καταστήματος, τόσο μεγαλύτερος είναι ο τζίρος του στις περισσότερες περιπτώσεις.

Ας υποθέσουμε ότι μετά από παρατηρήσεις / πειράματα / υπολογισμούς / χορό με ντέφι, έχουμε στη διάθεσή μας αριθμητικά δεδομένα:

Με τα παντοπωλεία, νομίζω ότι όλα είναι ξεκάθαρα: - αυτή είναι η περιοχή του 1ου καταστήματος, - ο ετήσιος τζίρος του, - η περιοχή του 2ου καταστήματος, - ο ετήσιος τζίρος του κ.λπ. Παρεμπιπτόντως, δεν είναι καθόλου απαραίτητο να έχετε πρόσβαση σε ταξινομημένα υλικά - μια αρκετά ακριβής εκτίμηση του κύκλου εργασιών μπορεί να επιτευχθεί χρησιμοποιώντας μαθηματικές στατιστικές. Ωστόσο, μην αποσπάτε την προσοχή, η πορεία της εμπορικής κατασκοπείας είναι ήδη πληρωμένη =)

Τα δεδομένα πίνακα μπορούν επίσης να γραφτούν με τη μορφή σημείων και να απεικονιστούν με τον συνηθισμένο τρόπο για εμάς. Καρτεσιανό σύστημα .

Ας απαντήσουμε σε μια σημαντική ερώτηση: πόσα μόρια χρειάζονται για μια ποιοτική μελέτη;

Οσο μεγαλύτερο τόσο καλύτερα. Το ελάχιστο αποδεκτό σετ αποτελείται από 5-6 πόντους. Επιπλέον, με μικρό όγκο δεδομένων, τα «μη φυσιολογικά» αποτελέσματα δεν πρέπει να περιλαμβάνονται στο δείγμα. Έτσι, για παράδειγμα, ένα μικρό κατάστημα ελίτ μπορεί να βοηθήσει σε τάξεις μεγέθους περισσότερο από «τους συναδέλφους του», παραμορφώνοντας έτσι το γενικό μοτίβο που πρέπει να βρεθεί!

Αν είναι αρκετά απλό, πρέπει να επιλέξουμε μια συνάρτηση, πρόγραμμαπου περνά όσο πιο κοντά στα σημεία . Μια τέτοια συνάρτηση ονομάζεται προσεγγίζοντας (προσέγγιση - προσέγγιση)ή θεωρητική λειτουργία . Σε γενικές γραμμές, εδώ εμφανίζεται αμέσως ένας προφανής «προσποιητής» - ένα πολυώνυμο υψηλού βαθμού, η γραφική παράσταση του οποίου διέρχεται από ΟΛΑ τα σημεία. Αλλά αυτή η επιλογή είναι περίπλοκη και συχνά απλά λανθασμένη. (επειδή το γράφημα θα «ανεμίζει» συνεχώς και θα αντικατοπτρίζει ελάχιστα την κύρια τάση).

Έτσι, η επιθυμητή συνάρτηση πρέπει να είναι αρκετά απλή και ταυτόχρονα να αντικατοπτρίζει επαρκώς την εξάρτηση. Όπως μπορείτε να μαντέψετε, ονομάζεται μία από τις μεθόδους εύρεσης τέτοιων συναρτήσεων ελάχιστα τετράγωνα. Αρχικά, ας αναλύσουμε την ουσία του με γενικό τρόπο. Αφήστε κάποια συνάρτηση να προσεγγίσει τα πειραματικά δεδομένα:


Πώς να αξιολογήσετε την ακρίβεια αυτής της προσέγγισης; Ας υπολογίσουμε επίσης τις διαφορές (αποκλίσεις) μεταξύ των πειραματικών και λειτουργικών τιμών (μελετούμε το σχέδιο). Η πρώτη σκέψη που έρχεται στο μυαλό είναι να εκτιμήσουμε πόσο μεγάλο είναι το άθροισμα, αλλά το πρόβλημα είναι ότι οι διαφορές μπορεί να είναι αρνητικές. (Για παράδειγμα, ) και οι αποκλίσεις ως αποτέλεσμα μιας τέτοιας άθροισης θα αλληλοεξουδετερωθούν. Ως εκ τούτου, ως εκτίμηση της ακρίβειας της προσέγγισης, προτείνει τον εαυτό της να λάβει το άθροισμα ενότητεςαποκλίσεις:

ή σε διπλωμένη μορφή: (ξαφνικά, ποιος δεν ξέρει: - αυτό είναι το εικονίδιο αθροίσματος και - η βοηθητική μεταβλητή - "μετρητής", που παίρνει τιμές από 1 έως ).

Προσεγγίζοντας τα πειραματικά σημεία με διαφορετικές συναρτήσεις, θα λάβουμε διαφορετικές τιμές του , και είναι προφανές ότι όπου αυτό το άθροισμα είναι μικρότερο, αυτή η συνάρτηση είναι πιο ακριβής.

Μια τέτοια μέθοδος υπάρχει και ονομάζεται μέθοδος ελάχιστου συντελεστή. Ωστόσο, στην πράξη έχει γίνει πολύ πιο διαδεδομένο. μέθοδος ελάχιστου τετραγώνου, στο οποίο οι πιθανές αρνητικές τιμές εξαλείφονται όχι από το μέτρο, αλλά με τον τετραγωνισμό των αποκλίσεων:

, μετά την οποία οι προσπάθειες κατευθύνονται στην επιλογή μιας τέτοιας συνάρτησης ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν όσο το δυνατόν μικρότερο. Στην πραγματικότητα, εξ ου και το όνομα της μεθόδου.

Και τώρα επιστρέφουμε σε ένα άλλο σημαντικό σημείο: όπως σημειώθηκε παραπάνω, η επιλεγμένη συνάρτηση θα πρέπει να είναι αρκετά απλή - αλλά υπάρχουν και πολλές τέτοιες λειτουργίες: γραμμικός , υπερβολικός, εκθετικός, λογαριθμική, τετραγωνικός και τα λοιπά. Και, φυσικά, εδώ θα ήθελα αμέσως να «μειώσω το πεδίο δραστηριότητας». Ποια κατηγορία λειτουργιών να επιλέξετε για έρευνα; Πρωτόγονη αλλά αποτελεσματική τεχνική:

- Ο ευκολότερος τρόπος για να τραβήξετε πόντους στο σχέδιο και αναλύστε τη θέση τους. Εάν τείνουν να είναι σε ευθεία γραμμή, τότε θα πρέπει να ψάξετε ευθύγραμμη εξίσωση με βέλτιστες τιμές και . Με άλλα λόγια, το καθήκον είναι να βρεθούν ΤΕΤΟΙΟΙ συντελεστές - έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων να είναι το μικρότερο.

Εάν τα σημεία βρίσκονται, για παράδειγμα, κατά μήκος υπερβολή, τότε είναι σαφές ότι η γραμμική συνάρτηση θα δώσει κακή προσέγγιση. Σε αυτή την περίπτωση, αναζητούμε τους πιο «ευνοϊκούς» συντελεστές για την εξίσωση της υπερβολής - αυτά που δίνουν το ελάχιστο άθροισμα τετραγώνων .

Προσέξτε τώρα ότι και στις δύο περιπτώσεις μιλάμε συναρτήσεις δύο μεταβλητών, των οποίων τα επιχειρήματα είναι αναζητήθηκαν επιλογές εξάρτησης:

Και στην ουσία, πρέπει να λύσουμε ένα τυπικό πρόβλημα - να βρούμε ελάχιστη συνάρτηση δύο μεταβλητών.

Θυμηθείτε το παράδειγμά μας: ας υποθέσουμε ότι τα σημεία «καταστήματος» τείνουν να βρίσκονται σε ευθεία γραμμή και υπάρχει κάθε λόγος να πιστεύουμε την παρουσία γραμμική εξάρτησηκύκλου εργασιών από την περιοχή συναλλαγών. Ας βρούμε ΤΕΤΟΙΟΥΣ συντελεστές "a" και "be" έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν το μικρότερο. Όλα ως συνήθως - πρώτα επιμέρους παράγωγα 1ης τάξης. Σύμφωνα με κανόνας γραμμικότηταςμπορείτε να διαφοροποιήσετε ακριβώς κάτω από το εικονίδιο άθροισης:

Εάν θέλετε να χρησιμοποιήσετε αυτές τις πληροφορίες για ένα δοκίμιο ή ένα μάθημα, θα είμαι πολύ ευγνώμων για τον σύνδεσμο στη λίστα των πηγών, δεν θα βρείτε πουθενά τόσο λεπτομερείς υπολογισμούς:

Ας φτιάξουμε ένα τυπικό σύστημα:

Μειώνουμε κάθε εξίσωση κατά ένα «δύο» και, επιπλέον, «χωρίζουμε» τα αθροίσματα:

Σημείωση : αναλύστε ανεξάρτητα γιατί το "a" και το "be" μπορούν να αφαιρεθούν από το εικονίδιο αθροίσματος. Παρεμπιπτόντως, τυπικά αυτό μπορεί να γίνει με το άθροισμα

Ας ξαναγράψουμε το σύστημα σε μια "εφαρμοσμένη" μορφή:

μετά από το οποίο αρχίζει να σχεδιάζεται ο αλγόριθμος για την επίλυση του προβλήματός μας:

Γνωρίζουμε τις συντεταγμένες των σημείων; Ξέρουμε. Ποσά μπορούμε να βρούμε; Εύκολα. Συνθέτουμε τα πιο απλά σύστημα δύο γραμμικών εξισώσεων με δύο αγνώστους("α" και "μπεχ"). Λύνουμε το σύστημα, για παράδειγμα, Η μέθοδος του Cramer, με αποτέλεσμα ένα ακίνητο σημείο . Ελεγχος επαρκής συνθήκη για εξτρέμ, μπορούμε να επαληθεύσουμε ότι σε αυτό το σημείο η συνάρτηση φτάνει ακριβώς ελάχιστο. Η επαλήθευση συνδέεται με πρόσθετους υπολογισμούς και επομένως θα την αφήσουμε στο παρασκήνιο. (εάν είναι απαραίτητο, μπορείτε να δείτε το πλαίσιο που λείπει). Καταλήγουμε στο τελικό συμπέρασμα:

Λειτουργία ο καλύτερος τρόπος (τουλάχιστον σε σύγκριση με οποιαδήποτε άλλη γραμμική συνάρτηση)φέρνει πιο κοντά τα πειραματικά σημεία . Σε γενικές γραμμές, το γράφημά του περνά όσο το δυνατόν πιο κοντά σε αυτά τα σημεία. Στην παράδοση οικονομετρίακαλείται επίσης η συνάρτηση προσέγγισης που προκύπτει ζευγαρωμένη γραμμική εξίσωση παλινδρόμησης .

Το πρόβλημα που εξετάζεται έχει μεγάλη πρακτική σημασία. Στην κατάσταση με το παράδειγμά μας, η εξίσωση σας επιτρέπει να προβλέψετε τι είδους τζίρο ("yig")θα βρίσκεται στο κατάστημα με τη μία ή την άλλη αξία της περιοχής πώλησης (η μία ή η άλλη σημασία του "x"). Ναι, η πρόβλεψη που προκύπτει θα είναι μόνο μια πρόβλεψη, αλλά σε πολλές περιπτώσεις θα αποδειχθεί αρκετά ακριβής.

Θα αναλύσω μόνο ένα πρόβλημα με "πραγματικούς" αριθμούς, καθώς δεν υπάρχουν δυσκολίες σε αυτό - όλοι οι υπολογισμοί είναι στο επίπεδο του σχολικού προγράμματος σπουδών στις τάξεις 7-8. Στο 95 τοις εκατό των περιπτώσεων, θα σας ζητηθεί να βρείτε μόνο μια γραμμική συνάρτηση, αλλά στο τέλος του άρθρου θα δείξω ότι δεν είναι πιο δύσκολο να βρείτε τις εξισώσεις για τη βέλτιστη υπερβολή, τον εκθέτη και κάποιες άλλες συναρτήσεις.

Στην πραγματικότητα, μένει να διανείμετε τα καλούδια που υποσχέθηκαν - έτσι ώστε να μάθετε πώς να επιλύετε τέτοια παραδείγματα όχι μόνο με ακρίβεια, αλλά και γρήγορα. Μελετάμε προσεκτικά το πρότυπο:

Εργο

Ως αποτέλεσμα της μελέτης της σχέσης μεταξύ δύο δεικτών, προέκυψαν τα ακόλουθα ζεύγη αριθμών:

Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, βρείτε τη γραμμική συνάρτηση που προσεγγίζει καλύτερα την εμπειρική (έμπειρος)δεδομένα. Κάντε ένα σχέδιο στο οποίο, σε ένα καρτεσιανό ορθογώνιο σύστημα συντεταγμένων, σχεδιάστε πειραματικά σημεία και μια γραφική παράσταση της συνάρτησης κατά προσέγγιση . Βρείτε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών τιμών. Μάθετε αν η λειτουργία είναι καλύτερη (όσον αφορά τη μέθοδο των ελαχίστων τετραγώνων)κατά προσέγγιση πειραματικά σημεία.

Σημειώστε ότι οι τιμές "x" είναι φυσικές τιμές και αυτό έχει ένα χαρακτηριστικό νόημα, για το οποίο θα μιλήσω λίγο αργότερα. αλλά, φυσικά, μπορεί να είναι κλασματικές. Επιπλέον, ανάλογα με το περιεχόμενο μιας συγκεκριμένης εργασίας, και οι δύο τιμές "X" και "G" μπορεί να είναι πλήρως ή μερικώς αρνητικές. Λοιπόν, μας έχει δοθεί μια «απρόσωπη» εργασία και την ξεκινάμε απόφαση:

Βρίσκουμε τους συντελεστές της βέλτιστης συνάρτησης ως λύση στο σύστημα:

Για τους σκοπούς μιας πιο συμπαγούς σημειογραφίας, η μεταβλητή «counter» μπορεί να παραλειφθεί, καθώς είναι ήδη σαφές ότι η άθροιση πραγματοποιείται από το 1 έως το .

Είναι πιο βολικό να υπολογίσετε τα απαιτούμενα ποσά σε μορφή πίνακα:


Οι υπολογισμοί μπορούν να πραγματοποιηθούν σε μικροϋπολογιστή, αλλά είναι πολύ καλύτερο να χρησιμοποιείτε το Excel - τόσο πιο γρήγορα όσο και χωρίς σφάλματα. δείτε ένα σύντομο βίντεο:

Έτσι, παίρνουμε το εξής Σύστημα:

Εδώ μπορείτε να πολλαπλασιάσετε τη δεύτερη εξίσωση με 3 και αφαιρέστε τον 2ο από την 1η εξίσωση όρο προς όρο. Αλλά αυτό είναι τύχη - στην πράξη, τα συστήματα συχνά δεν είναι προικισμένα και σε τέτοιες περιπτώσεις εξοικονομεί Η μέθοδος του Cramer:
, οπότε το σύστημα έχει μια μοναδική λύση.

Ας κάνουμε έναν έλεγχο. Καταλαβαίνω ότι δεν θέλω, αλλά γιατί να παραλείψετε λάθη που δεν μπορείτε να τα χάσετε; Αντικαταστήστε τη λύση που βρέθηκε στην αριστερή πλευρά κάθε εξίσωσης του συστήματος:

Λαμβάνονται τα σωστά μέρη των αντίστοιχων εξισώσεων, που σημαίνει ότι το σύστημα έχει λυθεί σωστά.

Έτσι, η επιθυμητή συνάρτηση προσέγγισης: – από όλες τις γραμμικές συναρτήσειςΤα πειραματικά δεδομένα προσεγγίζονται καλύτερα από αυτό.

Διαφορετικός ευθεία εξάρτηση του τζίρου του καταστήματος από την περιοχή του, η διαπιστωθείσα εξάρτηση είναι ΑΝΤΙΣΤΡΟΦΗ (αρχή "όσο περισσότερο - τόσο λιγότερο"), και το γεγονός αυτό αποκαλύπτεται αμέσως από το αρνητικό γωνιακός συντελεστής. Λειτουργία μας πληροφορεί ότι με αύξηση ενός συγκεκριμένου δείκτη κατά 1 μονάδα, η τιμή του εξαρτημένου δείκτη μειώνεται μέση τιμήκατά 0,65 μονάδες. Όπως λένε, όσο υψηλότερη είναι η τιμή του φαγόπυρου, τόσο λιγότερο πωλείται.

Για να σχεδιάσουμε την κατά προσέγγιση συνάρτηση, βρίσκουμε δύο από τις τιμές της:

και εκτελέστε το σχέδιο:


Η κατασκευασμένη γραμμή ονομάζεται γραμμή τάσης (δηλαδή, μια γραμμική γραμμή τάσης, δηλαδή στη γενική περίπτωση, μια τάση δεν είναι απαραίτητα μια ευθεία γραμμή). Όλοι γνωρίζουν την έκφραση «to be in trend», και νομίζω ότι αυτός ο όρος δεν χρειάζεται επιπλέον σχόλια.

Υπολογίστε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών αξιών. Γεωμετρικά, αυτό είναι το άθροισμα των τετραγώνων των μηκών των «βυσσινί» τμημάτων (δύο από τα οποία είναι τόσο μικρά που δεν μπορείτε καν να τα δείτε).

Ας συνοψίσουμε τους υπολογισμούς σε έναν πίνακα:


Μπορούν και πάλι να πραγματοποιηθούν χειροκίνητα, σε περίπτωση που θα δώσω ένα παράδειγμα για το 1ο σημείο:

αλλά είναι πολύ πιο αποτελεσματικό να κάνουμε τον ήδη γνωστό τρόπο:

Ας επαναλάβουμε: ποιο είναι το νόημα του αποτελέσματος;Από όλες τις γραμμικές συναρτήσειςλειτουργία ο εκθέτης είναι ο μικρότερος, δηλαδή είναι η καλύτερη προσέγγιση στην οικογένειά του. Και εδώ, παρεμπιπτόντως, το τελευταίο ερώτημα του προβλήματος δεν είναι τυχαίο: τι θα συμβεί αν η προτεινόμενη εκθετική συνάρτηση θα είναι καλύτερα να κάνουμε κατά προσέγγιση τα πειραματικά σημεία;

Ας βρούμε το αντίστοιχο άθροισμα των τετραγωνικών αποκλίσεων - για να τις ξεχωρίσω, θα τις προσδιορίσω με το γράμμα «έψιλον». Η τεχνική είναι ακριβώς η ίδια:


Και πάλι για κάθε υπολογισμό πυρκαγιάς για τον 1ο βαθμό:

Στο Excel, χρησιμοποιούμε την τυπική συνάρτηση ΛΗΞΗ (Η σύνταξη βρίσκεται στη Βοήθεια του Excel).

συμπέρασμα: , άρα η εκθετική συνάρτηση προσεγγίζει τα πειραματικά σημεία χειρότερα από την ευθεία .

Πρέπει όμως να σημειωθεί εδώ ότι το «χειρότερο» είναι δεν σημαίνει ακόμα, τι συμβαίνει. Τώρα έφτιαξα ένα γράφημα αυτής της εκθετικής συνάρτησης - και περνάει επίσης κοντά στα σημεία - τόσο πολύ που χωρίς αναλυτική μελέτη είναι δύσκολο να πούμε ποια συνάρτηση είναι πιο ακριβής.

Αυτό ολοκληρώνει τη λύση και επιστρέφω στο ερώτημα των φυσικών αξιών του επιχειρήματος. Σε διάφορες μελέτες, κατά κανόνα, οικονομικές ή κοινωνιολογικές, μήνες, χρόνια ή άλλα ίσα χρονικά διαστήματα αριθμούνται με φυσικό «Χ». Σκεφτείτε, για παράδειγμα, ένα τέτοιο πρόβλημα.

Το πρόβλημα είναι να βρούμε τους γραμμικούς συντελεστές εξάρτησης για τους οποίους η συνάρτηση δύο μεταβλητών ένακαι σιπαίρνει τη μικρότερη τιμή. Με δεδομένα δηλαδή ένακαι σιτο άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η λύση του παραδείγματος ανάγεται στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Παραγωγή τύπων εύρεσης συντελεστών.Καταρτίζεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Εύρεση μερικών παραγώγων συναρτήσεων κατά μεταβλητές ένακαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Λύνουμε το προκύπτον σύστημα εξισώσεων με οποιαδήποτε μέθοδο (για παράδειγμα, τη μέθοδο αντικατάστασης ή τη μέθοδο Cramer) και λαμβάνουμε τύπους για την εύρεση των συντελεστών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Με δεδομένα ένακαι σιλειτουργία παίρνει τη μικρότερη τιμή.

Αυτή είναι η όλη μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα , , και την παράμετρο n- ποσότητα πειραματικών δεδομένων. Οι τιμές αυτών των ποσών συνιστάται να υπολογίζονται χωριστά. Συντελεστής σιβρέθηκε μετά τον υπολογισμό ένα.

Ο κύριος τομέας εφαρμογής τέτοιων πολυωνύμων είναι η επεξεργασία πειραματικών δεδομένων (η κατασκευή εμπειρικών τύπων). Το γεγονός είναι ότι το πολυώνυμο παρεμβολής που κατασκευάζεται από τις τιμές της συνάρτησης που λαμβάνεται με τη βοήθεια του πειράματος θα επηρεαστεί έντονα από τον "πειραματικό θόρυβο", επιπλέον, κατά την παρεμβολή, οι κόμβοι παρεμβολής δεν μπορούν να επαναληφθούν, δηλ. δεν μπορείτε να χρησιμοποιήσετε τα αποτελέσματα επαναλαμβανόμενων πειραμάτων υπό τις ίδιες συνθήκες. Το πολυώνυμο ρίζα-μέσο-τετράγωνο εξομαλύνει τον θόρυβο και καθιστά δυνατή τη χρήση των αποτελεσμάτων πολλαπλών πειραμάτων.

Αριθμητική ολοκλήρωση και διαφοροποίηση. Παράδειγμα.

Αριθμητική Ολοκλήρωση- υπολογισμός της τιμής ενός ορισμένου ολοκληρώματος (κατά κανόνα, κατά προσέγγιση). Η αριθμητική ολοκλήρωση νοείται ως ένα σύνολο αριθμητικών μεθόδων για την εύρεση της τιμής ενός συγκεκριμένου ολοκληρώματος.

Αριθμητική διαφοροποίηση– ένα σύνολο μεθόδων για τον υπολογισμό της τιμής της παραγώγου μιας διακριτά δεδομένης συνάρτησης.

Ενσωμάτωση

Διατύπωση του προβλήματος.Μαθηματική δήλωση του προβλήματος: είναι απαραίτητο να βρεθεί η τιμή ενός συγκεκριμένου ολοκληρώματος

όπου τα a, b είναι πεπερασμένα, η f(x) είναι συνεχής στο [а, b].

Κατά την επίλυση πρακτικών προβλημάτων, συμβαίνει συχνά το ολοκλήρωμα να είναι άβολο ή αδύνατο να ληφθεί αναλυτικά: μπορεί να μην εκφράζεται σε στοιχειώδεις συναρτήσεις, το ολοκλήρωμα μπορεί να δοθεί με τη μορφή πίνακα κ.λπ. Σε τέτοιες περιπτώσεις, οι μέθοδοι αριθμητικής ολοκλήρωσης είναι μεταχειρισμένος. Οι μέθοδοι αριθμητικής ολοκλήρωσης χρησιμοποιούν την αντικατάσταση του εμβαδού ενός καμπυλόγραμμου τραπεζοειδούς από ένα πεπερασμένο άθροισμα εμβαδών απλούστερων γεωμετρικών σχημάτων που μπορούν να υπολογιστούν με ακρίβεια. Με αυτή την έννοια μιλάμε για τη χρήση τύπων τετραγωνισμού.

Οι περισσότερες μέθοδοι χρησιμοποιούν την αναπαράσταση του ολοκληρώματος ως πεπερασμένο άθροισμα (τύπος τετραγωνισμού):

Οι τύποι τετραγωνισμού βασίζονται στην ιδέα της αντικατάστασης του γραφήματος του ολοκληρώματος στο διάστημα ολοκλήρωσης με συναρτήσεις απλούστερης μορφής, οι οποίες μπορούν εύκολα να ενσωματωθούν αναλυτικά και, επομένως, να υπολογιστούν εύκολα. Η απλούστερη εργασία κατασκευής τύπων τετραγωνισμού πραγματοποιείται για πολυωνυμικά μαθηματικά μοντέλα.

Τρεις ομάδες μεθόδων μπορούν να διακριθούν:

1. Μέθοδος με διαίρεση του τμήματος ολοκλήρωσης σε ίσα διαστήματα. Η διαίρεση σε διαστήματα γίνεται εκ των προτέρων, συνήθως τα διαστήματα επιλέγονται ίσα (για να είναι ευκολότερος ο υπολογισμός της συνάρτησης στα άκρα των διαστημάτων). Υπολογίστε εμβαδά και αθροίστε τα (μέθοδοι ορθογωνίων, τραπεζοειδές, Simpson).

2. Μέθοδοι κατάτμησης του τμήματος ολοκλήρωσης με χρήση ειδικών σημείων (μέθοδος Gauss).

3. Υπολογισμός ολοκληρωμάτων με χρήση τυχαίων αριθμών (μέθοδος Monte Carlo).

Μέθοδος ορθογωνίου.Αφήστε τη συνάρτηση (σχέδιο) να ενσωματωθεί αριθμητικά στο τμήμα . Χωρίζουμε το τμήμα σε Ν ίσα διαστήματα. Το εμβαδόν καθενός από τα N καμπυλόγραμμα τραπεζοειδή μπορεί να αντικατασταθεί από το εμβαδόν ενός ορθογωνίου.

Το πλάτος όλων των ορθογωνίων είναι το ίδιο και ίσο με:

Ως επιλογή του ύψους των ορθογωνίων, μπορείτε να επιλέξετε την τιμή της συνάρτησης στο αριστερό περίγραμμα. Σε αυτή την περίπτωση, το ύψος του πρώτου ορθογωνίου θα είναι f(a), του δεύτερου θα είναι f(x 1),…, N-f(N-1).

Αν πάρουμε την τιμή της συνάρτησης στο δεξί περίγραμμα ως επιλογή του ύψους του ορθογωνίου, τότε στην περίπτωση αυτή το ύψος του πρώτου ορθογωνίου θα είναι f (x 1), του δεύτερου - f (x 2), . .., N - f (x N).

Όπως φαίνεται, σε αυτή την περίπτωση ένας από τους τύπους δίνει μια προσέγγιση στο ολοκλήρωμα με μια περίσσεια και ο δεύτερος με μια έλλειψη. Υπάρχει ένας άλλος τρόπος - να χρησιμοποιήσετε την τιμή της συνάρτησης στη μέση του τμήματος ολοκλήρωσης για προσέγγιση:

Εκτίμηση του απόλυτου σφάλματος της μεθόδου των ορθογωνίων (μέση)

Εκτίμηση του απόλυτου σφάλματος των μεθόδων των αριστερών και δεξιών ορθογωνίων.

Παράδειγμα.Υπολογίστε για ολόκληρο το διάστημα και διαιρώντας το διάστημα σε τέσσερις ενότητες

Απόφαση.Ο αναλυτικός υπολογισμός αυτού του ολοκληρώματος δίνει I=arctg(1)–arctg(0)=0,7853981634. Στην περίπτωσή μας:

1) h = 1; xo = 0; x1 = 1;

2) h = 0,25 (1/4); x0 = 0; x1 = 0,25; x2 = 0,5; x3 = 0,75; x4 = 1;

Υπολογίζουμε με τη μέθοδο των αριστερών ορθογωνίων:

Υπολογίζουμε με τη μέθοδο των ορθογωνίων ορθογωνίων:

Υπολογίστε με τη μέθοδο των μέσων ορθογωνίων:

Τραπεζοειδής μέθοδος.Η χρήση ενός πολυωνύμου πρώτου βαθμού για παρεμβολή (μια ευθεία γραμμή που διασχίζεται από δύο σημεία) οδηγεί στον τραπεζοειδή τύπο. Τα άκρα του τμήματος ολοκλήρωσης λαμβάνονται ως κόμβοι παρεμβολής. Έτσι, το καμπυλόγραμμο τραπεζοειδές αντικαθίσταται από ένα συνηθισμένο τραπεζοειδές, το εμβαδόν του οποίου μπορεί να βρεθεί ως το γινόμενο του μισού του αθροίσματος των βάσεων και του ύψους

Στην περίπτωση των N τμημάτων ολοκλήρωσης για όλους τους κόμβους, εκτός από τα ακραία σημεία του τμήματος, η τιμή της συνάρτησης θα συμπεριληφθεί στο συνολικό άθροισμα δύο φορές (καθώς τα γειτονικά τραπεζοειδή έχουν μια κοινή πλευρά)

Ο τραπεζοειδής τύπος μπορεί να ληφθεί λαμβάνοντας το μισό άθροισμα των τύπων ορθογωνίου κατά μήκος της δεξιάς και της αριστερής ακμής του τμήματος:

Έλεγχος της σταθερότητας του διαλύματος.Κατά κανόνα, τόσο μικρότερο είναι το μήκος κάθε διαστήματος, δηλ. Όσο μεγαλύτερος είναι ο αριθμός αυτών των διαστημάτων, τόσο μικρότερη είναι η διαφορά μεταξύ των κατά προσέγγιση και των ακριβών τιμών του ολοκληρώματος. Αυτό ισχύει για τις περισσότερες λειτουργίες. Στην τραπεζοειδή μέθοδο, το σφάλμα στον υπολογισμό του ολοκληρώματος ϭ είναι περίπου ανάλογο με το τετράγωνο του βήματος ολοκλήρωσης (ϭ ~ h 2).Έτσι, για να υπολογιστεί το ολοκλήρωμα κάποιας συνάρτησης στα όρια a, b, είναι απαραίτητο να διαιρεθεί το τμήμα σε διαστήματα N 0 και βρείτε το άθροισμα των εμβαδών του τραπεζοειδούς. Στη συνέχεια, πρέπει να αυξήσετε τον αριθμό των διαστημάτων N 1, να υπολογίσετε ξανά το άθροισμα του τραπεζοειδούς και να συγκρίνετε την τιμή που προκύπτει με το προηγούμενο αποτέλεσμα. Αυτό θα πρέπει να επαναληφθεί μέχρι το (N i) έως ότου επιτευχθεί η καθορισμένη ακρίβεια του αποτελέσματος (κριτήριο σύγκλισης).

Για τις μεθόδους ορθογωνίου και τραπεζοειδούς, συνήθως σε κάθε βήμα επανάληψης, ο αριθμός των διαστημάτων αυξάνεται κατά 2 (N i +1 =2N i).

Κριτήριο σύγκλισης:

Το κύριο πλεονέκτημα του τραπεζοειδούς κανόνα είναι η απλότητά του. Ωστόσο, εάν η ενσωμάτωση απαιτεί υψηλή ακρίβεια, αυτή η μέθοδος μπορεί να απαιτεί πάρα πολλές επαναλήψεις.

Απόλυτο λάθος της τραπεζοειδούς μεθόδουβαθμολογήθηκε ως
.

Παράδειγμα.Υπολογίστε ένα περίπου ορισμένο ολοκλήρωμα χρησιμοποιώντας τον τραπεζοειδή τύπο.

α) Διαίρεση του τμήματος ολοκλήρωσης σε 3 μέρη.
β) Διαίρεση του τμήματος ολοκλήρωσης σε 5 μέρη.

Απόφαση:
α) Κατά συνθήκη, το τμήμα ολοκλήρωσης πρέπει να χωριστεί σε 3 μέρη, δηλαδή.
Υπολογίστε το μήκος κάθε τμήματος του διαμερίσματος: .

Έτσι, η γενική φόρμουλα των τραπεζοειδών μειώνεται σε ένα ευχάριστο μέγεθος:

Τελικά:

Υπενθυμίζω ότι η τιμή που προκύπτει είναι μια κατά προσέγγιση τιμή της περιοχής.

β) Χωρίζουμε το τμήμα ολοκλήρωσης σε 5 ίσα μέρη, δηλαδή . αυξάνοντας τον αριθμό των τμημάτων, αυξάνουμε την ακρίβεια των υπολογισμών.

Αν , τότε ο τραπεζοειδής τύπος έχει την ακόλουθη μορφή:

Ας βρούμε το βήμα κατάτμησης:
, δηλαδή το μήκος κάθε ενδιάμεσου τμήματος είναι 0,6.

Όταν τελειώνετε την εργασία, είναι βολικό να συντάσσετε όλους τους υπολογισμούς με έναν πίνακα υπολογισμών:

Στην πρώτη γραμμή γράφουμε "μετρητής"

Σαν άποτέλεσμα:

Λοιπόν, υπάρχει πραγματικά μια διευκρίνιση, και μάλιστα σοβαρή!
Αν για 3 τμήματα του διαμερίσματος , τότε για 5 τμήματα . Εάν πάρετε ακόμη περισσότερο τμήμα => θα είναι ακόμη πιο ακριβές.

Φόρμουλα Simpson.Ο τραπεζοειδής τύπος δίνει ένα αποτέλεσμα που εξαρτάται σε μεγάλο βαθμό από το μέγεθος του βήματος h, το οποίο επηρεάζει την ακρίβεια του υπολογισμού ενός ορισμένου ολοκληρώματος, ειδικά σε περιπτώσεις όπου η συνάρτηση είναι μη μονοτονική. Κάποιος μπορεί να υποθέσει αύξηση στην ακρίβεια των υπολογισμών εάν, αντί για τμήματα ευθειών που αντικαθιστούν τα καμπυλόγραμμα τμήματα της γραφικής παράστασης της συνάρτησης f(x), χρησιμοποιήσουμε, για παράδειγμα, τμήματα παραβολών που δίνονται μέσω τριών γειτονικών σημείων του γραφήματος . Μια παρόμοια γεωμετρική ερμηνεία βασίζεται στη μέθοδο του Simpson για τον υπολογισμό του ορισμένου ολοκληρώματος. Ολόκληρο το διάστημα ολοκλήρωσης a,b χωρίζεται σε N τμήματα, το μήκος του τμήματος θα είναι επίσης ίσο με h=(b-a)/N.

Ο τύπος του Simpson είναι:

υπολειπόμενος όρος

Με την αύξηση του μήκους των τμημάτων, η ακρίβεια του τύπου μειώνεται, επομένως, για να αυξηθεί η ακρίβεια, χρησιμοποιείται ο σύνθετος τύπος Simpson. Ολόκληρο το διάστημα ολοκλήρωσης χωρίζεται σε ζυγό αριθμό πανομοιότυπων τμημάτων N, το μήκος του τμήματος θα είναι επίσης ίσο με h=(b-a)/N. Ο σύνθετος τύπος Simpson είναι:

Στον τύπο, οι εκφράσεις σε αγκύλες είναι τα αθροίσματα των τιμών του ολοκληρώματος, αντίστοιχα, στα άκρα των περιττών και ζυγών εσωτερικών τμημάτων.

Το υπόλοιπο του τύπου του Simpson είναι ήδη ανάλογο με την τέταρτη δύναμη του βήματος:

Παράδειγμα:Υπολογίστε το ολοκλήρωμα χρησιμοποιώντας τον κανόνα του Simpson. (Ακριβής λύση - 0,2)

Μέθοδος Gauss

Τετραγωνικός τύπος του Gauss. Η βασική αρχή των τύπων τετραγωνισμού της δεύτερης ποικιλίας είναι ορατή από το σχήμα 1.12: είναι απαραίτητο να τοποθετηθούν τα σημεία με τέτοιο τρόπο Χ 0 και Χ 1 μέσα στο τμήμα [ ένα;σι] ώστε τα εμβαδά των «τριγώνων» συνολικά να είναι ίσα με τα εμβαδά του «τμήματος». Όταν χρησιμοποιείται ο τύπος Gauss, το αρχικό τμήμα [ ένα;σιΤο ] μειώνεται στο διάστημα [-1;1] αλλάζοντας τη μεταβλητή Χστο

0.5∙(σιένα)∙t+ 0.5∙(σι + ένα).

Τότε , που .

Αυτή η αντικατάσταση είναι δυνατή εάν ένακαι σιείναι πεπερασμένα και η συνάρτηση φά(Χ) είναι συνεχής στις [ ένα;σι]. τύπος Gauss για nσημεία x i, Εγώ=0,1,..,n-1 μέσα στο τμήμα [ ένα;σι]:

, (1.27)

που t iκαι A iγια διάφορα nδίνονται σε βιβλία αναφοράς. Για παράδειγμα, όταν n=2 ΕΝΑ 0 =ΕΝΑ 1=1; στο n=3: t 0 =t 2" 0,775, t 1 =0, ΕΝΑ 0 2" 0,555, ΕΝΑ 1" 0,889.

Τετραγωνικός τύπος του Gauss

που λαμβάνεται με συνάρτηση βάρους ίση με ένα p(x)= 1 και κόμβοι x i, που είναι οι ρίζες των πολυωνύμων Legendre

Πιθανότητα A iυπολογίζεται εύκολα με τύπους

Εγώ=0,1,2,...n.

Οι τιμές των κόμβων και των συντελεστών για n=2,3,4,5 δίνονται στον πίνακα

Σειρά Κόμβοι Πιθανότητα
n=2 x 1=0 x 0 =-x2=0.7745966692 Α'1=8/9 Α 0 = Α 2=5/9
n=3 x 2 =-x 1=0.3399810436 x 3 =-x0=0.8611363116 Α 1 = Α 2=0.6521451549 Α 0 = Α 3=0.6521451549
n=4 Χ 2 = 0 Χ 3 = -Χ 1 = 0.5384693101 Χ 4 =-Χ 0 =0.9061798459 ΕΝΑ 0 =0.568888899 ΕΝΑ 3 =ΕΝΑ 1 =0.4786286705 ΕΝΑ 0 =ΕΝΑ 4 =0.2869268851
n=5 Χ 5 = -Χ 0 =0.9324695142 Χ 4 = -Χ 1 =0.6612093865 Χ 3 = -Χ 2 =0.2386191861 ΕΝΑ 5 0 =0.1713244924 ΕΝΑ 4 1 =0.3607615730 ΕΝΑ 3 2 =0.4679139346

Παράδειγμα.Υπολογίστε την τιμή χρησιμοποιώντας τον τύπο Gauss για n=2:

Ακριβής αξία: .

Ο αλγόριθμος για τον υπολογισμό του ολοκληρώματος σύμφωνα με τον τύπο του Gauss δεν προβλέπει τον διπλασιασμό του αριθμού των μικροτμημάτων, αλλά την αύξηση του αριθμού των τεταγμένων κατά 1 και τη σύγκριση των λαμβανόμενων τιμών του ολοκληρώματος. Το πλεονέκτημα του τύπου Gauss είναι η υψηλή ακρίβεια με σχετικά μικρό αριθμό τεταγμένων. Μειονεκτήματα: άβολο για χειροκίνητους υπολογισμούς. πρέπει να αποθηκευτεί στη μνήμη του υπολογιστή t i, A iγια διάφορα n.

Το σφάλμα του τύπου τετραγωνισμού Gauss στο τμήμα θα είναι ταυτόχρονα. Για τον τύπο του υπολοίπου όρου θα είναι όπου ο συντελεστής α Νμειώνεται γρήγορα με την ανάπτυξη Ν. Εδώ

Οι τύποι Gauss παρέχουν υψηλή ακρίβεια ακόμη και με μικρό αριθμό κόμβων (από 4 έως 10) Σε αυτή την περίπτωση, σε πρακτικούς υπολογισμούς, ο αριθμός των κόμβων κυμαίνεται από αρκετές εκατοντάδες έως αρκετές χιλιάδες. Σημειώνουμε επίσης ότι τα βάρη των τεταρτημορίων Gauss είναι πάντα θετικά, γεγονός που εξασφαλίζει τη σταθερότητα του αλγορίθμου για τον υπολογισμό των αθροισμάτων