Η κανονική κατανομή (γνωστή και ως γκαουσιανή κατανομή) αναφέρεται σε συνεχείς μεταβλητές αποτελώντας μία συνεχή συνάρτηση πυκνότητας πιθανότητας. Χρησιμοποιείται ως μία πρώτη προσέγγιση για να περιγραφούν τυχαίες μεταβλητές πραγματικών τιμών, οι οποίες τείνουν να συγκεντρώνονται γύρω από μια μέση τιμή. Η κανονική κατανομή αποτελεί την πιο σημαντική κατανομή της στατιστικής μεθοδολογίας για τους εξής βασικούς λόγους:
- Την κανονική κατανομή ακολουθούν είτε με ακρίβεια είτε με μεγάλη προσέγγιση τα περισσότερα συνεχή φαινόμενα.
- Πολλές ασυνεχείς κατανομές πιθανοτήτων μπορούν να προσεγγιστούν μέσω της κανονικής κατανομής. Για παράδειγμα πολλά πληθυσμιακά χαρακτηριστικά, όπως το ύψος, το βάρος η βαθμολογία σε διαγώνισμα, κ.λπ.
- Η κανονική κατανομή αποτελεί σύμφωνα με το κεντρικό οριακό θεώρημα (το άθροισμα ενός ικανοποιητικά μεγάλου αριθμού ανεξάρτητων και ισόνομων τυχαίων μεταβλητών προσεγγίζεται από την κανονική κατανομή) τη βάση της στατιστικής συμπερασματολογίας ή επαγωγικής στατιστικής.
- Τυχαία σφάλματα που εμφανίζονται σε διάφορες μετρήσεις έχουν κανονική κατανομή. Γι’ αυτό το λόγο η Κανονική κατανομή αναφέρεται πολλές φορές και ως κατανομή σφαλμάτων.
Η γραφική παράσταση της σχετιζόμενης συνάρτησης πυκνότητας πιθανότητας έχει σχήμα «καμπάνας», και είναι γνωστή ως γκαουσιανή συνάρτηση ή κωδωνοειδής καμπύλη:
Θα εξηγήσουμε παρακάτω τι είναι η κωδωνοειδής καμπύλη (κατανομή Gauss).
Εάν πάρουμε ένα μεγάλο και σωστά επιλεγμένο δείγμα πληθυσμού και το μετρήσουμε ως προς διάφορες παραμέτρους, όπως το ύψος, για παράδειγμα, των ενηλίκων Ελλήνων, ή το βάρος των Ελληνίδων (και λέγοντας σωστά επιλεγμένο, εννοούμε ότι δεν θα μετρήσουμε μόνο παίκτες του μπάσκετ – μπολ ή νεαρές κοπέλες που προσέχουν τη σιλουέτα τους) θα παρατηρήσουμε ότι οι περισσότερες μετρήσεις μας συγκεντρώνονται γύρω από μια τιμή, λ.χ. τα 1,75μ. ύψους και τα 55 κιλά βάρους, αντιστοίχως. Όσο περισσότερο απομακρυνόμαστε από αυτές τις τιμές, είτε προς τα πάνω, είτε προς τα κάτω, όλο και λιγότερα άτομα του δείγματός μας θα δίνουν τις πιο ακραίες μετρήσεις. Λίγοι Έλληνες έχουν ύψος πάνω από 1,90μ. και ακόμη λιγότεροι είναι οι δίμετροι. Επίσης, λίγες ενήλικες Ελληνίδες ζυγίζουν κάτω από 45 κιλά και ακόμη λιγότερες κάτω από 40. Η απόκλιση αυτή από τη μέση τιμή δίνει όλο και λιγότερες ακραίες τιμές με έναν ομαλό τρόπο, με την προϋπόθεση πάντα ότι το δείγμα μας είναι σωστά επιλεγμένο και ικανοποιητικού μεγέθους. (Φυσικά, αναφερόμαστε σε ορισμένα παραδείγματα. Δεν είναι πάντα απαραίτητο να συμβαίνει το ίδιο. Έτσι λ.χ. στην κατανομή του βαθμού σε “κακές χρονιές” των πανελληνίων εξετάσεων, οι περισσότεροι συγκεντρώνονται στο κάτω άκρο και αρκετοί στο άνω – όσοι κράτησαν το βαθμό τους από την προηγούμενη, “εύκολη”, ίσως, χρονιά.)

Αυτή η “κανονική μείωση”, δημιουργεί τη λεγόμενη καμπύλη κανονικής κατανομής ή καμπύλη του Gauss, από το όνομα του μαθηματικού που ανέπτυξε τη σχετική θεωρία, και έχει το σχήμα της καμπάνας (κώδωνα). Η ίδια λοιπόν κωδωνοειδής καμπύλη σχηματίζεται και όταν κατανέμουμε το γενικό πληθυσμό (και όχι αποκλειστικά π.χ. τα μέλη της MENSA, της παγκόσμιας οργάνωσης των “έξυπνων” ή άτομα με το σύνδρομο Down), σύμφωνα π.χ. με το νοητικό πηλίκο.
Όπως παρατηρείτε, στην καμπύλη που παραθέτουμε, αυτή ανυψώνεται όσο πλησιάζουμε στο μέσον, είτε από δεξιά, είτε από αριστερά, ακριβώς γιατί οι περισσότεροι άνθρωποι εμπίπτουν χονδρικά στον μέσο όρο. Αντιθέτως, τα άκρα είναι πεπλατυσμένα, διότι λίγοι είναι οι εξαιρετικά ευφυείς κι επίσης λίγα είναι τα καθυστερημένα άτομα, σε σύγκριση με το σύνολο του πληθυσμού. Το πόσο ύψος θα έχει η καμπύλη στο μέσον και το πόσο χαμηλή θα είναι στα άκρα, δηλαδή η κύρτωσή της (που αποτελεί ξεχωριστό στατιστικό δείκτη), εξαρτάται και από το πόσο κανονική είναι η κατανομή.

Η κωδωνοειδής καμπύλη (κατανομή Gauss). Όπως φαίνεται, τα περισσότερα άτομα, συγκεντρώνονται γύρω από τη μέση τιμή, που για το I.Q. είναι το 100. Όσο πιο πολύ αποκλίνουμε από αυτή, τόσο λιγοστεύουν οι άνθρωποι που ανήκουν στις όλο και πιο ακραίες κατηγορίες, καθυστερημένοι ή ευφυείς.
Μία από τις πρώτες εφαρμογές της κανονικής κατανομής, έγινε το 1809 από τον μεγάλο Γερμανό Μαθηματικό Carl F. Gauss, ο οποίος διαπίστωσε ότι τα σφάλματα που γίνονται σε αστρονομικές παρατηρήσεις μπορούν να περιγραφούν ικανοποιητικά από την κανονική κατανομή. Στη συνέχεια, διαπιστώθηκε επίσης, ότι τα τυχαία σφάλματα (όχι τα συστηματικά) που εμφανίζονται σε διάφορες μετρήσεις ακολουθούν με ικανοποιητική προσέγγιση κανονική κατανομή. Για το λόγο αυτό, η κανονική κατανομή ονομάζεται και κατανομή των σφαλμάτων (law of errors). Επίσης, είναι γνωστή ως κατανομή του Gauss (Gaussian distribution), για τη μεγάλη συνεισφορά του Gauss στην ανάδειξη των ιδιοτήτων και της σημασίας της. Τέλος, ως πρόσθετη σχετική πληροφορία , αναφέρουμε ότι στο γερμανικό χαρτονόμισμα των δέκα μάρκων υπήρχαν, φωτογραφία του Gauss, η κανονική καμπύλη και ο μαθηματικός τύπος της!

Αυξάνοντας το μέγεθος του δείγματος και κατασκευάζοντας το ιστόγραμμα με ολοένα και μικρότερου πλάτους κλάσεις ( c → 0 ), το αντίστοιχο πολύγωνο προσεγγίζει μια ομαλή-λεία καμπύλη. Η κανονική καμπύλη έχει κωδωνοειδή μορφή, είναι συμμετρική και οι «ουρές» της πλησιάζουν τον οριζόντιο άξονα ομαλά (ασυμπτωτικά). Η μέση τιμή και η διάμεσος ταυτίζονται. Επίσης, η κορυφή ταυτίζεται με τη μέση τιμή και τη διάμεσο. Έτσι, η περιοχή που παρουσιάζει τη μεγαλύτερη πυκνότητα, βρίσκεται και αυτή στο μέσο της κατανομής. Δηλαδή, όταν οι τιμές μιας μεταβλητής είναι κανονικά κατανεμημένες, τότε γύρω από τη μέση τιμή τους υπάρχουν σχετικά πολλές τιμές ενώ μακριά από τη μέση τιμή βρίσκονται σχετικά λίγες τιμές.

Τα εξαιρετικά γεγονότα και η καμπύλη του Gauss
Ο Carl Friedrich Gauss (1777-1856) ήταν Γερμανός μαθηματικός με σημαντικές ανακαλύψεις σε πολλά πεδία των μαθηματικών και της επιστήμης γενικότερα. Τα εξαιρετικά γεγονότα όπως είναι οι επιδημίες, οι τυφώνες και κυκλώνες και οι χρηματοπιστωτικές κρίσεις εάν θεωρηθούν μεμονωμένα, συνήθως είναι σπάνια, μέσα στα συμφραζόμενα των μεμονωμένων αυτών φαινομένων. Αλλά εάν πλατύνουμε τον ορίζοντά μας και τα θεωρήσουμε συνολικά, τότε η πιθανότητά τους για να συμβεί κάποιο από αυτά μεγαλώνει αρκετά.
Αυτό περιγράφεται λεπτομερειακά από τον αναλυτή Nassim Nicholas Taleb στο βιβλίο «Ο Μαύρος Κύκνος» (The Black Swan) που υπάρχει και στα ελληνικά. Η καμπύλη του Gauss (γνωστότερη και ως κωδωνοειδής καμπύλη ή και κανονική κατανομή) προαπαιτεί για την ορθή χρήση της μεγάλα και σωστά επιλεγμένα δείγματα πληθυσμού και τη λεπτομερειακή τήρηση όλων των αναγκαίων παραμέτρων και προδιαγραφών. Με τη σχολαστική τήρηση όλων των απαραίτητων προϋποθέσεων βλέπουμε ότι οι περισσότερες μετρήσεις συγκεντρώνονται γύρω από μια τιμή και όσο απομακρυνόμαστε από αυτές τις τιμές, προς τα πάνω ή προς τα κάτω, τόσο και λιγότερες μετρήσεις θα ανήκουν σε αυτές τις απομακρυσμένες τιμές. Βέβαια, όταν οι τιμές συγκεντρώνονται στο κέντρο της κατανομής, τότε έχουμε μια λεπτόκυρτη (ή συμμετρική) κατανομή. Οταν έχουμε μικρό βαθμό συγκέντρωσης γύρω από το κέντρο της κατανομής, τότε έχουμε την πλατύκυρτη κατανομή.

Ετσι, για παράδειγμα, για τον τυφώνα «Κατρίνα» που ισοπέδωσε τη Νέα Ορλεάνη στις ΗΠΑ το 2005, σαρώνοντας το ανάχωμα που είχε κατασκευάσει ο στρατός, ο υπεύθυνος του σώματος του Μηχανικού είχε δηλώσει ότι «για το ανάχωμα αυτό είχαμε υπολογίσει πως είχε μια πιθανότητα της τάξης του 99,5% ότι θα κρατούσε 200 με 300 χρόνια». Αλλά δεν έλαβε καθόλου υπόψη του ότι τα μεμονωμένα και εξαιρετικά φαινόμενα δεν εντάσσονται σε αυτή την ερμηνεία.
Η κωδωνοειδής καμπύλη είναι σε θέση –με αρκετή ευστοχία– να προβλέψει τη συμπεριφορά ενός συστήματος που αποτελείται από έναν μεγάλο αριθμό συμβάντων μικρής κλίμακας, ανεξάρτητων μεταξύ τους, όπου το ένα δεν επηρεάζει καθόλου όλα τα άλλα. Το Μηχανικό των ΗΠΑ βασίστηκε σε μια κωδωνοειδή καμπύλη που η κορυφή της είχε κατέβει αρκετά περισσότερο προς τα κάτω από την καμπύλη Gauss, μετατρέποντας με αυτόν τον τρόπο την πιθανότητα 0,5% σε 5% και τα 200 έως 300 χρόνια αντοχής των αναχωμάτων σε περίπου 60 χρόνια.
Εξαιρετική ανάλυση και πληροφορίες
Ν. Μαρσέλλος , Μάιος 2024