Cvartetul lui Anscombe este format din patru seturi de date numerice ale căror proprietăți statistice simple sunt identice, dar graficele lor sunt semnificativ diferite. Fiecare set este format din 11 perechi de numere. Cvartetul a fost alcătuit în 1973 de matematicianul englez F. J. Anscombe pentru a ilustra importanța graficului pentru analiza statistică și impactul valorilor aberante asupra proprietăților întregului set de date.
Toate seturile au următoarele proprietăți:
Caracteristică | Sens |
---|---|
Medie variabilă | 9,0 |
Varianta unei variabile | 10.0 |
Medie variabilă | 7.5 |
Varianta unei variabile | 3,75 |
Corelația dintre variabile și | 0,816 |
Regresia liniară directă | |
Coeficientul de determinare a regresiei liniare | 0,67 |
Secvențele în sine sunt prezentate mai jos. Valoarea este aceeași pentru primele trei secvențe.
eu | II | III | IV | ||||
---|---|---|---|---|---|---|---|
X | y | X | y | X | y | X | y |
10.0 | 8.04 | 10.0 | 9.14 | 10.0 | 7.46 | 8.0 | 6,58 |
8.0 | 6,95 | 8.0 | 8.14 | 8.0 | 6,77 | 8.0 | 5,76 |
13.0 | 7,58 | 13.0 | 8,74 | 13.0 | 12.74 | 8.0 | 7,71 |
9,0 | 8,81 | 9,0 | 8,77 | 9,0 | 7.11 | 8.0 | 8,84 |
11.0 | 8.33 | 11.0 | 9.26 | 11.0 | 7,81 | 8.0 | 8.47 |
14.0 | 9,96 | 14.0 | 8.10 | 14.0 | 8,84 | 8.0 | 7.04 |
6.0 | 7.24 | 6.0 | 6.13 | 6.0 | 6.08 | 8.0 | 5.25 |
4.0 | 4.26 | 4.0 | 3.10 | 4.0 | 5.39 | 19.0 | 12.50 |
12.0 | 10.84 | 12.0 | 9.13 | 12.0 | 8.15 | 8.0 | 5,56 |
7.0 | 4,82 | 7.0 | 7.26 | 7.0 | 6.42 | 8.0 | 7,91 |
5.0 | 5,68 | 5.0 | 4,74 | 5.0 | 5,73 | 8.0 | 6,89 |