Cvartetul Anscombe

Cvartetul lui Anscombe  este format din patru seturi de date numerice ale căror proprietăți statistice simple sunt identice, dar graficele lor sunt semnificativ diferite. Fiecare set este format din 11 perechi de numere. Cvartetul a fost alcătuit în 1973 de matematicianul englez F. J. Anscombe pentru a ilustra importanța graficului pentru analiza statistică și impactul valorilor aberante asupra proprietăților întregului set de date.

Toate seturile au următoarele proprietăți:

Caracteristică Sens
Medie variabilă 9,0
Varianta unei variabile 10.0
Medie variabilă 7.5
Varianta unei variabile 3,75
Corelația dintre variabile și 0,816
Regresia liniară directă
Coeficientul de determinare a regresiei liniare 0,67

Secvențele în sine sunt prezentate mai jos. Valoarea este aceeași pentru primele trei secvențe.

Cvartetul Anscombe
eu II III IV
X y X y X y X y
10.0 8.04 10.0 9.14 10.0 7.46 8.0 6,58
8.0 6,95 8.0 8.14 8.0 6,77 8.0 5,76
13.0 7,58 13.0 8,74 13.0 12.74 8.0 7,71
9,0 8,81 9,0 8,77 9,0 7.11 8.0 8,84
11.0 8.33 11.0 9.26 11.0 7,81 8.0 8.47
14.0 9,96 14.0 8.10 14.0 8,84 8.0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25
4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50
12.0 10.84 12.0 9.13 12.0 8.15 8.0 5,56
7.0 4,82 7.0 7.26 7.0 6.42 8.0 7,91
5.0 5,68 5.0 4,74 5.0 5,73 8.0 6,89

Vezi și

Link -uri