· 

Skewness et Kurtosis en termes simples

L’asymétrie (skewness) et l’aplatissement (kurtosis) sont des mesures essentielles pour décrire la forme d’une distribution de données. Bien qu’ils soient tous deux des moments (*) de la distribution, ils ont des rôles différents et capturent des aspects uniques du comportement des données.

 

L'une des principales différences réside dans la puissance à laquelle les écarts par rapport à la moyenne sont élevés : l’asymétrie utilise la puissance 3, tandis que l’aplatissement utilise la puissance 4.

 

La skewness mesure l’asymétrie d’une distribution autour de sa moyenne. Elle indique si les données sont décalées vers la gauche (avec une queue gauche plus longue) ou vers la droite (avec une queue droite plus longue). Elle est calculée en prenant les écarts de chaque point de données par rapport à la moyenne, en les élevant à la puissance 3, puis en prenant la moyenne de ces écarts "cubés".

  • Formule de l’asymétrie ou skewness = (1/N) * Σ((xi - μ)^3 / σ^3)

  • N : le nombre de points de données
  • xi : chaque point de données
  • μ : la moyenne des données
  • σ : l'écart type

La puissance 3 permet de tenir compte de la direction de l’asymétrie. Les écarts positifs (supérieurs à la moyenne) restent positifs lorsqu’ils sont cubés, et les écarts négatifs (inférieurs à la moyenne) restent négatifs. Cet aspect directionnel est crucial, car il indique si une distribution penche à droite (asymétrie positive) ou à gauche (asymétrie négative).

 

En élevant les écarts à la puissance 3, l’asymétrie accorde plus de poids aux écarts importants. Cela garantit que les écarts significatifs, notamment ceux dans les queues de la distribution, influencent davantage la mesure de l’asymétrie.

 

La kurtosis mesure quant à elle la "proéminence" de la pointe de la distribution et le poids de ses queues. Elle indique si une distribution présente plus ou moins de valeurs extrêmes (queues lourdes ou légères) par rapport à une distribution normale. L’aplatissement est calculé en élevant les écarts à la puissance 4 et en prenant la moyenne.

  • Formule de l’aplatissement ou kurtosis = (1/N) * Σ((xi - μ)^4 / σ^4)

La puissance 4 est utilisée car elle amplifie beaucoup plus l’effet des écarts extrêmes que la puissance 3. Comme l’aplatissement est concerné par la présence d’outliers ou de valeurs extrêmes, cette puissance garantit que ces écarts importants ont un impact disproportionné sur la mesure.

 

Contrairement à l’asymétrie, l’aplatissement ne s’intéresse pas à la direction (gauche ou droite) des écarts. La puissance 4 rend tous les écarts positifs, se concentrant uniquement sur leur ampleur.

 
(*) Les moments sont des valeurs numériques qui décrivent la forme d’une distribution, calculées en élevant les écarts par rapport à une valeur de référence, généralement la moyenne, à différentes puissances.

Skewness et Kurtosis en termes simples
Skewness et Kurtosis en termes simples

Écrire commentaire

Commentaires: 0