Définition de l'analyse de la variance (ANOVA)

Qu’est-ce que l’analyse de variance (ANOVA) ?

L’analyse de la variance (ANOVA) est un outil d’analyse utilisé en statistique qui divise une variabilité agrégée observée à l’intérieur d’un ensemble de données en deux parties : les facteurs systématiques et les facteurs aléatoires. Les facteurs systématiques ont une influence statistique sur l’ensemble de données donné, tandis que les facteurs aléatoires n’en ont pas. Les analystes utilisent le test ANOVA pour déterminer l’influence que les variables indépendantes ont sur la variable dépendante dans une étude de régression.

Les méthodes de test t et z développées au 20e siècle ont été utilisées pour l’analyse statistique jusqu’en 1918, lorsque Ronald Fisher a créé la méthode d’analyse de la variance. L’ANOVA est également appelée l’analyse de variance de Fisher, et elle est l’extension des tests t et z. Le terme est devenu connu en 1925, après avoir été utilisé dans le livre de Fisher « Statistical Methods for Research Workers », en psychologie expérimentale, puis étendu à des sujets plus complexes.

La formule de l’ANOVA est :

\begin{matrix} F=MSTMSE \\ où : \\ F=Coefficient ANOVA \\ MST=Somme moyenne des carrés due au traitement \\ MSE=Somme moyenne \end{matrix}

des

&text{F} = frac{ text{MST} }{ texte{MSE} } &textbf{where:} &text{F} = text{ANOVA coefficient} &text{MST} = text{Somme moyenne des carrés due au traitement} &text{MSE} = text{Somme moyenne des carrés due à l’erreur} end{aligned}

$F= \frac{M}{MSE}$ $ST$ $où : F=Coefficient ANOVA MST=Somme moyenne des carrés due au traitement MSE=Somme moyenne des carrés due à une erreur$

Que révèle l’analyse de la variance ?

Le test ANOVA est la première étape de l’analyse des facteurs qui affectent un ensemble de données donné. Une fois le test terminé, un analyste effectue des tests supplémentaires sur les facteurs méthodiques qui contribuent de manière mesurable à l’incohérence de l’ensemble de données. L’analyste utilise les résultats du test ANOVA dans un f-test pour générer des données supplémentaires qui s’alignent sur les modèles de régression proposés.

vous pouvez intéressé: Définition du marché haussier

Le test ANOVA permet de comparer plus de deux groupes en même temps afin de déterminer s’il existe une relation entre eux. Le résultat de la formule d’ANOVA, la statistique F (également appelée rapport F), permet d’analyser plusieurs groupes de données afin de déterminer la variabilité entre les échantillons et au sein des échantillons.

Si aucune différence réelle n’existe entre les groupes testés, ce que l’on appelle l’hypothèse nulle, le résultat de la statistique F-ratio de l’ANOVA sera proche de 1. Les fluctuations de son échantillonnage suivront probablement la distribution F de Fisher. Il s’agit en fait d’un groupe de fonctions de distribution, avec deux nombres caractéristiques, appelés les degrés de liberté du numérateur et les degrés de liberté du dénominateur.

Points clés à retenir

L’analyse de la variance, ou ANOVA, est une méthode statistique qui sépare les données de variance observées en différentes composantes à utiliser pour des tests supplémentaires.
Une ANOVA à sens unique est utilisée pour trois groupes de données ou plus, afin d’obtenir des informations sur la relation entre les variables dépendantes et indépendantes.
Si aucune variance réelle n’existe entre les groupes, le rapport F de l’ANOVA doit être proche de 1.

Exemple d’utilisation de l’ANOVA

Un chercheur pourrait, par exemple, tester des étudiants de plusieurs collèges pour voir si les étudiants de l’un des collèges obtiennent systématiquement de meilleurs résultats que les étudiants des autres collèges. Dans une application commerciale, un chercheur en R&D peut tester deux processus différents de création d’un produit pour voir si l’un des processus est meilleur que l’autre en termes de rentabilité.

Le type de test d’ANOVA utilisé dépend de plusieurs facteurs. Il est appliqué lorsque les données doivent être expérimentales. L’analyse de la variance est employée s’il n’y a pas d’accès à un logiciel statistique permettant de calculer l’ANOVA à la main. Il est simple à utiliser et convient mieux aux petits échantillons. Avec de nombreux plans d’expérience, la taille des échantillons doit être la même pour les différentes combinaisons de niveaux de facteurs.

vous pouvez intéressé: Qu'est-ce que l'argent ?

L’ANOVA est utile pour tester trois variables ou plus. Elle est similaire aux multiples tests t à deux échantillons. Toutefois, elle entraîne moins d’erreurs de type I et convient à toute une série de problèmes. L’ANOVA regroupe les différences en comparant les moyennes de chaque groupe et comprend la répartition de la variance dans diverses sources. Elle est utilisée avec les sujets, les groupes de test, entre les groupes et à l’intérieur des groupes.

ANOVA à sens unique contre ANOVA à double sens

Il existe deux types d’ANOVA : à sens unique (ou unidirectionnelle) et à double sens. L’ANOVA unidirectionnelle ou bidirectionnelle fait référence au nombre de variables indépendantes dans votre test d’analyse de la variance. Une ANOVA unidirectionnelle évalue l’impact d’un seul facteur sur une seule variable de réponse. Elle détermine si tous les échantillons sont identiques. L’ANOVA à sens unique est utilisée pour déterminer s’il existe des différences statistiquement significatives entre les moyennes de trois groupes indépendants (non liés) ou plus.

Une ANOVA bidirectionnelle est une extension de l’ANOVA unidirectionnelle. Avec une ANOVA à sens unique, vous avez une variable indépendante qui affecte une variable dépendante. Avec une ANOVA bidirectionnelle, il y a deux variables indépendantes. Par exemple, une ANOVA bidirectionnelle permet à une entreprise de comparer la productivité des travailleurs sur la base de deux variables indépendantes, telles que le salaire et les compétences. Elle est utilisée pour observer l’interaction entre les deux facteurs et tester l’effet de deux facteurs en même temps.