Définition de la somme des carrés

Qu’est-ce que la somme des carrés ?

La somme des carrés est une technique statistique utilisée dans l’analyse de régression pour déterminer la dispersion des points de données. Dans une analyse de régression, l’objectif est de déterminer dans quelle mesure une série de données peut être ajustée à une fonction qui pourrait aider à expliquer comment la série de données a été générée. La somme des carrés est utilisée comme un moyen mathématique de trouver la fonction qui s’adapte le mieux (varie le moins) aux données.

La formule de la somme des carrés est

Pour un ensemble X de n éléments : Somme des carrés= =0n(Xi-X‾)2 où : Xi=Leième élément

de l’

ensemble∑iX‾=Lamoyenne de tous les éléments

de l’ensemble

(Xi-X‾)=L

écart de chaque élément par rapport à la moyennebegin{aligned}&text{For a set } X text{ of } n text{ items:} &text{Sum of squares}=sum_{i=0}^{n}left(X_i-overline{X}right)^2 &textbf{where :

}

&X_i=text{The } i^{th} text{ item in the set} &overline{X}=text{The mean of all items in the set} &left(X_i-overline{X}right) = text{The deviation of each item from the mean} end{aligned}

Pour un ensemble X de n items : Somme des carrés=i=0 n(XiX)2 où : Xi=Leie élémentde l’ensemble X=Lamoyenne de tous les éléments de l’ensemble (XiX)=Lécart de chaque élément par rapport à la moyenne

La somme des carrés est également appelée variation.

Que vous dit la somme des carrés ?

La somme des carrés est une mesure de l’écart par rapport à la moyenne. En statistique, la moyenne est la moyenne d’un ensemble de chiffres et est la mesure de la tendance centrale la plus couramment utilisée. La moyenne arithmétique est simplement calculée en additionnant les valeurs de l’ensemble de données et en les divisant par le nombre de valeurs.

Disons que les cours de clôture de Microsoft (MSFT) au cours des cinq derniers jours étaient de 74,01, 74,77, 73,94, 73,61 et 73,40 en dollars américains. La somme des prix totaux est de 369,73 dollars et le prix moyen ou moyen du manuel serait donc de 369,73 dollars / 5 = 73,95 dollars.

Mais il ne suffit pas toujours de connaître la moyenne d’un ensemble de mesures. Parfois, il est utile de connaître le degré de variation d’un ensemble de mesures. L’écart entre les valeurs individuelles et la moyenne peut donner une idée de la manière dont les observations ou les valeurs correspondent au modèle de régression créé.

vous pouvez intéressé:  Définition des produits dérivés

Par exemple, si un analyste veut savoir si le prix de l’action MSFT évolue en tandem avec le prix de l’action Apple (AAPL), il peut dresser la liste des observations relatives au processus des deux stocks pour une certaine période, disons 1, 2 ou 10 ans et créer un modèle linéaire avec chacune des observations ou mesures enregistrées. Si la relation entre les deux variables (c’est-à-dire le prix de l’AAPL et le prix de la MSFT) n’est pas une ligne droite, il y a alors des variations dans l’ensemble de données qui doivent être examinées.

En statistique, si la ligne du modèle linéaire créé ne passe pas par toutes les mesures de valeur, alors une partie de la variabilité observée dans les prix des actions est inexpliquée. La somme des carrés est utilisée pour calculer si une relation linéaire existe entre deux variables, et toute variabilité inexpliquée est appelée somme résiduelle des carrés.

La somme des carrés est la somme du carré de variation, où la variation est définie comme l’écart entre chaque valeur individuelle et la moyenne. Pour déterminer la somme des carrés, la distance entre chaque point de données et la ligne du meilleur ajustement est élevée au carré, puis additionnée. La ligne de meilleur ajustement minimisera cette valeur.

Comment calculer la somme des carrés

Vous pouvez maintenant comprendre pourquoi la mesure est appelée la somme des carrés des écarts, ou la somme des carrés pour faire court. En utilisant notre exemple de MSFT ci-dessus, la somme des carrés peut être calculée comme suit :

  • SS = (74,01 – 73,95)2 + (74,77 – 73,95)2 + (73,94 – 73,95)2 + (73,61 – 73,95)2 + (73,40 – 73,95)2
  • SS = (0,06) 2 + (0,82) 2 + (-0,01)2 + (-0,34) 2 + (-0,55)2
  • SS = 1,0942

L’addition de la somme des seuls écarts sans quadrature donnera un nombre égal ou proche de zéro puisque les écarts négatifs compenseront presque parfaitement les écarts positifs. Pour obtenir un nombre plus réaliste, la somme des écarts doit être élevée au carré. La somme des carrés sera toujours un nombre positif car le carré de tout nombre, qu’il soit positif ou négatif, est toujours positif.

Exemple d’utilisation de la somme des carrés

Sur la base des résultats du calcul de l’EMSF, une somme élevée de carrés indique que la plupart des valeurs sont plus éloignées de la moyenne, et donc qu’il existe une grande variabilité des données. Une faible somme de carrés indique une faible variabilité dans l’ensemble des observations.

vous pouvez intéressé:  Quel est le meilleur score FICO réalisable ?

Dans l’exemple ci-dessus, 1,0942 montre que la variabilité du cours de l’action MSFT au cours des cinq derniers jours est très faible et que les investisseurs qui cherchent à investir dans des actions caractérisées par la stabilité des prix et une faible volatilité peuvent opter pour MSFT.

Points clés à retenir

  • La somme des carrés mesure l’écart des points de données par rapport à la valeur moyenne.
  • Une somme des carrés plus élevée indique un degré élevé de variabilité au sein de l’ensemble de données, tandis qu’un résultat plus faible indique que les données ne varient pas considérablement par rapport à la valeur moyenne.

Limites de l’utilisation de la somme des carrés

Prendre une décision d’investissement sur les actions à acheter nécessite beaucoup plus d’observations que celles qui sont énumérées ici. Un analyste peut avoir à travailler avec des années de données pour savoir avec une plus grande certitude à quel point la variabilité d’un actif est élevée ou faible. À mesure que l’on ajoute des points de données à l’ensemble, la somme des carrés devient plus importante car les valeurs sont plus étalées.

Les mesures de variation les plus utilisées sont l’écart-type et la variance. Toutefois, pour calculer l’une ou l’autre de ces deux mesures, il faut d’abord calculer la somme des carrés. La variance est la moyenne de la somme des carrés (c’est-à-dire la somme des carrés divisée par le nombre d’observations). L’écart-type est la racine carrée de la variance.

Il existe deux méthodes d’analyse de régression qui utilisent la somme des carrés : la méthode des moindres carrés linéaires et la méthode des moindres carrés non linéaires. La méthode des moindres carrés fait référence au fait que la fonction de régression minimise la somme des carrés de la variance par rapport aux points de données réels. De cette façon, il est possible de dessiner une fonction qui, statistiquement, fournit le meilleur ajustement pour les données. Notez qu’une fonction de régression peut être linéaire (une ligne droite) ou non linéaire (une ligne courbe).

Retour haut de page