Comment calculer la somme des carrés pour l'erreur (SSE)?
Pour calculer la somme des carrés pour l'erreur, commencez par trouver la moyenne de l'ensemble de données en additionnant toutes les valeurs et en divisant par le nombre total de valeurs. Ensuite, soustrayez la moyenne de chaque valeur pour trouver l'écart pour chaque valeur. Ensuite, carré l'écart pour chaque valeur. Enfin, additionnez tous les écarts au carré pour obtenir la somme des carrés de l'erreur. Pour apprendre à calculer la somme des carrés des erreurs à l'aide de Microsoft Excel, faites défiler vers le bas!
La somme des erreurs au carré, ou SSE, est un calcul statistique préliminaire qui conduit à d'autres valeurs de données. Lorsque vous disposez d'un ensemble de valeurs de données, il est utile de pouvoir déterminer à quel point ces valeurs sont étroitement liées. Vous devez organiser vos données dans un tableau, puis effectuer des calculs assez simples. Une fois que vous avez trouvé l'ESS pour un ensemble de données, vous pouvez ensuite rechercher la variance et l'écart type.
Méthode 1 sur 3: calcul de l'ESS à la main
- 1Créez un tableau à trois colonnes. Le moyen le plus clair de calculer la somme des erreurs au carré est de commencer par un tableau à trois colonnes. Étiquetez les trois colonnes comme Value{\displaystyle {\text{Value}}} , Deviation{\displaystyle {\text{Deviation}}} et Deviation2{\displaystyle {\text{Deviation}}^{2}} .
- 2Remplissez les données. La première colonne contiendra les valeurs de vos mesures. Remplissez la colonne Value{\displaystyle {\text{Value}}} avec les valeurs de vos mesures. Il peut s'agir des résultats d'une expérience, d'une étude statistique ou simplement de données fournies pour un problème mathématique.
- Dans ce cas, supposons que vous travaillez avec des données médicales et que vous ayez une liste des températures corporelles de dix patients. La température corporelle normale attendue est de 98,6 degrés. Les températures de dix patients sont mesurées et donnent les valeurs 99,0, 98,6, 98,5, 101,1, 98,3, 98,6, 97,9, 98,4, 99,2 et 99, 1. Écrivez ces valeurs dans la première colonne.
- 3Calculer la moyenne. Avant de pouvoir calculer l'erreur pour chaque mesure, vous devez calculer la moyenne de l'ensemble de données complet.
- Rappelez-vous que la moyenne de tout ensemble de données est la somme des valeurs, divisée par le nombre de valeurs dans l'ensemble. Cela peut être représenté symboliquement, avec la variable μ{\displaystyle \mu } représentant la moyenne, comme:
- μ=Σxn{\displaystyle \mu ={\frac {\Sigma x}{n}}}
- Pour ces données, la moyenne est calculée comme suit:
- μ=99,0+98,6+98,5+101,1+98,3+98,6+97,9+98,4+99,2+99,110{\displaystyle \mu ={\frac {99,0+98,6+98,5+101,1+98,3+98,6+97,9+98,4+99,2+99,1}{10}}}
- μ=988.710{\displaystyle \mu ={\frac {988.7}{10}}}
- μ=98,87{\displaystyle \mu =98,87}
- Rappelez-vous que la moyenne de tout ensemble de données est la somme des valeurs, divisée par le nombre de valeurs dans l'ensemble. Cela peut être représenté symboliquement, avec la variable μ{\displaystyle \mu } représentant la moyenne, comme:
- 4Calculer les mesures d'erreur individuelles. Dans la deuxième colonne de votre tableau, vous devez remplir les mesures d'erreur pour chaque valeur de données. L'erreur est la différence entre la mesure et la moyenne.
- Pour l'ensemble de données donné, soustrayez la moyenne, 98,87, de chaque valeur mesurée, et remplissez la deuxième colonne avec les résultats. Ces dix calculs sont les suivants:
- 99,0−98,87=0,13{\displaystyle 99,0-98,87=0,13}
- 98,6−98,87=−0,27{\displaystyle 98,6-98,87=-0,27}
- 98,5−98,87=−0,37{\displaystyle 98,5-98,87=-0,37}
- 101,1−98,87=2,23{\style d'affichage 101,1-98,87=2,23}
- 98,3−98,87=−0,57{\displaystyle 98,3-98,87=-0,57}
- 98,6−98,87=−0,27{\displaystyle 98,6-98,87=-0,27}
- 97,9−98,87=−0,97{\displaystyle 97,9-98,87=-0,97}
- 98,4−98,87=−0,47{\displaystyle 98,4-98,87=-0,47}
- 99,2−98,87=0,33{\style d'affichage 99,2-98,87=0,33}
- 99,1−98,87=0,23{\style d'affichage 99,1-98,87=0,23}
- Pour l'ensemble de données donné, soustrayez la moyenne, 98,87, de chaque valeur mesurée, et remplissez la deuxième colonne avec les résultats. Ces dix calculs sont les suivants:
- 5Calculer les carrés des erreurs. Dans la troisième colonne du tableau, trouvez le carré de chacune des valeurs résultantes dans la colonne du milieu. Ceux-ci représentent les carrés de l'écart par rapport à la moyenne pour chaque valeur mesurée des données.
- Pour chaque valeur de la colonne du milieu, utilise ta calculatrice et trouve le carré. Enregistrez les résultats dans la troisième colonne, comme suit:
- 0,132=0,0169{\displaystyle 0,13^{2}=0,0169}
- (−0,27)2=0,0729{\style d'affichage (-0,27)^{2}=0,0729}
- (−0,37)2=0,1369{\style d'affichage (-0,37)^{2}=0,1369}
- 2 232=4 9729{\displaystyle 2,23^{2}=4 9729}
- (−0,57)2=0,3249{\style d'affichage (-0,57)^{2}=0,3249}
- (−0,27)2=0,0729{\style d'affichage (-0,27)^{2}=0,0729}
- (−0,97)2=0,9409{\style d'affichage (-0,97)^{2}=0,9409}
- (−0,47)2=0,2209{\style d'affichage (-0,47)^{2}=0,2209}
- 0,332=0,1089{\displaystyle 0,33^{2}=0,1089}
- 0,232=0,0529{\displaystyle 0,23^{2}=0,0529}
- Pour chaque valeur de la colonne du milieu, utilise ta calculatrice et trouve le carré. Enregistrez les résultats dans la troisième colonne, comme suit:
- 6Additionnez les carrés d'erreurs. La dernière étape consiste à trouver la somme des valeurs de la troisième colonne. Le résultat souhaité est le SSE, ou la somme des erreurs au carré.
- Pour cet ensemble de données, le SSE est calculé en additionnant les dix valeurs de la troisième colonne:
- SSE=6 921{\displaystyle SSE=6 921}
Méthode 2 sur 3: créer une feuille de calcul Excel pour calculer sse
- 1Étiquetez les colonnes de la feuille de calcul. Vous allez créer un tableau à trois colonnes dans Excel, avec les trois mêmes en-têtes que ci-dessus.
- Dans la cellule A1, tapez l'en-tête «Valeur».
- Dans la cellule B1, entrez l'en-tête «Déviation».
- Dans la cellule C1, entrez l'en-tête «Déviation au carré».
- 2Entrez vos données. Dans la première colonne, vous devez saisir les valeurs de vos mesures. Si l'ensemble est petit, vous pouvez simplement les saisir à la main. Si vous disposez d'un ensemble de données volumineux, vous devrez peut-être copier et coller les données dans la colonne.
- 3Trouvez la moyenne des points de données. Excel a une fonction qui calculera la moyenne pour vous. Dans une cellule vide sous votre table de données (peu importe la cellule que vous choisissez), entrez ce qui suit:
- =Moyenne(A2:__)
- Ne tapez pas réellement un espace vide. Remplissez ce vide avec le nom de la cellule de votre dernier point de données. Par exemple, si vous avez 100 points de données, vous utiliserez la fonction:
- =Moyenne(A2:A101)
- Cette fonction inclut les données de A2 à A101 car la ligne supérieure contient les en-têtes des colonnes.
- Lorsque vous appuyez sur Entrée ou lorsque vous cliquez sur n'importe quelle autre cellule du tableau, la moyenne de vos valeurs de données remplira automatiquement la cellule que vous venez de programmer.
- 4Entrez la fonction pour les mesures d'erreur. Dans la première cellule vide de la colonne «Déviation», vous devez entrer une fonction pour calculer la différence entre chaque point de données et la moyenne. Pour ce faire, vous devez utiliser le nom de la cellule où réside la moyenne. Supposons pour l'instant que vous ayez utilisé la cellule A104.
- La fonction pour le calcul de l'erreur, que vous entrez dans la cellule B2, sera:
- =A2-$A78€ Les signes dollar sont nécessaires pour s'assurer que vous verrouillez la cellule A104 pour chaque calcul.
- La fonction pour le calcul de l'erreur, que vous entrez dans la cellule B2, sera:
- 5Entrez la fonction pour les carrés d'erreur. Dans la troisième colonne, vous pouvez demander à Excel de calculer le carré dont vous avez besoin.
- Dans la cellule C2, entrez la fonction
- =B2^2
- Dans la cellule C2, entrez la fonction
- 6Copiez les fonctions pour remplir tout le tableau. Après avoir entré les fonctions dans la cellule supérieure de chaque colonne, respectivement B2 et C2, vous devez remplir le tableau complet. Vous pouvez retaper la fonction dans chaque ligne du tableau, mais cela prendrait beaucoup trop de temps. Utilisez votre souris, mettez en surbrillance les cellules B2 et C2 ensemble, et sans lâcher le bouton de la souris, faites glisser vers la cellule inférieure de chaque colonne.
- Si nous supposons que vous avez 100 points de données dans votre tableau, vous faites glisser votre souris vers les cellules B101 et C101.
- Lorsque vous relâchez ensuite le bouton de la souris, les formules seront copiées dans toutes les cellules du tableau. Le tableau doit être automatiquement rempli avec les valeurs calculées.
- 7Trouvez l'ESS. La colonne C de votre tableau contient toutes les valeurs d'erreur carrée. La dernière étape consiste à demander à Excel de calculer la somme de ces valeurs.
- Dans une cellule sous le tableau, probablement C102 pour cet exemple, entrez la fonction:
- =Somme(C2:C101)
- Lorsque vous cliquez sur Entrée ou cliquez sur n'importe quelle autre cellule du tableau, vous devriez avoir la valeur SSE pour vos données.
- Dans une cellule sous le tableau, probablement C102 pour cet exemple, entrez la fonction:
Méthode 3 sur 3: relier l'ESS à d'autres données statistiques
- 1Calculer la variance de l'ESS. Trouver le SSE pour un ensemble de données est généralement un élément constitutif pour trouver d'autres valeurs plus utiles. Le premier d'entre eux est la variance. La variance est une mesure qui indique de combien les données mesurées varient par rapport à la moyenne. Il s'agit en fait de la moyenne des différences au carré par rapport à la moyenne.
- Parce que le SSE est la somme des erreurs au carré, vous pouvez trouver la moyenne (qui est la variance), simplement en divisant par le nombre de valeurs. Cependant, si vous calculez la variance d'un ensemble d'échantillons plutôt que d'une population complète, vous diviserez par (n-1) au lieu de n. Ainsi:
- Variance = SSE/n, si vous calculez la variance d'une population complète.
- Variance = SSE/(n-1), si vous calculez la variance d'un échantillon de données.
- Pour le problème d'échantillon des températures des patients, nous pouvons supposer que 10 patients ne représentent qu'un ensemble d'échantillons. Par conséquent, l'écart serait calculé comme suit:
- Variance=SSE(n−1){\displaystyle {\text{Variance}}={\frac {\text{SSE}}{(n-1)}}}
- Variance=6 9219{\displaystyle {\text{Variance}}={\frac {6 921}{9}}}
- Variance=0,769{\displaystyle {\text{Variance}}=0,769}
- Parce que le SSE est la somme des erreurs au carré, vous pouvez trouver la moyenne (qui est la variance), simplement en divisant par le nombre de valeurs. Cependant, si vous calculez la variance d'un ensemble d'échantillons plutôt que d'une population complète, vous diviserez par (n-1) au lieu de n. Ainsi:
- 2Calculer l'écart type de SSE. L'écart type est une valeur couramment utilisée qui indique de combien les valeurs de tout ensemble de données s'écartent de la moyenne. L'écart type est la racine carrée de la variance. Rappelons que la variance est la moyenne des mesures d'erreur quadratique.
- Par conséquent, après avoir calculé le SSE, vous pouvez trouver l'écart type comme suit:
- Ecart type =SSEn−1{\displaystyle {\text{ Ecart type }}={\sqrt {\frac {\text{SSE}}{n-1}}}}
- Pour l'échantillon de données des mesures de température, vous pouvez trouver l'écart type comme suit:
- Ecart type=SSEn−1{\displaystyle {\text{ Ecart type }}={\sqrt {\frac {\text{SSE}}{n-1}}}}
- Écart-type=6 9219{\displaystyle {\text{Écart-type}}={\sqrt {\frac {\text{6 921}}{9}}}}
- Écart-type= 0,769{\displaystyle {\text{ Écart-type }}={\sqrt { 0,769}}}
- Ecart type=0,877{\displaystyle {\text{Ecart type}}=0,877}
- Par conséquent, après avoir calculé le SSE, vous pouvez trouver l'écart type comme suit:
- 3Utilisez SSE pour mesurer la covariance. Cet article s'est concentré sur les ensembles de données qui ne mesurent qu'une seule valeur à la fois. Cependant, dans de nombreuses études, vous pouvez comparer deux valeurs distinctes. Vous voudriez savoir comment ces deux valeurs sont liées l'une à l'autre, pas seulement à la moyenne de l'ensemble de données. Cette valeur est la covariance.
- Les calculs de covariance sont trop compliqués pour être détaillés ici, sauf pour noter que vous utiliserez le SSE pour chaque type de données, puis les comparerez. Pour une description plus détaillée de la covariance et des calculs impliqués, voir Calculer la covariance.
- À titre d'exemple d'utilisation de la covariance, vous pouvez comparer l'âge des patients d'une étude médicale à l'efficacité d'un médicament pour abaisser la température de la fièvre. Ensuite, vous auriez un ensemble de données d'âges et un deuxième ensemble de données de températures. Vous trouverez le SSE pour chaque ensemble de données, puis à partir de là, vous trouverez la variance, les écarts types et la covariance.