Comment calculer le coefficient de corrélation de rang de Spearman?

Pour calculer le coefficient de corrélation de rang de Spearman
Pour calculer le coefficient de corrélation de rang de Spearman, vous devrez classer et comparer les ensembles de données pour trouver Σd2, puis insérer cette valeur dans la version standard ou simplifiée de la formule du coefficient de corrélation de rang de Spearman.

Le coefficient de corrélation de rang de Spearman vous permet d'identifier si deux variables sont liées dans une fonction monotone (c'est-à-dire que lorsqu'un nombre augmente, l'autre augmente également, ou vice versa). Pour calculer le coefficient de corrélation de rang de Spearman, vous devrez classer et comparer les ensembles de données pour trouver Σd 2, puis insérer cette valeur dans la version standard ou simplifiée de la formule du coefficient de corrélation de rang de Spearman. Vous pouvez également calculer ce coefficient à l'aide de formules Excel ou de commandes R.

Méthode 1 sur 3: à la main

  1. 1
    Dessinez votre tableau de données. Cela organisera les informations dont vous avez besoin pour calculer le coefficient de corrélation de rang de Spearman. Tu auras besoin de:
    • 6 colonnes, avec en-têtes comme indiqué ci-dessous.
    • Autant de lignes que vous avez de paires de données.
  2. 2
    Remplissez les deux premières colonnes avec vos paires de données.
  3. 3
    Dans votre troisième colonne, classez les données de votre première colonne de 1 à n (le nombre de données dont vous disposez). Donnez au nombre le plus bas un rang de 1, au nombre le plus bas suivant un rang de 2, et ainsi de suite.
  4. 4
    Dans votre quatrième colonne, faites la même chose qu'à l'étape 3, mais classez plutôt la deuxième colonne.
    • Si deux éléments de données (ou plus) dans une colonne sont identiques, recherchez la moyenne des classements comme si ces éléments de données avaient été classés normalement, puis classez les données avec cette moyenne.
      Dans l'exemple de droite, il y a deux 5 qui auraient autrement les rangs 2 et 3. Puisqu'il y a deux 5, prenez la moyenne de leurs rangs. La moyenne de 2 et 3 est 2,5, alors attribuez le rang 2,5 aux deux 5.
  5. 5
    Dans la colonne "d", calculez la différence entre les deux nombres dans chaque paire de rangs. Autrement dit, si l'un est classé 1 et l'autre 3, la différence serait de 2. (Le signe n'a pas d'importance, puisque l'étape suivante consiste à mettre ce nombre au carré.)
  6. 6
    Carré chacun des nombres dans la colonne «d» et écrivez ces valeurs dans la colonne «d 2».
  7. 7
    Additionnez toutes les données de la colonne "d 2 ". Cette valeur est σd 2.
  8. 8
    Choisissez l'une de ces formules:
    • S'il n'y avait pas d'égalité dans les étapes précédentes, insérez cette valeur dans la formule simplifiée du coefficient de corrélation de rang de Spearman

      et remplacez le "n" par le nombre de paires de données dont vous disposez pour calculer la réponse.
    • S'il y avait des égalités dans l'une des étapes précédentes, utilisez plutôt la formule standard du coefficient de corrélation de rang de Spearman:
  9. 9
    Interprétez votre résultat. Il peut varier entre -1 et 1.
    • Près de -1 - Corrélation négative.
    • Proche de 0 - Pas de corrélation linéaire.
    • Près de 1 - Corrélation positive.

Méthode 2 sur 3: dans Excel

  1. 1
    Créez de nouvelles colonnes avec les rangs de vos colonnes existantes. Par exemple, si vos données se trouvent dans la colonne A2:A11, vous souhaitez utiliser la formule "= RANK(A2,A1,50€:A8,20€)", et la copier de haut en bas pour toutes vos lignes et colonnes.
  2. 2
    Rompre les liens comme décrit à l'étape 3, 4 méthode 1.
  3. 3
    Dans une nouvelle cellule, faites une corrélation entre les deux colonnes de classement avec quelque chose comme "=correl(c2:c11,d2:d11)". Dans ce cas, C et D correspondraient aux colonnes de rang. La cellule de corrélation aura votre corrélation de rang de Spearman.
Classez les données de votre première colonne de 1 à n (le nombre de données dont vous disposez)
Dans votre troisième colonne, classez les données de votre première colonne de 1 à n (le nombre de données dont vous disposez).

Méthode 3 sur 3: en utilisant r

  1. 1
    Obtenez R si vous ne l'avez pas déjà. (Voir http://r-project.org.)
  2. 2
    Enregistrez vos données dans un fichier CSV avec les données que vous souhaitez corréler dans les deux premières colonnes. Vous pouvez généralement le faire via le menu "Enregistrer sous".
  3. 3
    Ouvrez l'éditeur R. Si vous êtes sur le terminal, lancez simplement R. Depuis le bureau, vous souhaitez cliquer sur le logo R.
  4. 4
    Tapez les commandes:
    • d <- read.csv("NAME_OF_YOUR_CSV.csv") et appuyez sur Entrée
    • cor(rang(d[,1]),rang(d[,2]))

Conseils

  • La plupart des ensembles de données doivent contenir au moins 5 paires de données afin d'identifier une tendance (3 ont été utilisées pour l'exemple pour le rendre plus facile à démontrer).

Mises en garde

  • Le coefficient de corrélation de rang de Spearman identifiera uniquement la force de corrélation lorsque les données augmentent ou diminuent constamment. S'il s'agit d'un nuage de points des données, toute autre tendance, le rang de Spearman ne donnera pas une représentation précise de sa corrélation.
  • Cette formule est basée sur l'hypothèse qu'il n'y a pas de liens. Lorsqu'il y a des liens comme dans l'exemple, il faut utiliser la définition: le coefficient de corrélation du moment produit basé sur les rangs.

Questions et réponses

  • Existe-t-il une corrélation entre la donnée 1 et la donnée 2?
    Non, il ne devrait pas y avoir de corrélation.
  • Comment trouver des coefficients?
    Le coefficient est à côté de la variable. Avec l'exemple "4pq", le coefficient est 4.
Questions sans réponse
  • Comment puis-je calculer les valeurs critiques supérieures pour cela?
  • Que signifie «liens dans les étapes précédentes»?

En parallèle
  1. Comment calculer les cotes?
  2. Comment trouver le coefficient de corrélation?
  3. Comment calculer les cotes du loto?
  4. Comment calculer les scores Z?
  5. Comment calculer le quartile supérieur?
  6. Comment calculer l'âge moyen?
FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail