156 Shares 9846 views

Critère de Mann-Whitney: exemple, tableau

Le critère de la statistique mathématique est une règle stricte selon laquelle une hypothèse avec un certain niveau de signification est acceptée ou rejetée. Pour le construire, vous devez trouver une fonction spécifique. Cela doit dépendre des résultats finaux de l'expérience, c'est-à-dire des valeurs obtenues empiriquement. C'est cette fonction qui sera un outil pour estimer l'écart entre les échantillons.

Valeur statistiquement significative. Informations générales

La signification statistique est une quantité dont la probabilité d'occurrence accidentelle est très faible. Les indicateurs plus extrêmes sont également significatifs. La différence est appelée statistiquement significative s'il existe des données dont la probabilité d'apparition est négligeable, si l'on affirme que ces écarts n'existent pas. Mais cela ne signifie pas du tout que cette différence doit nécessairement être géniale et significative.

Niveau de fiabilité statistique du test

Ce terme doit être compris comme la probabilité de rejet de l'hypothèse nulle dans le cas de sa vérité. Ceci est également appelé une erreur de premier ordre ou une solution faussement positive. Dans la plupart des cas, le processus repose sur la valeur p ("valeur pi"). C'est la probabilité accumulée lors de l'observation du niveau du critère statistique. À son tour, il est calculé à partir de l'échantillon lors de l'adoption de l'hypothèse nulle. L'hypothèse sera rejetée si cette valeur p est inférieure au niveau déclaré par l'analyste. De cet indicateur dépend directement la signification de la valeur de test: plus il est petit, donc, en conséquence, et plus de raisons de rejeter l'hypothèse. Le niveau de signification, en règle générale, est indiqué par la lettre b (alpha). Les personnalités parmi les spécialistes: 0,1%, 1%, 5% et 10%. Si, disons, on dit que les chances de coïncidence sont de 1 à 1000, alors c'est certainement le niveau de 0,1% de la signification statistique de la variable aléatoire. Différents niveaux de valeur b ont leurs avantages et inconvénients. Si l'indicateur est inférieur, la probabilité est plus grande que l'hypothèse alternative est significative. Bien qu'il existe un risque qu'une hypothèse de faux zéro ne soit pas rejetée. On peut conclure que le choix du niveau b optimal dépend de l'équilibre «importance-puissance» ou, en conséquence, du compromis des probabilités de décisions fausses positives et fausses négatives. Le terme «fiabilité» est synonyme de «signification statistique» dans la littérature russe.

Définition de l'hypothèse nulle

Dans les statistiques mathématiques, cette hypothèse, testée pour la cohérence avec les données empiriques existantes dans le stock. Dans la plupart des cas, comme hypothèse nulle, une hypothèse est faite qu'il n'y a pas de corrélation entre les variables étudiées ou qu'il n'y a pas de différences d'homogénéité dans les distributions étudiées. Dans les études standard, le mathématicien essaie de réfuter l'hypothèse nulle, c'est-à-dire de prouver qu'il n'est pas compatible avec les données obtenues expérimentalement. Et il doit y avoir une hypothèse alternative, qui est prise au lieu de zéro.

Définition clé

Le critère U (Mann-Whitney) dans les statistiques mathématiques permet d'estimer les différences entre les deux échantillons. Ils peuvent être donnés par le niveau d'un certain attribut, qui est mesuré quantitativement. Cette méthode est idéale pour estimer les différences entre les petits échantillons. Ce critère simple a été proposé par Frank Wilcoxon en 1945. Et déjà en 1947, la méthode a été révisée et complétée par les scientifiques H. Mann et DR Whitney, dont les noms sont appelés aujourd'hui. Le critère de Mann-Whitney en psychologie, mathématiques, statistiques et dans de nombreuses autres sciences est l'un des éléments fondamentaux de la justification mathématique des résultats des études théoriques.

Description

Le critère de Mann-Whitney est une méthode relativement simple sans paramètres. Son pouvoir est considérable. Il est nettement supérieur à la puissance du test Q de Rosenbaum. La méthode estime la taille de la zone croisée entre les échantillons, à savoir entre la série de valeurs classées de la première et de la deuxième collection. Plus la valeur du critère est faible, plus grande est la probabilité que l'écart entre les valeurs du paramètre soit fiable. Pour appliquer correctement le critère U (Manna-Whitney), n'oubliez pas certaines limites. Chaque échantillon doit avoir au moins 3 valeurs caractéristiques. Une situation est possible quand il y a deux valeurs dans un cas, mais dans le second cas il doit nécessairement y avoir au moins cinq. Les échantillons échantillonnés devraient avoir un nombre minimum d'indicateurs coïncidents. Tous les nombres doivent être différents dans le cas idéal.

Utiliser

Comment utiliser correctement le test de Mann-Whitney? Le tableau, qui est compilé selon cette méthode, contient certaines valeurs critiques. D'abord, vous devez créer une seule ligne à partir des deux échantillons mappés, qui est alors classé. C'est-à-dire que les éléments sont alignés en fonction du degré d'augmentation du signe, et le rang inférieur est attribué à une valeur plus petite. En conséquence, nous obtenons le nombre total de rangs suivants:

N = N1 + N2,

Lorsque N1 et N2 sont le nombre d'unités contenues dans les premier et deuxième échantillons, respectivement. Ensuite, une seule série classée de valeurs est divisée en deux catégories. Unités, respectivement, du premier et du deuxième échantillons. Maintenant, la somme des rangs des valeurs dans la première et la deuxième lignes est considérée à tour de rôle. Le plus grand d'entre eux (Tx) est déterminé, ce qui correspond à un échantillon avec des unités nx. Pour utiliser davantage la méthode de Wilcoxon, sa valeur est calculée selon la procédure suivante. Il est nécessaire de déterminer la valeur critique de ce critère pour N1 et N2 pris en compte spécifiquement selon le tableau pour le niveau de signification sélectionné. L'indicateur résultant peut être inférieur ou égal à la valeur dans le tableau. Dans ce cas, il existe une différence significative dans les niveaux de trait dans les échantillons étudiés. Si la valeur obtenue est supérieure à la valeur du tableau, l'hypothèse nulle est acceptée. Lorsque le critère de Mann-Whitney est calculé, il convient de noter que si l'hypothèse nulle est valide, le critère aura une attente mathématique, ainsi qu'une variance. Notez que pour des volumes suffisamment importants de données d'échantillons, la méthode est considérée comme distribuée presque normalement. La fiabilité des différences est plus élevée, plus la valeur du critère de Mann-Whitney est faible.