Des articles

1.6.9.1.2 : Décrire... - Mathématiques


Tout d'abord, regardez les caractéristiques de base de chaque personnage :

Code (PageIndex{1}) (R) :

Étant donné que le SEXE et la COULEUR sont catégoriels, la sortie dans ces colonnes n'a aucun sens, mais vous souhaiterez peut-être convertir ces colonnes en « vraies » données catégorielles. Les possibilités sont multiples mais la plus simple est la conversion en facteur:

Code (PageIndex{2}) (R) :

(Pour conserver les données d'origine, nous les avons d'abord copiées dans de nouvelles données d'objet1. Veuillez les vérifier maintenant avec summary() vous-même.)

La commande summary() s'applique non seulement à l'ensemble du bloc de données, mais également à des caractères (ou variables, ou colonnes) individuels :

Code (PageIndex{3}) (R) :

Il est possible de calculer les caractéristiques à partir de summary() une par une. Maximum et minimum :

Code (PageIndex{4}) (R) :

... médiane :

Code (PageIndex{5}) (R) :

... signifie pour le POIDS et pour chaque caractère :

Code (PageIndex{6}) (R) :

et

Code (PageIndex{7}) (R) :

... et aussi arrondir le résultat à une décimale :

Code (PageIndex{8}) (R) :

(Encore une fois, la sortie de colMeans() n'a aucun sens pour le SEXE et la COULEUR.)

Malheureusement, les commandes ci-dessus (mais pas summary()) ne fonctionnent pas si les données ont des valeurs manquantes (NA) :

Code (PageIndex{9}) (R) :

Pour calculer la moyenne sans remarquer les données manquantes, entrez

Code (PageIndex{10}) (R) :

Une autre méthode consiste à supprimer les lignes avec NA des données avec :

Code (PageIndex{11}) (R) :

Ensuite, data2.o sera exempt de valeurs manquantes.

Parfois, vous devez calculer la somme de toutes les valeurs de caractère :

Code (PageIndex{12}) (R) :

... ou la somme de toutes les valeurs d'une ligne (nous allons essayer la deuxième ligne) :

Code (PageIndex{13}) (R) :

... ou la somme de toutes les valeurs pour tous ligne:

Code (PageIndex{14}) (R) :

(Ces exercices de synthèse sont ici à des fins de formation uniquement.)

Pour les données catégorielles, il est judicieux de regarder combien de fois chaque valeur apparaît dans le fichier de données (et cela permet également de connaître toutes les valeurs du caractère) :

Code (PageIndex{15}) (R) :

Transformez maintenant les fréquences en pourcentages (100 % est le nombre total de bugs) :

Code (PageIndex{16}) (R) :

L'une des caractéristiques les plus importantes de la variabilité des données est la écart-type:

Code (PageIndex{17}) (R) :

Calculez l'écart type pour chaque colonne numérique (colonnes 3 et 4) :

Code (PageIndex{18}) (R) :

Si vous voulez faire la même chose pour les données avec une valeur manquante, vous avez besoin de quelque chose comme :

Code (PageIndex{19}) (R) :

Calculez aussi le coefficient de variation (CV):

Code (PageIndex{20}) (R) :

Nous pouvons calculer n'importe quelle caractéristique séparément pour les hommes et les femmes. Moyens pour les poids des insectes :

Code (PageIndex{21}) (R) :

Combien y a-t-il d'individus de chaque couleur parmi les mâles et les femelles ?

Code (PageIndex{22}) (R) :

(Les lignes sont des couleurs, les colonnes sont des hommes et des femmes.)

Maintenant la même chose en pourcentage :

Code (PageIndex{23}) (R) :

Enfin, calculez les valeurs moyennes de poids séparément pour chaque combinaison de couleur et de sexe (c'est-à-dire pour les mâles rouges, les femelles rouges, les mâles verts, les femelles vertes, etc.) :

Code (PageIndex{24}) (R) :


Voir la vidéo: Kolme tapaa onnistua digitaalisessa matematiikan kokeessa (Décembre 2021).