Résultat

Partie I : Traitement des données brutes

Le traitement brute des données montrent un certain nombre de donnée manquante chez l’homme (22 valeurs) et chez la femme (30 valeurs). Dans les deux cas, ce sont les données issus du temps passé en position assise et du temps d’activité de marche. L’imputation de ces valeurs manquantes par les proches voisins permet de conserver la totalité des observations soit 146 individus de sexe masculin et de sexe féminin. La distribution des données est testé par un test de Shapiro-Wilk permet de montrer que dans les deux sexes, seul le score de fertilité à une distribution normal, même si il est à noté que le temps assis semblent suivre une tendance dans la normalité de sa distribution.

Partie II : Analyse des données brutes

La distribution en dehors de la normalité pour nos valeurs d’activité physique, rend l’interprêtation des tests délicat. Pour les activité physique, seul l’activité de marche chez la femme se montrent significatif entre les individus fertiles et infertiles. Cependant, les scores de corrélation montrent tout de même une forte corrélation entre chaque équivalent d’activité physique pour les deux sexe. Le score de fertilité est confirmé comme une variable bien disctinfitf entre les deux groupes de fertilité. Il se montre particulièrement corrélé, notamment au niveau de l’activité physique intense. Cette variable est également corrélé à l’activité total, qui se trouve, au vu des corrélations, être une variable central de l’activité physique. Le score de fertilité pourrait donc constitué un pont entre une variable, ici d’activité physique, et une conséquence physiologique, ici la fertilité. Pour analyser ce lien, nous avons observer le regroupement de ces données via deux méthodes d’analyse statistique.

Partie III : Réalisation de l’Analyse factorielle

Les données chez la femme s’apprêtent plus à une interprêtation en PCA que les données issu des individus masculin. Seulement, dans les 2 cas, le score KMO en moyenne inférieur à 0,5 ne permet pas de conclure efficacement sur la situation. Chez l’homme, la distribution des axes est assez hétérogène même si les deux premiers axes représentent plus de la moitiers des différences entre les individus. Là ou chez la femme, la distribution se répartir sur l’axe 1 et 2 mais tout aussi bien sur l’axe 3. Le score est fertilité bien observé sur l’axe 3 chez l’homme et sur l’axe 2 chez la femme, le confirme comme une variable permettant de regroupé les individus fertile et infertile. Il semblerait qu’on observe dans les 2 cas, un regroupement des individus à forte activité physique avec les individus possédant un score de fertilité élevé. Mais les résultats sont très hétérogène et par conséquent non concluant. L’analyse en bootstrap chez la femme permet de montrer une normalité améliorer pour l’activité de marche (p = 0,106), l’activité total (p= 0,283) et le temps assis (p= 0,601). La comparaison de moyenne issus de se bootstrap montrent une différence de moyenne significatif entre le groupe fertile et infertile pour l’activité physique intense et le temps assis. Cette analyse en boostrap n’a pas été concluante chez l’homme. De plus, la régression logisitique pour les individus féminin confirme l’activité de marche comme étant une variable significativement influente dans l’augmentartion des chances de fertilité. Le score quant a lui est bien corrélé de manière significative avec l’activité physique intense et total. Concernant les indvidius masculin, les régression obtenue suite à l’analyse en bootstrap, offrent des p-value largement interprétable mais la fiabilité de ces interprétation est remis en cause par une incohérence issus de la variable d’activité totale. En se retrouvent d’une influence négative sur la fertilité alors qu’elle est issus des activités physique modéré et intense qui ressortent positif pour cette même fertilité. La même observation est obtenu pour la régression linéaire.

Partie IV : Classification des données

Chez l’homme comme chez la femme, le score de Hopkins permet de valider la construction d’une analyse en clustering. Pour chacun des sexes, le découpage se fera en 3 groupes, comme recommandé par l’extension JLutils. On peut observer trois groupes répartie de manière homogène et non chevauchant ce qui montre une première qualité dans l’analyse. Dans une première observation, le cluster 2 semblent supérieur dans le score de fertilité par rapport au groupe 1 et 3 qui possède la même moyenne. L’indépendance des clusters est observé pour vérifier si ses clusters dépendant certe, du score de fertilité, puisque celui-ci est bien lié à la fertilité, mais également des l’activités physique. Dans les deux sexes, le score de fertilité et le temps assis présentent une distrivution normal, d’ou leur comparaison par ANOVA, à noter que chez l”homme, le score de sportivité est également en distribution normal. Le reste des variables est comparés par un test de Kruskall-Wallis. Toujours dans les deux sexes, le cluster 2 présente un score significativement plus élevé par rapport au deux autres groupes qui présente la même homogénités de valeur scorique. Sur le score de sportivité, il est significativement plus important pour le groupe 3. Intriséquement, il possède des valeurs plus important pour l’activité de marchet et l’activité physique modérée (observé chez les deux sexes). Le groupe 2, lui, dispose d’une activité physique intense plus élevé mais qui ne suffit pas, dans la mesure de l’activité physique totale, à rattraper le groupe 3, plaçant se derniers comme un groupe à forte activité physique. La projection de ses groupes sur la fertilité montre une ratio d’individus fertile élevé dans le groupe 2. Le groupe 1 qui possède un score de fertilité et de sportivité diminué montre, à l’inverse du groupe 2, un fort ratio d’individus infertile. Pour le groupe 3, il montre une ratio plus équilibré voir quasi équilibré chez la femme. Cette observation montrent qu’il est plus difficile se catégorisé le groupe 3, surement d’ou à une ambiguité sur les valeurs scorique, d’activité physique et de fertilité.