Untitled

Technique des K proche voisin

La technique des K plus proches voisins consiste à remplacer les valeurs manquantes par observation des “voisin”. On attribue donc la valeur la plus probable en mesurant la proximité des observations. Pour ça, on choisi une valeur de K de 7. En effet, au vu d’une nombre faible de donnée, un K trop élevé peut inclure des voisins trop éloigné et diluer la précision de la prédiction. Le choix de 7 est réalisé après une validation croisés. Une fois les proches voisins trouvé par mesure d’une distance euclidienne, la moyenne pondéré est attribuée à la valeur manquante.

2+2

[1] 4